[AI数理]対数関数の微分法・前編

[AI数理]対数関数の微分法・前編

おはようございます!(株) Qualiteg 研究部です。

本日から2回にわたって対数関数について学んでいきましょう。
正確にいうと、対数関数の微分法を学びます。

対数関数って何だっけ?

まず、対数関数というのは、「ある数 \( x \) が別の数 \( b \) を何回かけると \( x \) になるか」を調べる方法です。例えば、\( b \) が 2 で \( x \) が 8 の場合、2 を 3 回かけると 8 になります。この場合、数学的には「\( b \) の \( x \) に対する対数」と言います。

これを数式で表すと、次のようになります:

$$
\log_b(x) = y
$$

ここで \( b \) は底(てい)、\( x \) は真数、\( y \) は \( b \) を何回かけたら \( x \) になるかを表す数です。例えば、\( b = 2 \) と \( x = 8 \) の場合、\( y = 3 \) となります。なぜなら、2 を 3 回かけると 8 になるからです。

$$
\log_2(8) = 3
$$

対数関数は「逆」の関数と考えることもできます。つまり、乗算(かけ算)の逆が除算(わり算)であるように、累乗(たとえば 2 の 3 乗は 8)の逆が対数関数です。

なぜ対数関数は重要か?

まず、「なぜ、対数関数を学ぶ必要があるか」を説明します。

対数関数は、機械学習の分類問題での代表的な損失関数である 交差エントロピー関数の式に登場します。

多値分類用の交差エントロピー関数

$$
\ - \frac{1}{N} \sum_{i}^{N} \sum_{k}^{K} t_{ik} \log y_{ik} \tag{1}
$$

二値分類用の交差エントロピー関数

$$
\ - \frac{1}{N} \sum_{i}^{N} \lbrack t_{i} \log y_{i} + (1- t_{i}) \log (1- y_{i}) \rbrack \tag{2}
$$

ニューラルネットワークの学習では損失関数を最小化するように学習していきますが、損失関数が小さくなる方向(勾配)を求めるため損失関数の微分を求めます。

このように交差エントロピー関数は対数関数を含む関数となっているため、対数関数の微分が必要になります。

本シリーズは、 対数関数の微分法 をマスターすることが目的です。対数関数の微分を理解するために、まず対数関数の基礎をマスターし、それを使って対数関数の微分を学習していきます。

1. 対数関数 \(log\) とは

さて、再度、こんどは数式ベースで対数関数について説明いたしますね。

$$
y = \log_a x
$$

\(a\) を何乗すると \(x\) になるか を求めるのが 対数「 \(\log\) 」です。これを \(a\) を底とする対数関数といいます。

\(y=\log_a x\) のとき \(a^{y} = x\) となります。

また \(y=\log_a x\) は \(y=a^{x}\) の逆関数となります。

\(y=\log_2 x\) で \(x=8\) とすると、 \(y=\log_2 8\) ・・・ \(2\) を何乗すると \(8\) になるかを求めることになるので、答えは \(y=3\) となります。

いかがでしたでしょうか。

思い出してみると(または、今学んでみた感想として)案外とっつきやすやすくないでしょうか。

それでは、また次回お会いしましょう!


navigation

Read more

モデルを「壊さずに」ドメインを広げる ― XLM-RoBERTa 継続学習の設計ノート

モデルを「壊さずに」ドメインを広げる ― XLM-RoBERTa 継続学習の設計ノート

こんにちは、Qualiteg研究部です。 今日は「すでに完成している強いモデルを、壊さずに広げる」という、地味だけど実務でとても大事なテーマを取り上げたいと思います。 機械学習に取り組んでいると、 「一度しっかり仕上げたモデルを、新しい用途やデータに合わせてもう少し広げたい」 そんな場面はよく出てきます。 今回ご紹介するNER(固有表現抽出)のシーンに限らず、いろいろなタスクで共通する悩みではないでしょうか。 ところが、ここで素朴に追加学習をかけると、せっかくの強みがあっさり崩れてしまう。 私たちは、PII(個人特定情報や要配慮情報)を検出・マスキングするエンジン(PII-FI)を構築する際、実際にそれを経験しました。 Precision(適合率)が 0.83 から 0.17 まで転げ落ちる、なんてことも本当に起きるんです。 PII検出では、ドメイン(分野)ごとに検出したいPII型の種類や求められる精度が異なる場合があります。そこで1つのエンジンといっても、対応ドメインを広げていくたびに(そのドメインに適応させるための)追加学習が求められることがあります。 本稿は、そう

By Qualiteg 研究部
Claude Codeで出てくる「court」って何? “XML露出” 現象とツール呼び出し未実行事故の対策

Claude Codeで出てくる「court」って何? “XML露出” 現象とツール呼び出し未実行事故の対策

こんにちは! Qualitegプロダクト開発部です。 Claude Code を使っていると、ツール呼び出しの XML(<invoke> や <parameter>)が画面にそのまま表示されたり、実際にはコマンドや PR 作成が実行されていないのに「完了しました」と報告されたりして、動作がおかしくなることがあります。 そして、その呼び水となる文字列 court や course や count が出現します 本稿では、 この現象(本稿では「XML露出」と呼びます)を実ログから解説し、検知と対策をまとめました。 ● ● ●  claude-code — bash➜ ~/qualiteg-project claude> プロジェクト配下のストレージ使用量を調査します。court<invoke name="Bash">

By Qualiteg プロダクト開発部
AIが攻撃と防御の両方を変える――セキュリティ市場2026と次の10年

AIが攻撃と防御の両方を変える――セキュリティ市場2026と次の10年

ここ数年で、サイバーセキュリティをめぐる議論の前提は大きく変わりました。かつての中心は「いかに侵入を防ぐか」でしたが、いまは攻撃側も防御側も、ともにAIを使い始めています。攻撃が機械の速度で自動化・大規模化する一方、防御も人手だけでは追いつかない領域に入りつつあります。本記事では、公開されている市場データをもとに、AI時代のセキュリティ市場を「どこが伸び、どこが重なり、どこに注意すべきか」という観点から整理します。 「AIとセキュリティ」には三つの市場がある 最初に、用語を整理しておきます。「AIセキュリティ」とひとくくりにすると分かりにくいのですが、実際には少なくとも三つの異なるテーマが同時に進んでいます。 この三つの違いは、「誰がAIを使うのか」と「何を守るのか」で考えると分かりやすくなります。 第一は、防御側がAIを使う「AIで守る」領域です。 攻撃者がAIを使っているかどうかにかかわらず、企業やセキュリティ事業者がAIを利用して、サイバー攻撃やインシデントを検知・分析・阻止します。大量のログやアラートの分析、脅威の優先順位付け、異常の検知、初動対応の支援などは、すでに

By Qualiteg コンサルティング, Qualiteg AIセキュリティチーム
Claude Opus 4.8 完全ガイド — 公式ドキュメントから読み解くモデル仕様とClaude Code運用ポイント

Claude Opus 4.8 完全ガイド — 公式ドキュメントから読み解くモデル仕様とClaude Code運用ポイント

こんにちは! 2026年5月に、AnthropicからClaude Opus 4.8がリリースされました。 そして、2026年6月には Fable5 /Mythos5がリリースされました。 しかし都合により現在(2026/6/18)は利用できないため、実質 Claude Opus 4.8 が一般人がつかえるClaudeシリーズの最上位モデルということになります。 そこで、今回は長く付き合うことになるかもしれない Opus 4.8 について徹底解説したいとおもいます。 Opus4.8は従来の4.7の延長線上にあるアップデートですが、「ベンチマークが少し上がった」では片付けられない変化を含んでいます。 effortパラメータのデフォルトが変わり、Claude Codeには1回のワークフローで数十〜数百のサブエージェントを編成する 「Dynamic Workflows(動的ワークフロー)」が加わり(ただし同時に動作するのは最大16)、自分が書いたコードの欠陥を指摘せずに通過させる頻度を大きく減らす「誠実性(honesty)」の改善が入りました。 つまり、4.7時代に組んだ運用や

By Qualiteg プロダクト開発部