「Transformer」の版間の差分
ナビゲーションに移動
検索に移動
(ページの作成:「Transformer」) |
編集の要約なし |
||
1行目: | 1行目: | ||
== アテンション == | |||
日本語では「注意機構」と呼ばれる。 | |||
クエリ:いま見ているトークンに対して、<math>W_Q</math> をかけてクエリベクトルを得る | |||
キー:系列の各トークンに対して<math>W_K</math> をかけて、どんなクエリの方向を向くかを表現するキーベクトルを得る | |||
クエリベクトルとキーベクトルの内積を、アテンションの重みと考える | |||
バリュー:系列の各トークンに<math>W_V</math>をかけてバリューベクトルとする | |||
アテンションの重みによるバリューベクトルの加重和で「アテンション」を得る |
2025年8月6日 (水) 20:48時点における最新版
アテンション
日本語では「注意機構」と呼ばれる。
クエリ:いま見ているトークンに対して、[math]\displaystyle{ W_Q }[/math] をかけてクエリベクトルを得る
キー:系列の各トークンに対して[math]\displaystyle{ W_K }[/math] をかけて、どんなクエリの方向を向くかを表現するキーベクトルを得る
クエリベクトルとキーベクトルの内積を、アテンションの重みと考える
バリュー:系列の各トークンに[math]\displaystyle{ W_V }[/math]をかけてバリューベクトルとする
アテンションの重みによるバリューベクトルの加重和で「アテンション」を得る