あなた:
Perplexity は質問に対してネット検索に10秒以上かけることが多いが、chatGTP はすぐに答えることが多い。情報はあらかじめ、パーセプトロンの高次層に組み込み済みだからか?
また、特定のトークン(例えば「オバマ」)に対して、その意味的な文脈(「元大統領」「米国」「2010年代」など)を活性化するニューロン群も確認されています。
質問(プロンプト)を与えると、モデルは内部の知識構造を使って、「最も確からしい次の語」を生成していきます。
例:
Q:「フランスの首都は?」
モデル:「パリです。」
これは、過去に「フランス」「首都」「パリ」という単語が共起した文を大量に見た経験から、統計的に強く結びついたパターンとして答えているだけです。
GPTのようなモデルは、データベースのように知識を格納しているわけではなく、言語的な「型」と「文脈パターン」として知識を表現しています。
🗃️ 記憶:キーワードで引くデータベース
🧠 Transformer:トークン間の関係とパターンとして再現するネットワーク
| 観点 | Transformerでの知識保持 |
|---|---|
| 方法 | 重み行列への統計的埋め込み |
| 形式 | 明示的記憶でなく、分散表現(ベクトル) |
| 強み | 即座の応答、推論能力、あいまいな問いにも対応 |
| 限界 | 最新情報の反映は困難(再学習が必要) |
タイムスタンプは下記。