Series Expedition

Large Language Models

大規模言語モデルの内部を、埋め込み空間、自己注意、残差ストリーム、次トークン予測の4章で、近未来的な3Dとして探索します。

上級Dawn4 chapters4/4 available

推奨ルート

選んだ順路で、同じ対象の見方を段階的につなぎます。

トークンを意味空間の星雲として3D射影し、king − man + woman ≈ queen のベクトル演算を光跡でたどります。

トークン同士を結ぶ自己注意を光線網として可視化し、softmax(QKᵀ/√d_k) の重みを触って確かめます。

各層が情報を書き込み・読み出しする残差ストリームを、支流が合流する一本の発光する川として描きます。

logitsがsoftmaxを通って確率分布になり、temperatureで尖ったり平らになったりする山の崩壊を観察します。