基礎理論 大規模言語モデル入門【Transformer:基礎理論A-4】 FFNと活性化関数:Transformerの知識を蓄える場所前回は、Multi-Head Attentionの詳細なメカニズムを学びました。今回は、Transformerのもう1つの重要な部品であるFeed Forward Network ... 2026.01.22 LLM事前学習基礎理論