LLM - News report AI lands

LLM 事前学習：Transformer シリーズ総集編 vol.1

このページでわかることこのページは、大規模言語モデルの「事前学習：Transformer」シリーズ全体の案内ページです。ブログ A 〜 E を 1 ページにまとめ、一目で把握できるように整理しています。何を知りたいときにどのシリーズを見れば...

2026.04.03

シリーズ総集編事前学習

はじめにVision Language Model（VLM）の歴史において、一つの分岐点とも言える論文が存在します。2023年版の「Improved Baselines with Visual Instruction Tuning (LL...

2026.03.22

VLM

実装の詳細解説とGitHub公開完全ガイド。技術的な課題の解決策、パフォーマンス測定結果、本番化のアーキテクチャを詳しく解説。

2026.02.18

画像生成

基礎用語集と確認問題：Transformerの理解度チェックこれまでの【Transformer:基礎理論 A-1〜A-5】で学んだ内容は、理解したつもりでも、用語が混ざるとすぐに曖昧になりやすいです。そこでこの記事では、重要用語を一覧で整理...

2026.01.26

基礎理論

因果的Attentionマスクと自己回帰型生成：GPTの生成原理前回は、FFN と活性化関数の役割を学びました。今回は、GPT 型モデルがどの順番で単語を生成しているのかを確認しながら、その制約を支える自己回帰型生成とCausal Atte...

2026.01.26

基礎理論

FFNと活性化関数：Transformerの知識を蓄える場所前回は、Multi-Head Attention の詳細なメカニズムを学びました。今回は、そこで拾った文脈情報をどう扱うのかという視点から、Transformer のもう1つの重要...

2026.01.22

基礎理論

Multi-Head Attentionの詳細メカニズム：文脈理解の核心前回は、Transformerの全体構造を学びました。今回は、その心臓部であるAttentionメカニズムを詳しく解説します。ここで押さえたいのは、Attentionが...

2026.01.22

基礎理論

言語モデルの本質と進化軌跡：N-gramからTransformerへスマートフォンのキーボードで「私は学校へ」と入力した時、次に出現しそうな単語を予測する機能が働きます。この「次に来そうな単語を予測する能力」こそが、言語モデル（Langua...

2026.01.20

基礎理論

この記事のゴール本記事では、以下の“判断軸”を最短時間で獲得します。RLHF と DPO のどちらを使うべきか、一発で決められるLoRA を中心とした PEFT の選び方が分かるGPU メモリの制約下で最適な戦略が立てられるbfloat16...

2025.12.09

LLM

Claude3とは？2024年3月4日にAnthropic社によって発表されたClaude3は、Opus、Sonnet、およびHaikuという3つのモデルからなる大規模マルチモーダルAIモデルファミリーです。「大規模マルチモーダルAIモデル...

2024.03.11

ClaudeLLM