事前学習

詳細設計書

LLM【事前学習:詳細設計書D-4】

Attentionメカニズムの可視化と解釈手法を詳解。Multi-Head Attentionのパターン分析、Feature Importance、誤例分析、解釈時の注意点
詳細設計書

LLM【事前学習:詳細設計書D-3】

LLM評価で見落としやすいデータ汚染とドメイン横断性能を整理。汚染検出の方法、In-domain / Out-of-domain の見方、評価条件の固定手順まで解説します。
詳細設計書

LLM【事前学習:詳細設計書D-2】

LLM評価の標準ベンチマークを整理し、GLUE、MMLU、SQuAD、BLEU、ROUGEの役割と読み方を解説。スコアの見方と使い分けをまとめます。
詳細設計書

LLM【事前学習:詳細設計書D-1】

LLM評価は単一指標では足りません。タスク固有の精度だけで満足して実務で失敗しないために、基盤・汎化・信頼性の3層で段階的に評価する方法を解説します。
事前学習

LLM 事前学習:Transformer シリーズ総集編 vol.1

このページでわかることこのページは、大規模言語モデルの「事前学習:Transformer」シリーズ全体の案内ページです。ブログ A 〜 E を 1 ページにまとめ、一目で把握できるように整理しています。何を知りたいときにどのシリーズを見れば...
データセット戦略

LLM【事前学習:データセットC-8】

データブレンディングの基礎:マルチデータセット配合の科学1.1 なぜブレンディングが必要か1つのデータセットだけで、あらゆるタスクに強いモデルを作るのは難しくなってきました。そこで重要になるのが、複数ソースをどう組み合わせるかです。単一デー...
データセット戦略

LLM【事前学習:データセットC-7】

特化データセット戦略とドメイン最適化:医療・法律・コード・金融への応用汎用LLMを特定ドメインに特化させることで、専門タスクでの性能を大幅に向上できます。本記事では、ドメイン特化の戦略と注意点を詳解します。1. FineWeb-edu:教育...
データセット戦略

LLM【事前学習:データセットC-6】

データセット選択ガイダンス:組織ニーズに合わせた意思決定フレームワークプロジェクトマネージャーや意思決定者にとって、データセット選びは技術課題であると同時に経営判断でもあります。本記事では、組織のニーズに合わせて選びやすくするための意思決定...
データセット戦略

LLM【事前学習:データセットC-5】

Common Crawl、C4、The Pile、Dolma、FineWebの前処理戦略を系統的に比較分析。各フィルタリング手法の効果と、品質・多様性・コストのトレードオフを可視化
データセット戦略

LLM【事前学習:データセットC-4】

FineWebと学習効率の最前線:70+実験から導かれた最適パイプライン2024年、Hugging Faceが公開したFineWebは、データセット設計に新しい見方を持ち込みました。理論で方針を決めるだけでなく、実験で一つずつ確かめながら最...