Data Contamination

詳細設計書

大規模言語モデル【事前学習:詳細設計書D-3】LLM評価で確認すべきこと

LLM評価で見落としやすいデータ汚染とドメイン横断性能を整理。汚染検出の方法、In-domain / Out-of-domain の見方、評価条件の固定手順まで解説します。