AIエージェント

GitHub Copilot SDK入門: Copilotをアプリに組み込むと何ができるのか?

GitHub Copilot SDKの概要、Copilot CLIとの関係、ストリーミング応答、カスタムツール、外部CLIサーバー接続までを、前2本の続きとして整理します。
詳細設計書

大規模言語モデル【事前学習:詳細設計書D-2】GLUE、MMLU、BLEU、ROUGEの完全ガイド

LLM評価の標準ベンチマークを整理し、GLUE、MMLU、SQuAD、BLEU、ROUGEの役割と読み方を解説。スコアの見方と使い分けをまとめます。
詳細設計書

大規模言語モデル【事前学習:詳細設計書D-1】ベンチマークだけでは見えない本当の使い勝手

LLM評価は単一指標では足りません。タスク固有の精度だけで満足して実務で失敗しないために、基盤・汎化・信頼性の3層で段階的に評価する方法を解説します。
AIエージェント

【Awesome GitHub Copilotの使い方2】MCP・Hooks・Workflowsで開発フローを再設計する

前回は「Copilot の出力を整える」話でした。Instructions、Agents、Skills、Plugins を使って、GitHub Copilot を単なる補完ツールではなく、日常開発に寄り添う対話相手として育てるところまでを扱...
AIエージェント

【Awesome GitHub Copilotの使い方1】GitHub Copilotを完全に使いこなすための実践ガイド

GitHub Copilot を導入してから、コード補完は確かに速くなった。けれど、設計の検討、レビューの観点整理、テストケースの洗い出し、調査の効率化まで含めて考えると、まだ使いこなせている実感がない。そう感じている中級エンジニアは少なく...
事前学習

LLM 事前学習:Transformer シリーズ総集編 vol.1

## このページでわかることこのページは、大規模言語モデルの『事前学習:Transformer』 シリーズ全体の案内ページです。ブログ A 〜 E を 1 ページにまとめ、一目で把握できるように整理しています。- 何を知りたいときにどのシリ...
データセット戦略

大規模言語モデル【事前学習:データセットC-8】マルチデータセット配合の科学

## 1. データブレンディングの基礎### 1.1 なぜブレンディングが必要か1つのデータセットだけで、あらゆるタスクに強いモデルを作るのは難しくなってきました。そこで重要になるのが、複数ソースをどう組み合わせるかです。(/wp-cont...
データセット戦略

大規模言語モデル【事前学習:データセットC-7】医療・法律・コード・金融への応用

# 特化データセット戦略とドメイン最適化汎用LLMを特定ドメインに特化させることで、専門タスクでの性能を大幅に向上できます。本記事では、**ドメイン特化の戦略と注意点**を詳解します。---## 1. FineWeb-edu:教育的テキスト...
データセット戦略

大規模言語モデル【事前学習:データセットC-6】組織ニーズに合わせた意思決定フレームワーク

# データセット選択ガイダンスプロジェクトマネージャーや意思決定者にとって、データセット選びは技術課題であると同時に経営判断でもあります。本記事では、組織のニーズに合わせて選びやすくするための**意思決定フレームワーク**を整理します。--...
データセット戦略

大規模言語モデル【事前学習:データセットC-5】フィルタリング手法の系統的評価

Common Crawl、C4、The Pile、Dolma、FineWebの前処理戦略を系統的に比較分析。各フィルタリング手法の効果と、品質・多様性・コストのトレードオフを可視化