Shion - News report AI lands

大規模言語モデル【Transformer：基礎理論A-3】

Multi-Head Attentionの詳細メカニズム：文脈理解の核心前回は、Transformerの全体構造を学びました。今回は、その心臓部であるAttentionメカニズムを詳しく解説します。以前のブログでもTransformerにつ...

2026.01.22

基礎理論

Transformerモデル構造の全体像：3つの主要コンポーネント前回の記事で、言語モデルがN-gramからRNN、そしてTransformerへと進化した歴史を学びました。今回は、Transformerの具体的なモデル構造を詳しく解説しま...

2026.01.20

基礎理論

言語モデルの本質と進化軌跡：N-gramからTransformerへスマートフォンのキーボードで「私は学校へ」と入力した時、次に出現しそうな単語を予測する機能が働きます。この「次に来そうな単語を予測する能力」こそが、言語モデル（Langua...

2026.01.20

基礎理論

この記事のゴール本記事では、以下の“判断軸”を最短時間で獲得します。RLHF と DPO のどちらを使うべきか、一発で決められるLoRA を中心とした PEFT の選び方が分かるGPU メモリの制約下で最適な戦略が立てられるbfloat16...

2025.12.09

LLM

安全性と実用性の両輪で進化するモデル本記事は、OpenAIが公開した「GPT-5 System Card（2025/08/07）」の論点を押さえ、重要な部分を開発者・実務家目線で整理した要約です。結論から言うと、GPT-5は「安全な補完（S...

2025.08.08

GPT論文

「gpt-ossモデル」をChatGPT形式で使用する手順GithubのopenwebuiのページのREADME.mdから「Open WebUIのインストールする手順」通りにOpen WebUIのインストールを行うOpen WebUIとOl...

2025.08.06

LLM

概要金融市場のデータ分析において、クラスタリングは銘柄のグループ分けや市場レジームの特定に強力なツールです。中でも階層クラスタリングは、単にデータを分割するだけでなく、その背後にある「構造」を可視化し、より深い洞察を得るために極めて有効な手...

2025.07.20

データ分析機械学習ファイナンス

プログラミング

はじめにかつて「コードを書く」という行為は、プログラマーだけのものでした。設計書や仕様に沿って、一行一行を丁寧に積み重ねていく作業。そこには意図があり、判断があり、背景がありました。しかし、時代は変わりました。今や、AIエージェントを使えば...

2025.06.01

プログラミング

はじめに最近、暗号資産（仮想通貨）を扱う私の同僚が、MetamaskウォレットからETHを抜き取られるフィッシング詐欺の被害に遭いました。Metamaskウォレットとは？Web3の世界では「自分の資産は自分で守る」が大原則です。しかし、本物...

2025.05.12

Web3

はじめにCursorはVSCodeに慣れたユーザーに最適な、AI統合型の次世代エディタです。コード生成・編集・デバッグを支援するAgent／Ask／Manualの3モードを使い分けることで、日常業務から開発までを効率化できます。本記事では、...

2025.04.21

ClaudeGPTLLMプログラミング