Shion

基礎理論

大規模言語モデル【Transformer:基礎理論A-3】

Multi-Head Attentionの詳細メカニズム:文脈理解の核心前回は、Transformerの全体構造を学びました。今回は、その心臓部であるAttentionメカニズムを詳しく解説します。以前のブログでもTransformerにつ...
基礎理論

大規模言語モデル【Transformer:基礎理論A-2】

Transformerモデル構造の全体像:3つの主要コンポーネント前回の記事で、言語モデルがN-gramからRNN、そしてTransformerへと進化した歴史を学びました。今回は、Transformerの具体的なモデル構造を詳しく解説しま...
基礎理論

大規模言語モデル【Transformer:基礎理論A-1】

言語モデルの本質と進化軌跡:N-gramからTransformerへスマートフォンのキーボードで「私は学校へ」と入力した時、次に出現しそうな単語を予測する機能が働きます。この「次に来そうな単語を予測する能力」こそが、言語モデル(Langua...
LLM

[LLM] 微調整の全手法を整理し、実務での最適解を一気に理解するためのガイド

この記事のゴール本記事では、以下の“判断軸”を最短時間で獲得します。RLHF と DPO のどちらを使うべきか、一発で決められるLoRA を中心とした PEFT の選び方が分かるGPU メモリの制約下で最適な戦略が立てられるbfloat16...
GPT

[0penAI] GPT-5 System Cardを読む

安全性と実用性の両輪で進化するモデル本記事は、OpenAIが公開した「GPT-5 System Card(2025/08/07)」の論点を押さえ、重要な部分を開発者・実務家目線で整理した要約です。結論から言うと、GPT-5は「安全な補完(S...
LLM

[UI] OllamaとOpen WebUIを使って「gpt-ossモデル」をChatGPT形式で使用する

「gpt-ossモデル」をChatGPT形式で使用する手順GithubのopenwebuiのページのREADME.mdから「Open WebUIのインストールする手順」通りにOpen WebUIのインストールを行うOpen WebUIとOl...
データ分析

階層クラスタリングの金融市場取引への応用:構造と洞察

概要金融市場のデータ分析において、クラスタリングは銘柄のグループ分けや市場レジームの特定に強力なツールです。中でも階層クラスタリングは、単にデータを分割するだけでなく、その背後にある「構造」を可視化し、より深い洞察を得るために極めて有効な手...
プログラミング

AIコーディングを読み解く:NotebookLMで設計意図を可視化してみよう

はじめにかつて「コードを書く」という行為は、プログラマーだけのものでした。設計書や仕様に沿って、一行一行を丁寧に積み重ねていく作業。そこには意図があり、判断があり、背景がありました。しかし、時代は変わりました。今や、AIエージェントを使えば...
Web3

【フィッシング詐欺】Hyperliquid紹介リンクから始まったWeb3の落とし穴

はじめに最近、暗号資産(仮想通貨)を扱う私の同僚が、MetamaskウォレットからETHを抜き取られるフィッシング詐欺の被害に遭いました。Metamaskウォレットとは?Web3の世界では「自分の資産は自分で守る」が大原則です。しかし、本物...
GPT

Cursorの使い方

はじめにCursorはVSCodeに慣れたユーザーに最適な、AI統合型の次世代エディタです。コード生成・編集・デバッグを支援するAgent/Ask/Manualの3モードを使い分けることで、日常業務から開発までを効率化できます。本記事では、...