【OpenAI】新モデルGPT-4.1と有効プロンプトについて

概要

Introducing GPT-4.1 in the API

OpenAIは、最新の大規模言語モデル群である GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano のAPI提供開始を発表しました。「GPT-4.1ファミリー」はGPT‑4oの改良版をベースにしたモデルであり、全ての面で4oを上回っているようです。

GPT-4.1: クラス最高のインテリジェンスと性能を誇るフラッグシップモデル。
GPT-4.1 Mini: 速度とコスト効率に優れ、マルチモーダル機能も備えるバランスの取れたモデル。
GPT-4.1 Nano: 高スループット、低レイテンシ、超低コストを実現する最も効率的なモデル。

これらのモデルは、既存のモデルと比較して、長文コンテキスト処理能力、複雑な指示への追従性など、多くの中核的な能力において顕著な改善を示しています。特にコーディングの面では4oはもちろんですが、o3-mini-highまでを上回っているようなので是非、コーディングで使ってみたいと思います。

Coding：

モデル紹介

モデル名	特徴	主な用途例
GPT-4.1	最高レベルの知能、長文コンテキスト処理能力、複雑な指示への追従性	高度なチャットボット、エージェント構築、コンテンツ生成、複雑なコーディング支援
GPT-4.1 Mini	高速応答、優れたコストパフォーマンス、画像・動画理解（マルチモーダル）	リアルタイム対話システム、画像分析、効率的なタスク処理、コスト重視のアプリケーション
GPT-4.1 Nano	圧倒的な低コストと高効率（速度とスループット）、基本的な言語タスクに最適	大規模な分類・抽出タスク、オートコンプリート、要約、デバイス上での応用検討

GPT-4.1 シリーズの主な進化点

GPT4.1は先行モデルと比較して、以下の点が強化されています。

図では全ての面で4oを上回る性能と評価されているのがわかります。それではその他の性能について確認してみましょう。

全体性能とベンチマーク強化

項目	内容
全体性能	MMLU、MATH、GPQA、HumanEvalでスコア向上。クラス最高の知能を実現
コーディング能力	SWE-Benchスコア向上。Diff適用・リポジトリコンテキストの理解・ユニットテスト生成の精度が大幅向上
複雑な指示への対応力	長文・多段階の命令や制約を高精度に実行可能
RAG性能	「Needle In A Haystack」テストで情報検索精度が向上

長文コンテキスト処理

モデル	最大コンテキストウィンドウ	特徴
GPT-4.1	最大200万トークン	一貫した長文読解と対話処理が可能に
GPT-4.1 Mini / Nano	公開情報では非対応（Miniは強化傾向）	–

マルチモーダル処理

モデル	対応ベンチマーク	特徴
GPT-4.1 Mini	Video MME	映像理解において高スコアを記録

コスト効率と料金

モデル	トークン単価	備考
GPT-4.1	従来より価格引き下げ	高性能とコスト効率の両立
GPT-4.1 Nano	$0.12 / 100万入力トークン	極めて低コスト、軽量運用向け
追加料金	なし	長コンテキスト利用でも追加課金なし

エージェント最適化・ファインチューニング

項目	内容
エージェント最適化	自律的なタスク実行能力が向上
ファインチューニング	GPT-4.1 / 4.1 Mini対応、Nanoは今後対応予定

要点まとめ

GPT-4.1は「性能・文脈・精度・コスト」の4要素で大幅に強化。
特に長文処理と複雑な命令への追従性は従来モデルを凌駕。
マルチモーダルやRAGの強化により応用分野がさらに拡大。
Nanoモデルは軽量・低コストでIoTやエッジデバイス向けにも最適。

GPT-4.1の有効プロンプトについて

「GPT-4.1 Prompting Guide」に沿ってプロンプトの有効性を確認していきましょう。それぞれのケースに合わせたプロンプトの組み合わせによってモデルを有効活用するプロンプトを考えていきます。まずはそれぞれのケースにあったプロンプトについて確認していきます。

GPT 4.1 Prompting Guide | OpenAI Cookbook

Open-source examples and guides for building with the OpenAI API. Browse a collection of snippets, advanced techniques a...

エージェントワークフロー向けプロンプト

まずは『エージェントワークフロー向けプロンプト』について確認してみましょう。

以下のプロンプトは、GPT‑4.1を「自主的に問題解決を進めるエージェント」として運用する際の３大リマインダーとして活用できます。

プロンプト例 ：継続性

「あなたはエージェントです ― ユーザーの問い合わせが完全に解決されるまで、
自分のターンを終えずに続行し、問題が解決したと確信したときのみ応答を終了してください。」

用途	活用事例
Persistence (継続性)：長いタスクでも途中で止まらず最終的な結論まで自律遂行	SWE‑bench Verified のバグ修正タスクで、モデルが途中で止まらず解決まで継続して作業

プロンプト例：ツール呼び出し

「ファイルの内容やコードベースの構造がはっきりしない場合は、
ツールを使用してファイルを読み、関連情報を取得してください。
推測で回答せず、必ずツールを呼び出してください。」

用途	活用事例
Tool‑calling (ツール呼び出し)：根拠が不十分な箇所は必ずツールで裏付け	大規模コードベースのリファクタリング時に、誤答を防ぎ正確なファイル操作

プロンプト例：ツール呼び出し前後に“思考”を明示

「各関数呼び出しの前に必ず十分に計画を立て、前回の関数呼び出しの結果を振り返ってください。
関数呼び出しだけに頼らず、問題解決のためにしっかり考えて行動してください。」

用途	活用事例
Planning (計画)：ツール呼び出し前後に“思考”を明示	複雑なパッチ適用時に、各ステップの狙いと結果をテキストで残しながら実装

長いコンテキスト活用向けプロンプト

次は『長いコンテキスト活用向けプロンプト』について確認してみてください。

1Mトークンまでの長文読解タスクで、外部コンテキストのみ／必要に応じて内部知識も併用を切り替える例です。

完全に外部文書のみを使用する場合

提供された外部コンテキスト内の文書のみを使ってユーザーの質問に回答してください。
このコンテキストに基づいて回答が分からない場合は、
ユーザーが尋ねても「回答に必要な情報がありません」と応答してください。

外部コンテキストを基本にしつつ、自身の知識も併用する場合

基本的には提供された外部コンテキストを使って回答してください。
ただし、回答に必要な補足知識があると確信できる場合は、
自分の知識を適宜使用して回答しても構いません。

用途	活用事例
使用する情報源の範囲を厳格に制御	企業ポリシー文書からのみ抜粋して回答／専門分野知識と組み合わせた要約

Chain‑of‑Thought（CoT）誘導プロンプト

次は『Chain‑of‑Thought（CoT）誘導プロンプト』について確認しよう。

モデル自身に「ステップごとに考えてもらう」よう促すフレーズです。

最初に、クエリに答えるためにどの文書が必要かを注意深く
ステップバイステップで考えてください。
次に、各文書のタイトルとIDを出力してください。
最後に、IDをリスト形式にまとめてください。

用途	活用事例
複雑タスクを分解し、各ステップを検証しながら実行	ドキュメント選定→要約→最終回答での情報取りこぼし防止

インストラクションフォロー向けプロンプト

次は『インストラクションフォロー向けプロンプト』について確認していきます。

インストラクションフォローとは、AIモデルがユーザーの指示を正確に理解し、その意図に沿った応答や行動を自動的に生成する能力です。

顧客対応エージェント例：

以下は良いインストラクションフォローの実例です。

あなたは NewTelco のカスタマーサービス担当です。
以下のガイドラインに厳密に従ってください。

# 指示
- 常に「こんにちは、NewTelco です。ご用件をお伺いできますか？」と挨拶してください。
- 会社の製品やユーザーのアカウントに関する事実確認には必ずツールを呼び出してください。
  情報が不足する場合は、必要な情報をユーザーに尋ねてください。
- ユーザーがエスカレーションを要求したら、人間担当者に繋いでください。
- 禁止トピック（政治、宗教、物議を醸す時事、医療・法律・金融アドバイス、
個人的な会話、社内批判）には触れないでください。
- ツール呼び出し前後では必ずユーザーへメッセージを送信し、進捗を共有してください。
- プロフェッショナルかつ簡潔な口調を維持し、文の合間に絵文字を入れてください。
- 要求が完了したら「他にお手伝いできることはありますか？」と尋ねてください。

# 応答の手順
1. 必要に応じてツールを呼び出し、前後にユーザーへメッセージを表示します。
2. 応答では
   1. ユーザーの要望をオウム返しで確認し、
   2. ガイドラインに沿って回答を行います。

# サンプルフレーズ
## ツール呼び出し前
- 「お調べするために、少々情報を確認させてください。」
- 「少々お待ちください。すぐに確認します。」
- 「最新の情報を取得いたします。」

## ツール呼び出し後
- 「かしこまりました。以下をご覧ください：[回答内容]」
- 「調べた結果はこちらです：[回答内容]」

# 出力フォーマット
- 最終的なメッセージを必ずユーザーに表示し、
- 事実情報には必ず引用元を明記してください（例：[文書名](ID)）。
- 会社情報以外には言及せず、文脈に沿った内容のみ回答してください。

用途	活用事例
FAQチャットボットや社内サポートの定型応答	社内ポリシー照会、アカウント情報取得、トラブルシュート

プロンプト構造のテンプレート

次は『プロンプト構造のテンプレート』を確認します。

新規ユースケースでの基本構造として推奨されるフォーマットです。

# 役割と目的

# 指示

## 詳細セクション

# 思考ステップ

# 出力フォーマット

# 例
## 例1

# コンテキスト

# 最終手順とステップ思考の指示

用途	活用事例
新規プロンプト開発の骨組み	ナレッジ検索、文書要約、コード生成などさまざまな場面

３ステップ：プロンプト設計の進め方

先ほど説明した有効なプロンプトを土台にして、プロジェクト固有のゴールや制約を反映し、最終的なプロンプトを作ることができます。まずはそれぞれのステップごとに確認してみましょう。

ステップ	説明
1. 用途別に組み合わせる	「エージェントワークフロー」「長文読解」「Chain‑of‑Thought」「指示遵守」「プロンプト全体のテンプレート」など、目的に応じたプロンプト要素を組み合わせて使い分ける。
2. サンプルを真似つつ調整	提示された例（サンプルフレーズやツール呼び出しパターン）をベースに、自社の業務フローやツール構成に合うように微調整して最適化する。
3. 評価と反復	実際の開発パイプラインで小規模テストを行い、その結果からフィードバックを受けてプロンプトを何度も改善していくワークフローを回す。

この手法ではまず、プロンプトを「エージェントワークフロー」「長文読解」「Chain‑of‑Thought」「指示遵守」「汎用テンプレート」といった目的別の要素に分解し、必要な箇所を組み合わせます。次に、提供されたサンプルフレーズやツール呼び出しの具体例を、自社の業務フローや利用中のAPI／ツールに合わせて微調整。最後に、開発パイプライン上で小規模なテストを繰り返し実行し、その結果を反映してプロンプトを改良・最適化していきます。これにより、汎用性と精度を両立した実運用向けプロンプトを構築できます。

GPT-4.1の有効なプロンプト例

これまでの例だけではわかりにくかと思いますので、次は実際に実行できる有効なプロンプト例を作ってみます。

以下は「金融市場データの分析」をテーマに、先ほどの手法を取り入れた具体的なプロンプト例です。GPT-4.1または最新のo3、o4‑miniに与えて活用することができます。

# 役割と目的
あなたは金融市場データ分析の専門家AIアシスタントです。
ユーザーの要望に応じて、過去データの取得・前処理・分析・可視化を自律的に完遂し、
わかりやすいレポートを作成してください。

# 指示
- **継続性**：分析が完了するまで対話を終えず、途中で回答を返さないこと。  
- **ツール呼び出し**：データ取得・統計計算・グラフ作成は必ずツール（`get_market_data`、
`compute_statistics`、`plot_chart`）を呼んで実行し、推測で処理しない。  
- **計画と振り返り**：各ステップの前に「何をするか」を計画し、
後に「何が得られたか」を簡潔に振り返る。  
- **CoT（思考の声出し）**：複雑な処理前は「なぜこの手順が必要か」を一文で説明する。

## ツール定義サンプル
```json
[
  {
    "name": "get_market_data",
    "description": "指定した銘柄・期間の価格時系列データを取得する",
    "parameters": { "symbol": "string", "start_date": "string", "end_date": "string" }
  },
  {
    "name": "compute_statistics",
    "description": "時系列データの移動平均やボラティリティなど統計量を計算する",
    "parameters": { "data": "array", "metrics": "array" }
  },
  {
    "name": "plot_chart",
    "description": "取得済みデータや統計量をチャート化して返す",
    "parameters": { "data": "array", "type": "string" }
  }
]

思考ステップ

データ取得
- 計画：「BTC/JPYの日足データを過去1年分取得します」
- ツール呼び出し：get_market_data(symbol="BTC/JPY", start_date="2024-04-01", end_date="2025-04-01")
- 振り返り：「日足データ300点を取得しました」
前処理
- 計画：「欠損や異常値を確認し、必要なら補完します」
- CoT：「欠損があると統計量が歪むため」
- 処理：Python で簡易補完
統計計算
- 計画：「移動平均(20日,50日)とボラティリティ(20日)を計算します」
- ツール呼び出し：compute_statistics(data=cleaned_data, metrics=["ma20","ma50","vol20"])
- 振り返り：「MAとボラティリティが算出できました」
可視化
- 計画：「価格と移動平均をオーバーレイし、ボラティリティは別軸で表示します」

ツール呼び出し：

plot_chart(data={"price":price,"ma20":ma20,"ma50":ma50}, type="line")  
plot_chart(data={"vol20":vol20}, type="bar")

振り返り：「主要チャートを作成しました」

出力フォーマット

分かりやすい要約（図表番号付き）
コードスニペット（必要最小限）
図表へのリンク（または埋め込み）

実行例

ユーザー：「BTC/JPYの過去1年のテクニカル分析レポートを作成してください」

上のプロンプトを全て入力します。このプロンプトを実行することで、上記のワークフローに従って分析レポートが返ってきます。

この例では、AIアシスタントに「ツール呼び出し→計画→実行→振り返り」の一連のワークフローを自律的に踏ませ、BTC/JPYの日足データ取得から欠損補完、移動平均・ボラティリティ計算、チャート作成までを順序立てて完遂させることで、わかりやすいテクニカル分析レポートを生成することを目的としています。

これで金融市場のデータ分析も直感的に実践することが可能となりそうです。

最新モデルでも実行可能か？

いずれのモデルでも同じプロンプト構造で実行は可能ですが、モデルごとに最適化が必要です。

モデル	実行可否	調整ポイント
GPT‑4.1	◎	そのままでOK。1Mトークン長の長文コンテキストや複雑なCoT、厳密なツール呼び出しに最適化されています。
o4‑mini	○ （要簡略化）	コントキスト長を数万トークン以内に抑え、CoTや振り返りのステップを短文化すると安定します。
o3	○ （要更簡略化）	計画／振り返りは要点だけに絞り、ツール呼び出し命令もシンプルに。「なぜ必要か」などの説明は省略可。

GPT‑4.1：フル機能を活かしてそのまま運用可能
o4‑mini：長文や詳細CoTを簡略化
o3：さらにプロンプト全体を短くし、要点だけ指示すると良好です。

今後のChatGPTへの導入と最新モデルに有効なプロンプト

現時点で、これらの新モデルがChatGPTに統合されるかどうかの公式発表はありません。しかし、過去の事例では、APIでの提供が先行し、その後コンシューマー向けサービスに導入されるケースが多く見られました。今後のOpenAIからの発表を待ちましょう。一方でGithub CopilotやCorsorには既にGPT-4.1が導入されていますので使って確認してみましょう。

GPT-4.1は、性能、速度、コスト効率、そして機能（長文処理、コーディング、マルチモーダル）の面で、開発者にとって非常に魅力的な選択肢であると言えるのではないでしょうか。

またプロンプトに関しては、最新モデルであるo3、o4-miniもGPT-4.1で有効なプロンプトを応用して使うことでモデルの性能を引き出せるはずです。

【OpenAI】新モデルGPT-4.1と有効プロンプトについて

概要Introducing GPT-4.1 in the APIOpenAIは、最新の大規模言語モデル群である GPT-4.1、GPT-4.1 Mini、GPT-4.1 Nano のAPI提供開始を発表しました。「GPT-4.1ファミリー」...

GPT 4.1 Prompting Guide | OpenAI Cookbook

Open-source examples and guides for building with the OpenAI API. Browse a collection of snippets, advanced techniques a...