Shion

論文

[論文] 『Ring Attention with Blockwise Transformers』の論文を読む

Ring Attentionとは?『Ring Attention with Blockwise Transformers』は、AIモデルで長いシーケンスを効率的に処理するために、ブロック単位のAttention機構とフィードフォワード操作の...
LLM

[OpenAI] Fine-tuningを理解する

Fine-tuningとは?ファインチューニングは、大量のデータで事前に学習されたモデルを特定のタスクやデータセットに合わせて微調整するプロセスです。わかりやすく説明すると大規模言語モデルが大きすぎて対応できない場合や、大規模言語モデルの情...
LLM

[OpenAI] 埋め込み(Embeddings)を理解する

「埋め込み(Embeddings)」とは、テキストや他の種類のデータを数値のベクトルに変換するプロセスを指し、この変換により、高次元から低次元へデータをコンピュータがより容易に処理できる形式にすることです。「埋め込みベクトル」は、元のテキストやデータの意味的な情報を保持し、その情報を数値データとして表現します。
論文

[論文] ReAct:言語モデルにおける推論と行動の相乗効果

ReActは、大規模言語モデルにおいて、推論トレースとタスク固有のアクションを組み合わせる革新的なアプローチです。この手法により、モデルは推論とアクションの能力を効果的に統合し、タスク解決においてより優れたパフォーマンスを発揮します。また、ReActはモデルの解釈可能性や信頼性を向上させ、様々な言語理解や意思決定タスクにおいて効果的に活用されています。
LLM

[LLM]LIamaHubをLIamaIndexを使って活用してみよう

LIamaIndexは公開されていない独自データを使って質問応答を行うチャットAIを作成でき、公開されていない情報を元に、質問に応じて回答に関連情報を検索して、それを入力プロンプトに挿入し、LLMの推論能力を利用して応答を生成します。LIamaHubはLIamaIndexで扱う、様々なファイル形式やWebサービスをドキュメントのデータソースとして利用できるデータコネクトサービスです。
音声認識

[音声認識] 文字起こしツールWhisperを使ってみよう

Whisperは会議の文字起こし、動画の文字起こし・翻訳などで出番が多いツールであり、特に海外の講義や重要な情報などを扱いたい場合は有効利用が可能です。Whisperは世界中のコミュニケーションをよりアクセスしやすくすることを可能にした革新的なツールです。
画像生成

[画像生成] APIでDALL-E 3を使ってみよう

APIを使ってDALL-E 3モデルで画像生成を行います。画像生成のポイントはプロンプトの工夫です。プロンプトは、生成される画像の具体的なビジョンをAIに伝えるための重要なツールであり、表現手法、色彩、画像のイメージを織り交ぜることで、より精密で意図に沿った結果を得ることができます。
ChatGPT

[OpenAI]GPT-4の魅力とAPIの使い方

GPT-4とは?進化した言語理解多岐にわたる知識への対応問題解決とクリエイティビティOpenAIが開発した大規模言語モデルでGPT-3.5に続くモデル。上記を踏まえあらゆる意味合いでGPT-3.5を凌駕したモデルです。GPT−4とGPT-3...
ChatGPT

[OpenAI]ChatGPTの簡単な使い方の説明

ChatGPTとは?「ChatGPT」はOpenAIが開発した最新のチャットボットです。アカウント作成後に利用可能です。文章生成ChatGPTは与えられた文脈から自然な文章を生成します。ブログ記事、小説、文章の要約など、様々な文体やジャンル...
ChatGPT

[コーディング学習]GitHub Copilot Chatを使ってみる

VSCodeを使った活用術イントロダクションGitHub Copilot Chatは、プログラミングの新たな次元への扉を開く画期的なツールです。コード補完ツールとして知られるGitHub Copilotが、チャット形式で開発者にコードの提案...