LLM

ChatGPT

[OpenAI] ChatGPT-4oとは?GPT-4との違い

ChatGPT-4oとは何か? ChatGPT(ChatGPT-4 omni)は、OpenAIが作った新しいバージョンの言語モデルです。このモデルは、元々のChatGPT-4をさらに改良して、更に良いパフォーマンスを発揮するモデルです。 C...
Claude3

[Anthropic] Claude3を使ってみてその良さを知る(方向性を暗示するLLMの行方)

Claude3とは? 2024年3月4日にAnthropic社によって発表されたClaude3は、Opus、Sonnet、およびHaikuという3つのモデルからなる大規模マルチモーダルAIモデルファミリーです。 「大規模マルチモーダルAIモ...
LLM

[UI] OllamaとOpen WebUIを使って「Gemmaモデル」をChatGPT形式で使用する

「Gemmaモデル」をChatGPT形式で使用する手順 GithubのopenwebuiのページのREADME.mdから「Open WebUIのインストールする手順」通りにOpen WebUIのインストールを行う Open WebUIとOl...
LLM

[LLM] Googleの言語モデル「Gemma」を使ってみる

Gemmaモデルとは? Gemmaの概要 Gemmaは、Googleの「Gemini」モデルに用いられた技術を基に開発された、軽量で最先端のオープン言語モデルファミリーです。 このモデルは大規模テキストコーパスを用いて自己教師ありの方法で事...
LLM

[OpenAI] Fine-tuningを理解する

Fine-tuningとは? ファインチューニングは、大量のデータで事前に学習されたモデルを特定のタスクやデータセットに合わせて微調整するプロセスです。わかりやすく説明すると大規模言語モデルが大きすぎて対応できない場合や、大規模言語モデルの...
LLM

[OpenAI] 埋め込み(Embeddings)を理解する

「埋め込み(Embeddings)」とは、テキストや他の種類のデータを数値のベクトルに変換するプロセスを指し、この変換により、高次元から低次元へデータをコンピュータがより容易に処理できる形式にすることです。「埋め込みベクトル」は、元のテキストやデータの意味的な情報を保持し、その情報を数値データとして表現します。
LLM

[LLM]LIamaHubをLIamaIndexを使って活用してみよう

LIamaIndexは公開されていない独自データを使って質問応答を行うチャットAIを作成でき、公開されていない情報を元に、質問に応じて回答に関連情報を検索して、それを入力プロンプトに挿入し、LLMの推論能力を利用して応答を生成します。LIamaHubはLIamaIndexで扱う、様々なファイル形式やWebサービスをドキュメントのデータソースとして利用できるデータコネクトサービスです。
音声認識

[音声認識] 文字起こしツールWhisperを使ってみよう

Whisperは会議の文字起こし、動画の文字起こし・翻訳などで出番が多いツールであり、特に海外の講義や重要な情報などを扱いたい場合は有効利用が可能です。Whisperは世界中のコミュニケーションをよりアクセスしやすくすることを可能にした革新的なツールです。
画像生成

[画像生成] APIでDALL-E 3を使ってみよう

APIを使ってDALL-E 3モデルで画像生成を行います。画像生成のポイントはプロンプトの工夫です。プロンプトは、生成される画像の具体的なビジョンをAIに伝えるための重要なツールであり、表現手法、色彩、画像のイメージを織り交ぜることで、より精密で意図に沿った結果を得ることができます。
ChatGPT

[OpenAI]GPT-4の魅力とAPIの使い方

GPT-4とは? 進化した言語理解 多岐にわたる知識への対応 問題解決とクリエイティビティ OpenAIが開発した大規模言語モデルでGPT-3.5に続くモデル。上記を踏まえあらゆる意味合いでGPT-3.5を凌駕したモデルです。 GPT−4と...