Shion

ChatGPT

[OpenAI] ChatGPT-4oとは?GPT-4との違い

ChatGPT-4oとは何か?ChatGPT(ChatGPT-4 omni)は、OpenAIが作った新しいバージョンの言語モデルです。このモデルは、元々のChatGPT-4をさらに改良して、更に良いパフォーマンスを発揮するモデルです。Cha...
Claude3

[Anthropic] Claude3を使ってみてその良さを知る(方向性を暗示するLLMの行方)

Claude3とは?2024年3月4日にAnthropic社によって発表されたClaude3は、Opus、Sonnet、およびHaikuという3つのモデルからなる大規模マルチモーダルAIモデルファミリーです。「大規模マルチモーダルAIモデル...
論文

[論文] テキストからオーディオや音楽への変換を行う非自己回帰モデル「MAGNET」とは?

MAGNETとは?MAGNET(MASKED AUDIO GENERATION USING A SINGLE NON- AUTOREGRESSIVE TRANSFORMER)はテキストからオーディオや音楽への変換を行う新しい非自己回帰モデル...
論文

[論文] エネルギー効率の良いAI : 計算資源を最小限に抑える言語モデルの開発

『The Era of 1-bit LLMs : All Large Language Models are in 1.58 Bits 』を読む論文の概要論文は、BitNet b1.58がどのようにして従来の全精度モデルと同等の性能を、より...
論文

[論文] OpenAIの動画生成AI「Sora」の論文を読む

Soraとは?Soraは、OpenAIによって2024年2月にリリースされたテキストからビデオを生成するAIモデルです。Prompt: A stylish woman walks down a Tokyo street filled wit...
LLM

[UI] OllamaとOpen WebUIを使って「Gemmaモデル」をChatGPT形式で使用する

「Gemmaモデル」をChatGPT形式で使用する手順GithubのopenwebuiのページのREADME.mdから「Open WebUIのインストールする手順」通りにOpen WebUIのインストールを行うOpen WebUIとOlla...
LLM

[LLM] Googleの言語モデル「Gemma」を使ってみる

Gemmaモデルとは?Gemmaの概要Gemmaは、Googleの「Gemini」モデルに用いられた技術を基に開発された、軽量で最先端のオープン言語モデルファミリーです。このモデルは大規模テキストコーパスを用いて自己教師ありの方法で事前トレ...
論文

[論文]Meta 社のTestGen-LLMとは?

TestGen-LLMとは?論文『Automated Unit Test Improvement using Large Language Models at Meta』を読む「Metaでの大規模言語モデルを使用した自動ユニットテスト改善」...
論文

[論文]『A Data Science Pipeline for Algorithmic Trading: A Comparative Study of Applications for Finance and Cryptoeconomics』を読む

この論文の研究について概要論文の題名の和訳:『アルゴリズム取引のためのデータサイエンスパイプライン: 金融と暗号経済学への応用の比較研究』この研究論文は、伝統的金融と暗号経済学の両方におけるアルゴリズムトレーディングの重要性を強調し、データ...
論文

[論文]『WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH RINGATTENTION』

論文の内容この研究について『WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH RINGATTENTION』の論文では、長いビデオと言語のシーケンスを訓練する際の課題に対処するために、...