LLM

LLM

[LLM] Googleの言語モデル「Gemma」を使ってみる

Gemmaモデルとは?Gemmaの概要Gemmaは、Googleの「Gemini」モデルに用いられた技術を基に開発された、軽量で最先端のオープン言語モデルファミリーです。このモデルは大規模テキストコーパスを用いて自己教師ありの方法で事前トレ...
論文

[論文]Meta 社のTestGen-LLMとは?

TestGen-LLMとは?論文『Automated Unit Test Improvement using Large Language Models at Meta』を読む「Metaでの大規模言語モデルを使用した自動ユニットテスト改善」...
論文

[論文]『WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH RINGATTENTION』

論文の内容この研究について『WORLD MODEL ON MILLION-LENGTH VIDEO AND LANGUAGE WITH RINGATTENTION』の論文では、長いビデオと言語のシーケンスを訓練する際の課題に対処するために、...
論文

[論文] 『Ring Attention with Blockwise Transformers』の論文を読む

Ring Attentionとは?『Ring Attention with Blockwise Transformers』は、AIモデルで長いシーケンスを効率的に処理するために、ブロック単位のAttention機構とフィードフォワード操作の...