LLM

Meta社が発表した最新の大規模言語モデル、Llama 3.1シリーズの紹介

2024年7月24日 — 2 min read

2024年7月23日、Meta社が最新の大規模言語モデル、Llama 3.1シリーズを発表しました。この記事では、Llama 3.1シリーズの特徴と性能、そして実際の使用例を紹介します。

以下、動画にもまとめてありますので、あわせてごらんいただければと思います。

Llama 3.1シリーズの主な特徴

Llama 3.1シリーズは、8B、70B、405Bの3つのモデルサイズで提供されています。主な特徴は以下の通りです：

Meta社は150以上のベンチマークデータセットを用いて、これらのモデルの性能を評価しました。405Bモデルの具体的な比較結果は以下の通りです：

MMLU（一般的な言語理解）: 88.6点（GPT-4の85.4点を3.2ポイント上回る）
HumanEval（コーディング能力）: 89.0点（GPT-4の86.6点を2.4ポイント上回る）
GSM8K（数学的能力）: 96.8点（GPT-4 Omniの96.1点を0.7ポイント上回る）
ARC Challenge（推論能力）: 96.9点（GPT-4の96.4点を0.5ポイント上回る）
ZeroSCROLLS/QuALITY（長文脈処理能力）: 95.2点（GPT-4 OmniとClaude 3.5 Sonnetの90.5点を4.7ポイント上回る）
Multilingual MGSM（多言語処理能力）: 91.6点（GPT-4の85.9点を5.7ポイント上回る）

これらの結果は、Llama 3.1 405Bが多くの分野で最先端の性能を持つことを示しています。70Bと8Bモデルも、そのサイズに応じた高い性能を発揮しています。

当社が運営している chatstream.net にて、実際に Llama 3.1 とチャットをすることができます。

8Bモデルでさえ、Llama 3.1は全体としてユーザーの質問に対して多角的に答えようとする傾向が見られました。以前の8Bモデルと比較して、より賢く、行き届いた印象を受けました。

今後、Llama 3.1に対して日本語で継続事前学習されたモデルが次々とリリースされることが期待されます。AIの進化が続く中、これらの新しいモデルの登場を楽しみに待ちたいと思います。