興味がありますか オファー? クーポンを利用して節約しましょう WhatsApp o 電報!

ラマ 3 が巨人に挑む: これがメタの新しい AI モデルです

4月18 2024

Meta が 2 つの新しいものを追加しました言語モデル彼のシリーズに： ラマ3 8B e ラマ3 70B。これらは、人工知能の世界で優れたパフォーマンスを約束します。最も衝撃的なニュースは?それぞれ 8 億と 70 億のパラメータが存在します。これらの数値は、モデルの複雑さと処理能力を表します。 処理する 情報.

Llama 3 は XNUMX つのモデルだけではありません。さらに多くのモデルが開発中です。

メタはそれだけではありません。する予定です Llama 3 シリーズのさらに多くのモデルをリリースするただし、日付は指定しません。この戦略は期待を生み出すとともに、製品を継続的に改善するという同社の取り組みを示しています。

I 新しいラマモデルこれらは以前のモデルからの飛躍であると説明されています。この改善の一部は、 2 つのカスタム GPU クラスター、それぞれに 24.000 のユニットがあり、モデルをより効果的かつ正確にトレーニングできるようになりました。メタは、それらが持つパラメータの数により、これらのモデルは 入手可能な最高のものの中で 今日は生成人工知能についてです。

Llama 3 のパフォーマンスは、AI モデルの機能を評価するために使用される標準化されたテストであるさまざまな AI ベンチマークを通じて測定されました。これらには以下が含まれます MMLU 知識のために、 ARC スキルの習得のために、 DROP テキストのブロックについて推論するため。これらのベンチマークの有用性についてはさまざまな意見がありますが、依然として AI モデルの機能を評価および比較するための一般的な方法です。

特に、Llama 3 8B は、Mistral やグーグルジェマ、少なくとも 4 つの異なるベンチマークで。これには、生物学、物理学、化学、さらにはコード生成や数学の問題などの分野における一般知識、推論、特定のスキルに関するテストが含まれます。たとえば、GPT-XNUMX はあまりうまく機能しません。

最大のモデルである Llama 3 70B は、競合するだけでなく、場合によっては、 Google の Gemini 1.5 Pro さまざまなテストで、激しい競争にもかかわらず、この分野の巨人にも対抗できることが実証されました。ただし、一部のフラッグシップモデルよりも優れたパフォーマンスを発揮する一方で、次のことに注意することが重要です。クロード 3 ソネット by Anthropic いくつかのテストでは、より高度な Claude 3 Opus モデルのパフォーマンスには達していません。