興味がありますか オファー? クーポンを利用して節約しましょう WhatsApp o 電報!

ニューラルネットワークのトレーニングを妨げている大きな問題があります

4月2 2024

ダイナミックな世界の中で、インテリジェンス 人為的な、大手テクノロジー企業は、イノベーションのペースを遅らせる可能性のある予期せぬ課題に直面しています。 データを見つけるのが難しい モデルをトレーニングするための品質を向上させます。このデータ不足は、次のような先進技術の開発に影響を与えています。 GPT-5一方、Microsoft や OpenAI ほどの企業は、この障害を克服するための革新的なソリューションを模索しています。

AI トレーニングの課題: データへの渇望があり、これが進歩を遅らせます

前例のないコンピューティング能力の向上と機械学習技術の進歩によって特徴付けられる時代において、OpenAI とその同種の企業は次のような課題に直面しています。 パラドックス: 豊富なオンラインデータが自動的に AI トレーニングに使用できるリソースに変換されるわけではありません。の 正確なデータが必要です特に、計画されている GPT-5 のようなますます複雑なモデルをトレーニングする場合には、関連性と最新性がこれまで以上に重要になります。

GPT-4 から GPT-5 への移行は、データ需要の指数関数的な増加を示しています。前者では 12 兆トークン「のみ」必要でしたが、後継バージョンの推定では約 XNUMX 兆トークンが必要でした。 60～100兆。高品質データの入手可能性とニーズとの間の矛盾が重大な障害として浮上しており、 10兆から20兆トークンの範囲で不足する可能性がある.

この質の高いデータの不足は、AI の進歩にとって実際のボトルネックとなります。 Web 上に存在する古いデータや低品質のデータは、深刻な問題を表しています。 機械学習の有効性の限界。さらに、大規模なプラットフォームによるデータアクセスによって課される制限は問題を悪化させるだけであり、トレーニングに利用できるリソースがさらに制限されます。言語モデル.

この課題に対応して採用される戦略は、技術革新から戦略的パートナーシップまで多岐にわたります。たとえば、OpenAI は、Whispe 音声認識ツールを通じてオーディオおよびビデオデータを使用するr、利用可能なデータのプールを拡張するため。並行して、同社は次の可能性を模索しています。合成データを生成する既存のギャップを埋めるのに役立つ品質を備えています。