
Googleの発表 新しい言語モデルに基づいて、 双子座、好奇心と懐疑のベールを上げました。 プロモーションビデオでは並外れたパフォーマンスが約束されていましたが、いくつかの調査と観察が明らかになりました 表示されている内容と実際の機能との間に大きな差異がある システムの。 によると 著名な情報源、非常に注意してください、その可能性は記載されているものよりも低いでしょう。
Gemini プロモーション ビデオの背後にある真実: すべての煙と火?
最近の間、 双子座のプレゼンテーション, Googleは、新しいAI言語モデルのおそらく高度な機能を紹介するビデオを公開して世間を驚かせた。 しかし、それからすぐに、以下のようないくつかのメディアが取り上げた。 ブルームバーグ、彼らは始めました これらのパフォーマンスの信頼性を疑う.
ビデオでは、ジェミニはジャンケンを含む一連のジェスチャーを即座に解釈できるように見えました。 しかし、後に明らかになったように、ジェミニから正確な答えを得るには、 XNUMX つのジェスチャーをすべて示す必要があります そして具体的なガイドとなる質問を提供します。 これは、実際のプロセスが当初説明されていたものよりも複雑で、直感的ではないことを示唆しています。
ニューラル ネットワークの実際の機能を「粉飾」したという非難により、 Google の透明性と誠実さ 彼らのイノベーションを紹介する際に。 匿名を希望した一部のGoogle従業員によると、デモビデオはGeminiの実際の能力を正確に反映していなかったという。 この見解はさらに次のように裏付けられました。 イーライ・コリンGoogle DeepMind によるもので、アヒルの描画などのデモされた機能の一部が、 それらはまだ研究レベルにあり、製品に完全には統合されていません.
こうした暴露にも関わらず、Googleはこのビデオはエンターテイメントと分かりやすさを目的としてジェミニの能力を簡略化して表現することを意図したものであると主張している。 実際、YouTube 上のビデオの説明では、次のことが認められています。 プレゼンテーションが短縮されました これらの目的のために。
Google Bard チャットボットを通じて Gemini で実施されたテスト中に、ジャーナリストは次のことに気づきました。 新しい AI モデルの機能は GPT-3.5 の機能と大きな違いはありませんでした。 これは、既存のモデルと比較して、Gemini に代表される実際の技術的進歩について疑問を引き起こします。
ジェミニの XNUMX つのバリエーション
ニューラル ネットワークには XNUMX つのバージョンがあります。 超, Pro e ナノ。 前者はデータセンターやエンタープライズアプリケーションで動作するように設計されており、後者はBardやその他のGoogleサービスに焦点を当てており、NanoはAndroidでのオフライン作業用に設計されています。 後者については既に発表されていますが、 ピクセル 8 プロ。 Googleはその活用例として、音声録音からの情報の要約を示した。