Google DeepMindがGemini Roboticsをデバイス上に搭載、ロボットシステムへのローカルAI統合を実現
簡単に言えば Google DeepMind は、インターネットなしで効率的にローカル操作できるように設計された、双腕ロボット向けの初の微調整可能な VLA モデルである Gemini Robotics On-Device を発表しました。
GoogleのAI部門は、 Google DeepMind ローカルに展開可能なロボットモデル「Gemini Robotics On-Device」を発表しました。このモデルは、外部ネットワークに依存することなく、ロボットハードウェア上で効率的に動作するように設計されており、様々なユースケースにおいて、汎用的な器用さとタスク適応性に関する高度な機能を実証しています。
このモデルは、 ロボット は、インターネット接続が不安定な環境やインターネット接続がない環境でも、レイテンシを低減し、動作の安定性を維持します。双腕ロボットシステム向けに設計されており、最小限の計算能力しか必要としません。
Gemini Robotics On-Deviceは、リアルタイムで器用なタスク実行をサポートし、新しいタスクへの微調整と自然言語コマンドの解釈を可能にすることで、以前のGemini Roboticsモデルの機能を拡張します。このシステムは、柔らかい物体の操作や複数ステップの指示の実行など、視覚的および意味的に多様なタスクの処理において、一貫したパフォーマンスを発揮します。
評価の結果、このモデルは様々な条件において優れた汎用性を示し、複雑なシナリオにおいて同等のデバイス内システムよりも優れた性能を発揮することが示されています。局所的な制約を超えた高度な機能を必要とする開発者向けに、Gemini Roboticsモデルの代替バージョンもご用意しています。
ジェミニ・ロボティクスのオンデバイスは、安全性と責任あるイノベーションを重視して開発され、微調整が可能な最初のVLAモデルになりました。
Gemini Robotics On-Deviceは、このシリーズのVLAモデルを微調整可能な形で初めて提供した事例です。このモデルは変更を加えることなく様々なタスクを実行できるだけでなく、特定のアプリケーションにおけるパフォーマンスを向上させるための適応も可能です。適応は比較的少数のデモンストレーション(通常50~100回)で実現でき、モデルが基礎的な能力を未知のタスクに適用できる能力を実証します。
この 開発 Gemini Roboticsの全モデルは、確立されたAI原則に準拠したフレームワークに準拠しており、セマンティックとフィジカルの両方の側面に対応する包括的な安全戦略を組み込んでいます。セマンティックおよびコンテンツ関連の安全性はLive APIを通じて監視され、低レベルのセーフティクリティカルコントローラが統合され、物理的な動作の実行を管理します。システム全体の評価にはセマンティック安全性ベンチマークが導入されており、レッドチーム演習を含むターゲットテスト手法を用いて安全性関連の弱点を特定することが推奨されています。
モデルの現実世界への影響に関する監督は、責任開発・イノベーションチームによって行われ、潜在的なリスクと社会的影響を評価します。これらの結果は責任・安全評議会によってレビューされ、その勧告はモデルの継続的な開発に反映され、潜在的な危害を軽減しながら肯定的な成果を高めることを目指します。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
先物取引と取引BotにESUSDTが登場
TANSSI セービングに申し込んで15%のAPRを獲得しよう
先物取引と取引BotにTACUSDTが登場
先物取引と取引BotにVELVETUSDTが登場
暗号資産価格
もっと見る








