ロボットがロボットを作る時代が来る
■VLAモデル:ブラックボックスへの解
フィジカルAIが社会実装される上で、最大の障壁は「AIがなぜその行動を選んだか」という不透明性であった。この課題を打破したのがVLA(Vision-Language-Action)モデルである。
NVIDIAは自動運転向けの統合モデルに、オープンプラットフォームの「Alpamayo」を発表した。「Alpamayo」は従来の「AIが状況を見て反応するだけ」の自動運転から一歩進み、「なぜその操作をするのか」を論理的に説明できる統合AIを目指している。これは物理世界の状況を理解・推論する高度モデルで、自動運転開発の基盤となると期待されている。
CES2026におけるNVIDAのプレゼン画像はこちら
実際にどのように機能するのだろか。このモデルは、AIの挙動を単なる運動指令に留めず言語化(Language)して記録するところがポイントだ。例えば「右から子供が飛び出してきた」と認識し(Vision)、そして衝突回避のために緊急制動を行う(Action)と判断。その理由として「衝突を避けるためにブレーキを踏んだ」と自ら言語化する(Language)。このように問題が起きても、トレーサビリティ(追跡可能性)の確保こそが、AIに命を預ける「安心感」の根拠となる。
■AIへの期待
自動車産業は「生成AI」から「フィジカルAI」へ主戦場が移ったが、色々なAIを適材適所で使うことで、産業が大きく進化できるはずだ。たとえば:
①:文書作成・設計支援・ソフト開発支援(生成AI)
②:AIエージェントによる業務プロセスの自律化に進化
③:フィジカルAIによる「動く知能」へと進化
とくにモビリティ分野では、クルマは「物理世界で動く巨大ロボット」と同じで、各種センサ、アクチュエータ(動くモノ)、エネルギーを統合する機能をもっているので、フィジカルAIは自動車AIの本丸と位置づけられる。
ウェイモの自動運転タクシー画像はこちら
具体的には労働力不足や交通事故といった深刻な社会課題を解決する強力な武器になるだろう。しかし忘れてはならないのは、技術はあくまで手段に過ぎないということだ。AIが肉体を得た今だからこそ、私たちは「どのような社会を築き、どのような生き方を望むのか」という、より高い次元のヴィジョンを描くことが大切ではないだろか。
2026CESでは、韓国の自動車メーカーヒョンデが出資する、ボストンダイナミック社のロボットを披露した。ここで使われるAIは自動運転と同じフィジカルAIだが、ヒョンデはAIロボットを量産することを発表している。きっとロボット生産工場で働くのは、ロボットが主役となりそうだ。すごい時代が来たもんだ。