現実世界の経験で、しなやかに成長していくロボットをつくる | テック＆トーク | ストーリー

さまざまな環境でタスクをこなせるロボットを実現するために、

ロボット基盤モデルの構築を目指しています。

「狙い通り」に動かす原理を求めて

私はこれまで一貫して、「ロボットの運動を、知覚や学習と結びつけて高度化する」というテーマに取り組んできました。ロボットの動きを、いかに速く、正確に、そして柔軟に実現するか。そこに、私の研究者としての軸があります。

大学時代は、企業との共同研究を通じて、生産現場で使われる工作機器や産業用機械の制御技術を研究していました。目的は明確で、いかに生産性を高めるか。そのために、機械を「思った通り」に、「狙った通り」に動かす、その原理を突き詰めるという研究でした。豊田中央研究所に入社後、研究対象は、より汎用性の高いロボットへと広がっていきました。車輪とロボット本体の力の関係性をどう扱い、制御すればよいのか。制御理論をベースに、より応用範囲の広い研究に取り組むようになりました。中研入社から一貫して制御という文脈で研究を続けてきた私に、2015年ころ、当時の上司から「目線を変えて、AIを研究してみないか？」という提案がありました。そこで、AI研究の最前線のアメリカ西海岸へ研究の場を移すことになりました。

2017年からスタンフォード大学で2年、そして2022年からカリフォルニア大学バークレー校（以下、「UCバークレー」）で４年過ごした海外での研究生活は、私の研究人生の大きな転機となりました。振り返ると、人工知能（AI）の技術が急速に発展し始めた時期に、海外でそのダイナミズムを肌で感じつつ研究できたのはとても幸運だったと思います。

ロボティクスを劇的に変え始めたAI技術

スタンフォード大学で研究をしていた2017年前後は、GAN（Generative Adversarial Network：GeneratorとDiscriminatorの2つのネットワークを競わせながら学習することで、高品質な画像を生成するAI技術）が急速に注目を集めていた時期でした。画像生成だけでなく、画像補完やドメイン変換、シミュレーション生成など応用範囲が急速に広がり、「現実世界に近い情報をAIが自ら生成できる」可能性が強く意識され始めていました。特に、視覚情報を扱うコンピュータビジョン分野では、深層学習によって画像理解と生成の両面が大きく進展し、ロボティクスにおいてもシミュレーション環境の構築や視覚ベース制御への応用が活発化していきました。

また、UCバークレーに留学する前の2021〜2022年頃には、拡散モデル（Diffusion Model：画像に加えたノイズを段階的に除去する過程を学習することで、高品質な画像を生成するAI技術）が急速に注目を集め始めていました。従来の生成モデルを大きく上回る品質の画像生成が可能となったことで、生成AI研究は大きな転換点を迎え、画像だけでなく動画や3次元形状、さらにはロボットの動作生成への応用可能性も議論されるようになりました。こうした「生成」と「行動」を結びつける研究潮流の拡大は、ロボットラーニングという新しい研究領域が急速に発展していく背景の一つとなっていました。

このようにロボティクスにおけるAIの重要性が高まり続けるトレンドの中、UCバークレーでは、ロボットラーニングを主軸に、視覚情報と行動生成を結びつける研究に本格的に取り組みました。特に、カメラ画像などの高次元な知覚情報を入力とし、ロボットの運動制御までをエンドツーエンドで学習する手法に注力しました。ここで重要だったのは、単にニューラルネットワークで動きを「当てる」のではなく、ロボットが持つ運動学やダイナミクスといった制御的な構造を、いかに学習の中に組み込むかという点です。私は制御をバックグラウンドに持つ立場から、モデルベースの考え方や安定性・再現性といった観点を意識し、ロボットが現実世界で継続的に動き続けられる学習手法を模索してきました。この経験を通じて、ロボットラーニングでは、AIだけでなく制御、認識、学習がそれぞれ高いレベルで融合することが技術の深化に大きく寄与するという実感を得ています。

: 拡大; UCバークレー時代にVLAの研究で用いたロボット実機を手に

海外で学んだ優れた研究者の流儀

海外での経験は、私の研究者観を大きく変えてくれました。研究を共にする人たちに恵まれたことは、その要因の一つです。特に強く影響を受けたのが、UCバークレーで指導を受けたSergey Levine（セルゲイ・レビン）准教授です。彼自身が誰よりもハードワークをし、学生一人ひとりを非常に丁寧に見る。その姿勢が研究室全体の文化をつくっていました。一つの論文を書き上げれば、すぐに次の研究が始まる。多くの人がやりたがらない、タフなテーマにも正面から向き合う。研究はある種の競争であり、そこから逃げないことが、最終的に大きな成果につながる。そのことを、身をもって学べたことは、私の研究への姿勢に良い影響を与えてくれたと感じます。

アメリカでは、研究するポジションを確保すること自体が競争です。日本のように、大学院に進学すれば自動的に研究できるという環境ではなく、学部生のうちに認められなければ研究のスタートラインにも立てません。そんな環境を目の当たりにして、自分の武器を活かすこと、その強みをアピールすることの重要性に、あらためて気づかされました。日本では「専門性」がクリティカルな武器だと考えられがちですが、それだけでは研究は広がりません。私の場合は、制御をやってきたというバックグラウンドが武器ですが、その軸足だけに頼っていると、研究は次第に小さくまとまってしまう。軸足をしっかり保ちながらも、もう一方の足を外に伸ばしていく。その感覚が重要だと思っています。

他にも、異なる領域の研究者と議論する力や、研究仲間をつくる力といったソフトスキルも立派な武器になり得ます。スタンフォード時代の同僚に、とても優秀な研究者がいました。彼は、周りの同僚を巻き込んで研究を進めるのがとてもうまい。ビジョンを示して共感を促すことで、周りの人がいつの間にか研究に協力しはじめ、その結果、研究がどんどんと前に進んでいくのです。このような、ネットワークをつくり広げる力も大きな武器になるということも、海外であらためて学んだことだと思います。

経験し、能力を高めていけるロボットを目指して

2026年3月に4年ぶりに日本に戻ってきた私は、豊田中央研究所・東京キャンパスを拠点に、ロボットラーニング、特にロボットがカメラで捉えた情報（Vision）と言語指示（Language）から、そのまま行動（Action）を生成するVLA(Vision-Language-Action)モデルなど、AIをロボティクスに取り入れるための専門チームを立ち上げて研究を行っています。目標は、工場、レストラン、家庭、オフィスなど、さまざまな環境でタスクをこなせるロボットを実現すること。そのためのロボット基盤モデルをつくることが、今の私の研究テーマです。

ロボットラーニングの面白さは、ロボット自身で動き、経験を集められる点にあります。最初は70点～80点の性能でも、環境と相互作用しながらロボット自身が学習し、どんどん賢くなって100点に近づいていく。自己学習により能力を高めていくことで、人間に勝るとも劣らないほどの柔軟さで、さまざまな環境で多様なタスクをこなせるロボットを実現したい。しかも、どんなロボットにもその能力を持たせられるようにしたい。

ロボットラーニングは、まさに今、世界が大きく動いている分野です。その最前線で、志ある優秀な研究者たちと切磋琢磨し、次の一歩を共につくっていきたいです。