109. 机器人遭遇数据荒?与谢晨聊:仿真与合成数据、Meta天价收购和Alexandr Wang
张小珺Jùn|商业访谈录 - A podcast by 张小珺

Categories:
今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨,他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即:仿真与合成数据。今天的具身智能尚且没有找到scaling law的有效配方,其中,数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅1%,合成数据挑起大梁。今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。02:00 开始的快问快答02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real的gap、合成数据04:31 从Cruise到英伟达到蔚来,怎么做合成数据和仿真?14:11 制作合成数据的具体流程?合成数据与真实数据的配比?16:17 在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键)32:41 物理的Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点?46:18 Physical Intelligence(π)对仿真与合成数据的两难态度48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang53:57 合成数据目前面临的瓶颈55:25 全球具身智能产业链Mapping:硬件公司(宇树)基座模型公司(π、Skild、英伟达和DeepMind)在垂域落地的软硬结合公司(Figure,特斯拉Optimas、The Bot Company)以仿真为中心做端到端落地的公司(光轮)(“特斯拉Optimas的管理文化和π完全不一样”)01:09:22 美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做“大脑”01:15:33 老黄在内部说:NV is a simulation company01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性)01:23:28 具身智能的产业还在GPT-1阶段,还没找到scaling law的配方01:28:21 我创业刚开始,从具身的本科开始学起01:37:37 最后的快问快答【机器人专场】逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象