2025年10月10号,特朗普刚宣布,针对中方采取稀土新规,美国要从11月1号起,征收百分之百的关税,如今离这时间还剩半个多月的时间,一场牵动全球市场...
2025-10-15 2
最近MIT计算机科学与人工智能实验室,就是常说的CSAIL,跟丰田研究院一起搞出个“可控场景生成”技术。
这东西专门解决机器人训练的大难题,ChatGPT这些聊天机器人靠网上的文本数据就能写诗、调代码;
但机器人要当家庭助理叠盘子、进工厂搬东西,光有文字可不行,得看真实环境里的动作演示。
之前听人聊机器人训练数据的事儿,就觉得这活儿太费劲。
要让机器人学抓取东西,得拍一堆操作视频当教材,可拍的时候不仅耗时间,还很难保证每次动作都一样。
要是用AI生成模拟数据吧,又常跟真实世界的物理规律脱节,比如让机器人学放杯子,模拟里杯子可能直接穿桌子过去。
手动建数字环境更别提了,成本高到离谱。
这技术出来,算是把这些坑都填上了。
这技术的底子,是一个装了4400万个3D房间的数据集。
这些房间里啥都有,桌子、盘子、柜子,相当于给AI准备了一个超大的“道具库”。
它生成场景的方式,有点像AI在空白画布上“画画”,业内叫“内部绘制”,先弄出个厨房或客厅的框架,再往里面填各种物体,还得调整位置让场景符合物理规律。
本来想,不就是生成个3D场景吗?后来发现没这么简单。
它得保证物体不“穿模”,就是叉子不能穿过碗、杯子不能陷进桌子里,这些在3D图形里特常见的错误,它都得避开。
这背后靠的是扩散模型,一种能从随机噪声里生成图像的AI系统。
跟普通生成图像不一样,它会朝着“像真实生活场景”的方向调整,比如生成厨房时,会自动把碗放在桌子上,而不是悬在半空。
之前看机器人行业的报告,说现在大部分训练数据都是简单模拟的,机器人到了真实环境里,出错的概率特别高。
这技术刚好能解决这个问题,它生成的场景既多样又真实,机器人在里面练得熟,到了现实中自然少出错。
有了生成场景的基础能力,还得让场景更符合机器人训练的需求,这时候就需要两个“聪明策略”来帮忙了。
一个是蒙特卡洛树搜索,简称MCTS,这东西之前帮AlphaGo赢了人类围棋高手,现在被用到场景生成上。
它会让AI先想出好几种场景方案,再挑最符合需求的,比如要场景里多放可食用物品,或者物理规律更严谨,它都能做到。
实验里有个例子特直观,在简单的餐厅场景里,MCTS帮着加了34件物品,还堆了好几层点心蒸笼,而之前训练数据里的场景,平均才17件物品。
这种“举一反三”的能力挺绝的,能让机器人接触到更多样的训练场景,总比老在重复的环境里练强。
另一个策略是强化学习,简单说就是让AI“试错”找最优解。
先让AI用初始数据学基础,再进入第二个训练阶段:设定一个“奖励规则”,比如场景越符合用户指令,得分越高。
AI会慢慢琢磨怎么生成得分高的场景,最后生成的场景,往往跟原来的训练数据差别很大,但实用性更强。
用户还能直接给指令,比如“厨房桌上放一个碗和四个苹果”,它都能精准实现。
之前测试过,生成食品储藏架场景时,按指令来的成功率很高,比MiDiffusion、DiffuScene这些同类方法都强。
甚至还能补全场景,比如你说“用同样的东西,换个布局”,它就能把苹果分到不同盘子里,或者把棋盘、书摆到架子上,灵活性是真够高的。
这技术最实在的价值,是给机器人提供了“理想的练习场”。
研究人员能在这些虚拟场景里,记录机器人怎么跟物体互动,比如精准把刀叉放进餐具筒,或者在不同3D环境里摆面包。
每一次模拟都跟真的一样,机器人练熟了这些动作,到了现实中就能直接用。
MIT的博士生NicholasPfaff说过一个关键发现:用来预训练的场景,不用跟最终想要的场景完全一样。
靠他们的引导方法,AI能跳出原来数据的局限,生成更适合训练机器人的场景。
这一点太重要了,毕竟不可能为每个训练需求都专门做一套预训练数据。
像亚马逊搞仓储机器人,之前采集训练数据得花半年时间,用这技术估计一周就能搞定,能省不少功夫。
丰田研究院也在做家庭和工业机器人,这技术对他们来说,相当于提前给机器人“踩点”,减少到了真实环境里的适应时间。
当然这技术现在还不算完美,研究人员说目前更多是“概念验证”。
未来他们想让AI生成全新的物体和场景,而不是只靠现有的“道具库”;
还计划加一些带活动关节的物体,比如能打开的柜子、能拧开的食物罐,这样场景的互动性更强,机器人学开柜子、拧瓶盖也更真实。
他们还想把之前的研究“ScalableReal2Sim”整合进来,那个项目能从互联网图片里提取物体和场景信息,相当于给AI扩充“道具库”。
更长远的计划是建个用户社区,让大家一起创建场景数据,要是能成,用不了多久就能有一个超大的数据集,帮机器人学更多技能。
行业里的专家也很认可这技术,亚马逊机器人公司的应用科学家JeremyBinagia,没参与这个研究。
但他说之前要么程序化生成场景不真实,要么手动建场景太贵,这技术刚好提供了更好的路。
它不仅考虑了物理可行性,还兼顾了3D物体的平移和旋转,比那些只在2D网格上排物体的方法强多了。
丰田研究院的RickCory也评价很高,他有硕士和博士学位,在机器人领域干了挺久。
他说这技术把“训练后处理”和“推理时搜索”结合起来,框架新颖又高效,还能生成那些对机器人任务特别重要的“没见过的场景”。
要是以后能结合互联网上的海量数据,说不定能帮机器人更快在真实世界里落地。
这技术看着挺“专”,但对机器人行业的影响不小。
现在大家都盼着机器人能帮着干家务、搞生产,可训练一直是个卡脖子的问题。
这技术相当于给机器人找了个“超逼真的练习场”,练得越好,落地就越快。
说不定再过两三年,我们家里的机器人能熟练叠衣服、摆餐具,背后就有这技术的功劳。
相关文章
2025年10月10号,特朗普刚宣布,针对中方采取稀土新规,美国要从11月1号起,征收百分之百的关税,如今离这时间还剩半个多月的时间,一场牵动全球市场...
2025-10-15 2
在本周的国际货币基金组织(IMF)和世界银行秋季年会上,全球央行行长和财长将重点讨论股市泡沫及如何应对一场潜在的市场崩盘及其对全球经济的冲击。IMF总...
2025-10-15 2
在吴石案中,有“活阎王”之称的“保密局”局长毛人凤,发挥了至关重要的作用。毛人凤上蹿下跳,推波助澜,最终将吴石案办成了铁案。在吴石案发前,别说是毛人凤...
2025-10-15 2
第47届东盟峰会前夕,东南亚的气氛变得格外紧张。最近,特朗普向马来西亚施压,让他们把中国排除在泰国和柬埔寨和平协议的签署仪式之外,否则他就不出席。这一...
2025-10-15 2
最近,加沙地带的惨状牵动着全球的心弦。在那些倒塌的建筑、流离失所的人群和无尽的悲伤背后,除了传统的炮火轰鸣,还隐藏着一个更令人不安的真相:人工智能!这...
2025-10-15 2
威胁对华加税100%后,特朗普政府遭遇“滑铁卢”,急忙拨打中方电话却被拒接。综合观察者网及新加坡《联合早报》消息,10月12日美国副总统万斯在接受福克...
2025-10-15 2
今天,李湘和王岳伦一起回北京啦!他俩刚在英国伦敦给宝贝女儿王诗龄办完16岁大生日!Angela生日是英国王室风格,排场不小,城堡蛋糕、鲜花布置,挺下本...
2025-10-15 1
婚礼当天,婚车里的争吵究竟有多激烈,才能让一个29岁的男人说出“这婚我不结了”,然后毅然跳入河中?又到底是什么样的委屈,能让一个人在大喜日子愤然去死呢...
2025-10-15 3
发表评论