首页 > 资讯 > IT业界
揭秘特斯拉如何训练 Optimus 机器人:人类员工最辛苦,亲自上阵教动作
2025-11-03 16:10:27 IT之家 39111

11 月 3 日消息,《商业内幕》昨天发布长文,介绍特斯拉 Optimus 机器人平日是如何“受训”像人类一样行动的。

在特斯拉工程总部的玻璃墙实验室里,数十名员工不断重复日常动作:举杯、擦桌、拉开窗帘。在八小时轮班中,每个动作都要重复数百次,头盔和沉重背包上的五台摄像机会记录整个过程。马斯克有时会前来观看,特斯拉投资者也会定期参观演示。

一名前员工直言,这种工作感觉就像是“显微镜下的实验鼠”。而这些操作的目标非常明确:教会特斯拉机器人 Optimus 像人类一样移动。

马斯克将 Optimus 视作特斯拉业务的关键。在第三季度财报电话会上,马斯克更是称其为“有潜力成为有史以来最宏大的产品”,并预计年产量将达百万台。他还预测,Optimus 未来可能占特斯拉整体价值的约 80%。

据了解,特斯拉希望 Optimus 能完成工厂操作、家务和护理等各种各样的任务。而数据采集员的工作,就是为 Optimus 替代人类劳动打下基础。

《商业内幕》采访的 5 名现任及前员工表示,这份工作在体力消耗大且有时会颇为“荒诞”的同时,却又极其精细。他们需要跑步、下蹲、跳舞,如果动作被认为“不够人性化”,表现就会受到批评。

“像给婴儿上课”

训练机器人并非一项光鲜亮丽的工作。

大多数数据采集员最初的任务是擦桌子,有时要持续数周。一名前员工说:“你要走一步,擦桌子,重置姿势,然后再重复。这就是不断循环,直到休息时间。”

根据员工披露的信息,员工会收到详细文档说明如何完成简单任务,并由厚重、持续更新的手册指导。员工还会与同伴配对,以确保任务正确完成。“特斯拉对每个动作都有严格要求,对肉体和精神来说都是考验。”

自数据采集开始以来,员工主要穿着动作捕捉服远程操作机器人,通过手动动作教它。今年 6 月,特斯拉曾通知员工,将从动作捕捉和远程操作转向仅用摄像机进行数据采集。

员工表示,身上的摄像机指向各个方向,可精确记录数据采集员在环境中的位置。团队被告知,如果不使用动作捕捉服,数据采集会更高效。

自 6 月的这次调整以来,公司引入了多种新训练方式,包括在员工执行任务时在周围设置摄像机。员工有时会佩戴触觉手套,以追踪手部细微动作。马斯克曾称,为 Optimus 开发人类手部结构是一项“极其艰难的工程挑战”。

员工还会录制彼此模仿动作。在加州弗里蒙特工厂,数据采集员佩戴头盔和背包时整理车辆零件并操作输送带,两人表示。专家称,为同一任务收集不同数据点有助于训练。

一名前员工表示,部分任务非常简单,就像“教婴儿”。两名数据采集员录制自己完成为婴儿设计的益智玩具:按大小或颜色套环,或将形状放入对应槽。

三人表示,特斯拉还开始使用 AI 生成提示来辅助训练。在某些训练中,员工通过头戴设备接收 AI 提示,设备通过连接到 13.6 至 18.1 千克的背包。这些沉甸甸的背包通常佩戴在员工身上,有时也会放在椅子或桌子上。

员工说,训练内容包括下蹲、跳“鸡舞”、模仿猩猩、假装吸尘、短跑、假装打高尔夫和扭臀舞。每个动作需在三至五秒内完成。根据两名员工的回忆,有些任务会让自己感觉不适,包括 AI 生成的要求四肢爬行或脱掉衣物。

“堪比每天都在做有氧运动”

这些看似随机的任务有助于特斯拉发现需要改进的领域。但同时,这项工作会消耗大量体力。一名前员工形容称“堪比每天都在做有氧运动”。

一名前员工在训练时背部受伤,背包不平衡的重量让自己感觉“总像一瘸一拐地走”,因此请了病假。“右腿失去知觉,背部剧痛。”还有员工称看到同事因工作性质出现背部和颈部伤害。

不仅如此,远程操作时,动作捕捉服和 VR 头盔可能引发问题。图像质量差、长时间佩戴会导致严重晕动症,机器人摔倒时尤其令人迷惑。“你会感觉自己在摔倒,因为你看到的是机器人的视角,但实际上你是直立的。”

目前,远程操作主要用于投资者参观。一名前员工说:“投资者希望看到机器人实际移动,当我们在动作捕捉时,我们控制机器人让动作更流畅。”

两名前员工表示,投资者有时会和马斯克一同观看,马斯克曾带五岁的儿子 X 参观。一名前员工称演示像“大型表演”:“感觉就像在演戏一样。”

机器人执行需要弯腰或倾斜的任务时,半数时间会摔倒,有时还会损坏昂贵设备。三人称,除非任务需要移动几米以上,否则通常会绑在支撑框架上。

有员工披露,在特斯拉办公室这样的可控环境中,机器人应该轻松保持直立。他说:“让它站立并保持平衡应该是首要关注事项。”曾有超过 100 人参与数据采集。公司在九月的半年绩效评估后裁掉数十名数据采集员。员工会根据完成任务的表现评分,并收到从身体角度到位置摆放的反馈。

数据采集员有在线仪表盘,会根据数据质量和数量打分,每班次需收集至少四小时可用视频素材。如果视频被评为不合格,例如位置不正确,员工可能受到惩罚。

工艺中国 工艺中国