近日,OpenAI领投挪威人形机器人公司1X Technologies 2350万美金。
据悉,1X公司原名为Halodi Robotics,成立于2014年,主要生产人形机器人,公司共有60多人。1X公司将用这笔资金来加大其即将推出的双足机器人模型NEO的研发力度,以及在挪威和北美大规模生产其首款商用机器人EVE。
3月28日,追觅科技也在上海新品发布会上也推出了两款机器人产品——通用人形机器人和仿生四足机器人Eame One二代。
当日,机器人板块反复活跃,人形机器人相关话题被大量讨论。
要知道,人形机器人的梦,已经做了近百年。
从1927年世界博览会上展出“Televox”,到之后的日本丰田、本田和波士顿动力,百年来“造人”的公司前赴后继,但囿于人形机器人动态平衡、运动规划等技术难题和批量生产的困难,人形机器人的大规模落地始终还是个梦。
那么,ChatGPT的加入,能为人形机器人梦想的落地按下加速键吗?
1、构想:人形机器人有望更智能
事实上,当前算法和数据规模的限制,在严重影响着人形机器人的智能程度。
通常而言,人工智能技术和应用飞速发展要依赖三大要素:数据、算法和算力。
算法决定了人工智能的行为模式,一个人工智能系统即使有当前最先进的计算平台作为支撑,若没有配备有效的算法,人形机器人只会像一个四肢发达而头脑简单的“人”。
因此,目前市面上很多人形机器人都只能在少量垂直应用方向上接近或超越人类的智能表现,在很多领域上都属于“弱人工智能”,即不具独立思考能力,就像各种语音助手。
它们的动作僵硬,本身并没有“智能”的成分,仅因为长得像人,所以它们的“凝视”“走路”等简单动作,都能带给人无尽的遐想。
那么如何完成从“弱人工智能”向“强人工智能”的关键一跃?
ChatGPT提供了新的解题思路。
ChatGPT有着先进的算力系统和强大的自然语言理解和沟通能力,数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天)。
业内不少人士认为,ChatGPT的AI技术可以解决机器人的自主语音交互难题,为人形机器人注入“灵魂”。
1X公司也表示,希望通过人形机器人来实现ChatGPT在机器人领域应用落地,解决过往机器人行业软件端算法和数据能力落后的问题。
有行业专家表示,类似ChatGPT的AI大型语言模型,在长期能更好地训练机器人学习算法和处理更复杂更大规模数据集的能力,而且有助于机器人理解人类语言、行为和环境,加速人形机器人在任务完成、自主学习、适应能力、仿生体验等领域的进化。
即“ChatGPT+人形机器人”将让机器对人类意图的理解有跨越式的质变提升,人形机器人即将迎来新一轮“进化”,有望带来更大的市场增长。
弗若斯特沙利文预测,到2026年,全球人形机器人市场规模将达到80亿美元;高盛预计,到2035年,在蓝海市场情景下,人形机器人市场能够达到1540亿美元的规模。
2、现实:日常动作的完成仍是难题
不过,回到现实,即使解决了人形机器人的智能问题,也还有太多的技术瓶颈亟待突破。
人形机器人的构架通常为:大电池组+电机驱动+刚性金属传动+串并联关节分布+视/力/位传感器。各部位的协调配合,保障了人形机器人日常动作的流畅。
例如,人形机器人的下肢对力量、稳定性和肢体动作的连贯性有着很高的要求。要达到像人类一样自然地走路,需要与激光雷达、配套传感器、摄像头以及算法配合。
但大部分人形机器人都难以解决这一难题。例如小米的铁大CyberOne,步速为3.6km/h,实际上连老年人的平均步速都跟不上。
另外,在人形机器人的关节扭矩方面,与之紧密相关的是减速机和伺服电机等零部件。以减速机为例,机器人常用的是RV减速机和谐波减速机。RV减速机用于机器人的腿部、腰部和肘部等承重关节;谐波减速机用于轻型、小型的末端部位,比如小臂和腕部。
然而,谐波减速机重量轻但扭矩有限,RV减速机扭矩大,但重量体积也较大。同样,行星减速机、单极行星减速机、双极行星减速机等也都面临这样的两难抉择,要想让人形机器人达到人类关节的灵活程度,几乎不可能。
此外,抓取与力感知能力的不足,也同样使人形机器人在运行时极不流畅。毕竟动态的步行只是体现了机器人的移动能力,而操作性能就直接决定了机器人能够去做什么。
譬如“擎天柱”的每只手拥有11个精细的自由度,结合控制软件,能完成像人手般复杂灵巧的操作,并能承担大约9公斤的负重。追觅科技的人形机器人也拥有五指,而小米“铁大”的手并没有手指,它能开门、抓握,但碰到一些精细活儿,只能一筹莫展。
3、落地:商业应用困局
持续困扰着人形机器人的,还有商业化难题。
此前哈工大推出的“HIT-III”机器人能上下斜坡、“汇童”机器人可完成“摔滚走爬”等动作,优必选的“Wallker”则能上、下台阶,目前已经可以弹琴、倒水和步态行走。特斯拉的擎天柱还能浇花、此前本田的阿西莫具备跑、跳、爬楼梯甚至跳舞等功能。
特斯拉擎天柱机器人,图源网络
但哪怕“大佬”如本田和波士顿动力,也没有成功踏入商业化进程,波士顿动力更是几度被收购。
最根本的原因,是人形机器人太“贵”了,并且没找准适用场景的人形机器人,也显得过于“不实用”。
本田的阿西莫机器人售价250万美元,波士顿动力的Atlas,单台售价200万美元,小米的CyberOne,成本约60—80万人民币。此前高工移动机器人曾报道,业界一台人形机器人的造价在10—15万美元左右。
而宣布最终价格会控制在2万美元以下的擎天柱,也限制了其采用性能更好的材料方案,例如扭矩更大的液压驱动,新型的皮肤材料或合成的软体肌肉。
追觅科技走的是另一条路子,据公开报道,追觅科技已实现对高速马达的自动化生产,推动供应链国产化。这能在一定程度上控制成本,有助于大规模量产人形机器人。
不过商业的本质,最终还是回归到落地上。人形机器人究竟适用于哪些场景?对比其他机器人,造价昂贵的人形机器人落地场景有何创新之处?
如今人形机器人的商业应用场景主要以娱乐社交、陪伴看护等日常生活服务为主。同时,机器人产业总体上被视为一些国家地区出生率下降和劳动力萎缩的解决方案。但高昂的售价与极低的性价低意味着人形机器人尚且难以实现面向家庭场景的大规模普及。
本田曾尝试让阿西莫成为接待员,为IBM等几家公司提供租赁服务。
但阿西莫每个月的租赁费用高达1万美元,比人类接待员的薪水高出一大截,而且只能做一些简单的肢体动作,性价比极低,让企业望而却步。
即便用得起,阿西莫那些看似“丰富”的功能,在应用场景也有太多限制:不能提拿重物、不能适应复杂环境、续航不长,语音互动不够智能。
面对这个问题,马斯克的思路是,第一批机器人主要在B端应用,服务于危险、无聊、重复的工作或人们不想做的工作;第二批大规模使用的机器人,让机器人在现实世界中导航,无需指令也能做有用的事;第三批是预计不到10年后,人们可以在家里使用的机器人。
但规划的另一面是,2022年特斯拉出原型机,然后还要再花上一年时间去探索应用场景。
梦想的落地终究还需要更多的积累与铺垫,要挖掘出人形机器人的独特竞争力,还需要更多时间与经验的双重作用。