2025世界人形机器人运动会前不久落下帷幕。在为期三天的赛程中,机器人们在田径、武术、拳击等26个赛项中展开竞技,为观众带来了一场科技与体育交相融合的视觉盛宴。此次运动会不仅是一场比赛,更是人形机器人技术发展的重要展示平台。在比赛过程中,机器人的机械结构、人工智能、大模型、光学、传感、材料等多学科技术得到检验与推动。
值此盛会,瞭望智库专访了清华大学自动化系研究员赵明国,一起探讨人形机器人的发展和应用。
重点不在于拿第一
瞭望智库:您认为前不久落幕的2025世界人形机器人运动会的意义在哪里?我们应该怎样看待类似比赛暴露出的机器人存在的一些问题?
赵明国:举办2025世界人形机器人运动会,包括今年4月在北京经开区举办的人形机器人半程马拉松赛,很大的初衷是向社会进行科普展示,希望更多人了解人形机器人能做什么。它具有科普和向社会推广的意义。
目前是人形机器人技术发展和商业化的初期,大家对人形机器人的期望远高于它现在具有的能力,因此人们会看到马拉松上出现的摔跤或者更换电池等问题。这些问题都是在面向大众进行的具有挑战性的展示过程中暴露出来的。举办比赛的目的不是为了获得名次,而是为了在比赛这样的真实场景中发现更多问题,并找准技术发展方向,进行下一步的改进,这样后续迭代会更快。
具体来看,马拉松比赛明显体现出机器人在长期工况下可靠性较低的问题。正常情况下,在展示一个机器人的功能时,短时间之内不会出现电池问题,即便有问题,也不会暴露得那么明显。然而,在比赛情景下的两三个小时的跑步过程中,关节发热摩擦以及电池续航等可靠性问题充分暴露出来,这比平时做测试的时候暴露的问题多,易于后期改进。
同时,问题的暴露也会让大众对目前人形机器人的发展情况有一个正确的认知和了解。尽管人形机器人的发展已经有了很大进步,但是短期内还不能进入家庭服务。这让大家的心里有一个合理的预期,而不是今年跑马拉松,明年就能到家里帮忙做各种家务。它需要一个健康的发展速度,而非一气呵成。
瞭望智库:本次运动会除了传统体育项目外,还增加了场景赛,例如酒店、医药和工厂场景。这些项目的设置考验了机器人的哪些性能和能力?未来希望看到哪些项目加入比赛?
赵明国:对于人形机器人而言,其核心基本能力有三点。第一点是运动能力,例如速度、动作难度、灵敏度等。第二点是导航能力,在移动过程中,遇到障碍物它会有不同路线的选择,如何选择最优路线。第三点是操作能力,例如抓取货架上的物品。
如果一个系统想完美地将这三个能力组合起来,会面临较大挑战。我们设置这些比赛项目,从不同维度看,是在侧重考察其中一项能力。比如,酒店机器人的应用场景大部分都是平地,对轮式机器人较为友好,但是人流量大,所以对导航能力要求较高,对操作和移动要求不高。比如,人形机器人参加拳击或踢足球等体育赛事,对运动能力和导航能力要求较高,而对操作能力要求较低。不同任务对这三个要素的组合并不一致,但无论如何,几乎每个移动性机器人的测评都由这三部分组成。
对于期望看到加入的项目,我认为不是专业人士、技术人员之间的纯技术性的闭门比赛。既然向社会开放,它就承载着科普的意义,我期望未来能多加入如球类比赛、拳击等不确定性较大的竞技类项目,或人和机器人交互程度较高的项目。
场景类比赛需要机器人完成的任务大都是固定的,可以向社会大众展示能完成的某种操作和任务,但即使操作100遍,其基本逻辑不变,没有太多不确定性。而竞技比赛所带有的不确定性和观赏性,能极大调动大众,特别是小朋友的好奇和热情,长期保持对人形机器人的关注。而对于交互性较强的项目,例如制作咖啡比赛,观众可以表达自己希望制作什么样的咖啡,增强交流互动和参与度。
由简单到复杂
瞭望智库:人形机器人控制系统的发展有何特点?目前技术上的挑战有哪些?您的团队取得了哪些成果?
赵明国:人形机器人的控制系统经历了从简单到复杂的变化,尤其是传感器越来越多。以前工业机器人除了内部传感器之外,对外部环境只需要简单的信息判断,确定是或否即可,剩下的工作按照固定程序完成。
协作机器人在每个关节或者末端需要力矩传感器检测是否与物体碰撞,是否对人造成伤害,并做出综合判断。同时,还需要通过视觉等传感器检测周围是否有障碍物。
除了上述之外,未来在有人的环境中,人形机器人还需要更复杂的传感器。我们希望机器人未来有皮肤,能够感受到温度的变化,有更灵敏的触觉,并且视觉范围更大。甚至有些人希望有第六感,超出正常人的视觉和听觉。因此,对于整个控制系统而言,传感器的样式、种类和数量都会增加。
这带来了大量的数据。我们需要复杂算法处理这些数据得到正确结论,因此人形机器人核心的计算系统也会越来越复杂。例如,原来用DSP来计算机器人的正运动学和逆运动学,现在会过渡到数值迭代的方法来作为优化问题求解。现在我们需要解决人工智能中深度神经网络的相关问题,例如如何理解视觉、如何处理语音或者多模态信号处理,甚至进行逻辑推理。所以未来可能需要一些异构计算系统支撑大量传感器获得的数据并进行计算。所以我个人认为人形机器人的传感器种类会越来越多,计算复杂度也会相应提高,本质上还是核心计算能力的提升。
至于研究成果,我的团队在控制系统上一直进行异构计算,甚至将纯脉冲神经网络的计算方式引入到控制系统中,希望得到一个功耗更低、体积更小的控制系统。同时我个人也做出一些类脑控制算法,希望算法与系统能够匹配。
多场景切换,难
瞭望智库:从春晚扭秧歌到跑步再到竞技比赛,不同场景下使用的机器人可以通用吗?通用的难点有哪些?
赵明国:目前,很难具备一款既能跳舞又能在工厂里工作的机器人,它很难在多场景之间即时切换。各企业为了展示自己的技术,会在某个特定领域做到极致,以展现技术特点、难点。要求一个通用机器人在多个专业领域都达到极致,我认为还不到时候,几乎没有一个机器人表现出特别强的通用性。
通用性是所有人追求的目标。一种思路是,希望机器人先具备通用能力,然后在特定领域进行具体训练或者强化,以便完成垂直性专业领域的工作,这样总体来看成本低、效益大,但难度很高。另一种思路是,把典型的垂直领域做透,通过这些垂直领域总结其中的共性,再在共性的基础上发展出所谓的通用性。目前,这两种路径都有很多人在做,但具体哪条路径能先到具体的场景应用阶段,还没有定论。
难点上,如果想要制造一个通用的机器人,需要从硬件到智能软件全流程覆盖才可以实现,难度非常大。专用机器人在特定问题上进行优化相对容易,虽然在两个领域上可以实现通用,这两者可能没有共性或者共性很少,再去提炼共性就很难。因为思路不一致,很难将它们统一在一起。两者都有自己的优势和难点,看似专用更容易,长期从其中统一一套思路也相对困难。虽然看起来先做通用,再做具体的垂直领域的思路很好,但是这是指后期应用时,最难的是前期如何制造出一个适配所有机器人的产品。
我们人是通用的,具体含义并非指每一个人都是十项全能运动员。例如,举重运动员去打乒乓球,我认为非常困难,需要将力道控制得非常精细,同时还需要具备打乒乓球的细节操作,这难以在一个人身上发生。实际上,每个人都具备解决运动感知、对肌肉控制或者分析问题的能力,所以他能够完成这个运动。所以通用是指人类具有通用能力,而非具体一个人,机器人也是如此。
瞭望智库:在哪些领域或者行业,人形机器人可能率先走向实际应用?
赵明国:前段时间我们已经确定,人形机器人作为具身载体,在教育和科研领域已经开始有小面积的应用。随着人工智能和机器人技术的发展,这部分应用在不断扩大。在此之后,我们认为终极方向是人形机器人要进入家庭,从事各项工作。但大家普遍认为这样的场景环境非常复杂,对人形机器人的要求非常高。再往前推,工厂里面的环境相对简单一些,对人形机器人的要求也会降低。所以人形机器人在进入家庭服务前会先进入工厂。
进入工厂的人形机器人也需要较高的续航和智力标准。目前,人形机器人并未按照进入工厂的标准发展,这需要很长时间并且对技术成熟度要求较高。如果花费时间过长,对行业发展不利。在发展成熟的人形机器人进入工厂之前,最好在中间出现一两个过渡型,保证行业发展的应用场景。
目前机器人竞技类比赛进行得如火如荼,例如足球赛、拳击赛、跑步等,将来可能会拓展到田径大类和各类球赛,这给大众提供了巨大的情绪价值。同时,大众对于机器人的失败也不敏感,反而更吸引眼球,也让大众更加了解机器人本身。这些竞技类比赛未来会成长为类似于电竞比赛这类科技和体育的融合产业。机器人可以替代人类去进行伤害性较大的项目,它们的运动能力在竞技场里面会得到充分展现。这个产业未来很有可能会迅速成长壮大。
在机器人的操作和运动能力得到充分验证后,可以把机器人和探险探索类行业进行有机结合,例如潜水、登山乃至航空航天产业。此外,能与人进行语言沟通和情感交互的机器人也是一个发展重点。例如,导览、导购机器人,它对电量的要求相对不高,但对语言模块的要求较高。
机器人发展的趋势一定是未来应用场景的多样化。一定是百花齐放,有的花可以先开,有的花可以晚一点开。不一定要经历单一的线性发展,而是可以多线发展。
如何更好地为人类所用
瞭望智库:在机器人的道德伦理和使用安全方面,该如何更好地让机器人为人类所用,成为人类的好帮手?
赵明国:很早之前,著名作家阿西莫夫就提出机器人三定律。
【注:阿西莫夫三定律:第一,机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手旁观。第二,机器人必须服从人给予它的命令,当该命令与第一定律冲突时除外。第三,机器人在不违反第一、第二定律的情况下要尽可能保护自己。】
三定律的提出非常有必要,然而从目前来看,我们没有必要过于关注这件事情。目前,人形机器人的智力和能力远不足以支持其成为独立的个体。我们观察到很多机器人失控的场景并不是由于其真的“意识觉醒”、有“情绪”、在“发脾气”,而是纯粹的技术问题。这种技术故障很容易排除,并非人不能控制。
尽管目前人工智能发展非常迅猛,但我们仍不清楚意识的本质是什么,意识是如何产生的。在这些基本的科学问题解决之前,我不认为我们能从工程上制造出意识。尽管有些国外公司在鼓吹人工智能产生意识等消息,我认为这更可能是广告和宣传。
但是,思考这件事情是有一定意义的,因为未来世界一定是人和机器人共存的一个世界。这其中产生的伦理道德体现在哪些方面?我们应该如何使用机器人?机器人对人类社会的影响是什么?机器人的使用是否会涉及人类的隐私问题?机器人是不是一个独立的个体?如果机器人出现错误造成事故,谁应该为此负责?这些问题其实和汽车自动驾驶有一定相似性,是我们更应该关注的。
当下,我认为没有必要过度担忧科幻电影中出现的机器人取代人类、成为人类的敌人这些问题。在未来可视的技术范围内,不会发生这些事情。随着技术的进步,这些问题自然会得到解决。对机器人的伦理道德问题,首先要解决的是随着生活工作中机器人越来越多,人类和机器人应该如何相处,给人类带来的问题应该如何处理,而不用过多考虑机器人是否站在我们的对立面。
编辑:李华山