在ChatGPT之后,又一个大模型概念火了——具身智能(Embodied AI)。具身智能作为人工智能发展的一个重要分支,正在迅速崭露头角,成为科技界和大众关注的热门话题,同时在各个领域中展现出巨大的潜力和吸引力。
我们先来了解一下什么是“具身智能”:具身智能,英文名是Embodied Intelligence,简称EI。1950 年,图灵在论文《Computing Machinery and Intelligence》首次提出了机器像人一样能和环境交互感知,自主规划、决策、行动,并具备执行能力,是AI的终极形态。
具体来说,具身智能指的是一种使机器能够通过感知、理解和模仿人类动作的能力,这种智能不仅仅局限于机器的思维和计算能力,而是注重于机器能够像人类一样感知和交互的能力。它包含人工智能领域几乎所有的技术,包括机器视觉、自然语言理解、认知和推理、机器人学、博弈伦理、机器学习等,横跨多个学科方向,是人工智能的集大成者。
按照这个定义,目前具身智能的实例繁多,主要包括机器人技术、自动驾驶汽车和智能制造等。
具身智能和传统AI有什么不一样?无论是ChatGPT,还是其它AIGC,都关注于数据处理和符号推理,对物理世界并不能从实际上产生影响;而具身智能则多了一个身体,通过传感器收集环境信息,利用机械执行器进行物理操作,或者通过机器人等具体实体和人类及环境进行实时互动。所以,对具身智能也能理解成是ChatGPT这类大模型有了身体。
具身智能就是人形机器人吗?具身智能强调的是AI系统具备感知、思考、学习、决策等能力,并且能够和环境进行交互;而人形机器人指的具备人类的外形特征和行动能力的智能机器人,可以双腿行走,通过手臂和身体的协调完成一些功能,还可以通过语音和人类交流互动。具身智能相当于把GPT这类大模型技术引入人形机器人,让机器人具备更强的感知和交互能力。所以,人形机器人是具身智能的物理形态之一,但具身智能并不一定就长成人形机器人的样子,根据使用用途和场景的不同,具身智能也可以是动物、汽车、飞行器等等的形态。
具身智能、AI和人形机器人,三者之间既有区别又有着紧密联系,具身智能可能是AI的终极形态,而人形机器人则是实现具身智能的物理形态之一。
技术层面,我们认为具身智能最先解决的可能是人机交互问题,现有GPT等多模态大语言模型已经开始应用,让机器人听得懂人的语言指令;其次解决机器人的决策能力,即分析、推理、判断等能力,深度学习、神经网络、强化学习等将是机器人重要的学习手段;最后解决机器人的执行能力,让机器人处理现实中的复杂任务。
考虑到降本周期、应用难度、市场接受度等因素,最先应用的落地的可能是价格不敏感的、应用难度较低、市场接受度较高的机器人类型,排序如下:
商用服务机器人:接待机器人、迎宾机器人、服务机器人、导购机器人等,商用场景的价格敏感度较低,应用场景简单,市场接受度高,或成为最先落地的场景;
特定行业的功能型机器人:电力巡检类操作类机器人、轨道交通的检修机器人、矿山里的机器人、农业机器人、建筑机器人等,此类环境危险恶劣,对机器人的需求度高价格不敏感;
家庭服务机器人:家务机器人、陪伴机器人等,toC 场景的价格敏感度较高,并且家庭是非结构化环境,外部环境和任务较为复杂,因此落地进度或慢于toB 场景;
通用型人形机器人:人形机器人具有最完善的具身智能,能够集成各项人工智能技术,也是最为通用的机器人类型,潜在应用空间最为广阔,或成为机器人的终极形态。
而具身智能不一样,它是以主人公的视角去感受物理世界,自我学习,并且给出自己的感受和反馈,也就是说它不再是简单的接收数据,同时也可以自主获取外界数据。
发展科技的根本目的是为了更好的造福全人类,人工智能也不例外,它的发展方向一定是更好的辅助人类提高生产力,而这一切的前提是让它能够和现实的物理世界产生互动和接触,理解人类社会,而要做到这一点,具身智能是前提。
尽管具身智能还面临许多挑战,但毫无疑问,这是人类科技发展的必由之路。具身智能的发展有望为人类带来新一轮的科技变革,它的应用领域将更加广泛,从服务机器人到医疗护理,从智能交通到工业制造,都有望得到具身智能的加持和推动,期待具身智能在未来的发展中,为人类社会带来更多的创新和进步。
返回顶部