机器人的未来取决于人工智能关键技术的发展

2016-12-06 14:30


  目前的机器人已经能够胜任精确、重复性的工作,但很多时候,它还不能够灵活地为新任务进行自我调整,也不能应付一个不熟悉的或不确定的情景。不过,这些情况都在发生改变,机器人正在变得更加智能。我们不禁要问,让机器人实现智能的关键技术到底是什么? 这些技术在最近十年会发展到什么程度? 整个产业的应用前景将会如何?



 一. 感知、认知和行为控制


  机器人的技术按照通常的理解分为三个部分,感知、认知和行为控制。感知主要是基于视觉,听觉及各种传感器的信息处理;认知部分则负责更高层的语义处理,如推理,规划,记忆,学习等;行为控制部分专门对机器人的行为进行控制。


  提到机器人,一个最近经常提及的词是人工智能。人工智能是用计算机来实现类似于人的智能行为的一门学科。机器人本身即是人工智能的一个终极应用目标之一。所以谈到机器人,人们很容易联想到人工智能。人工智能的确对于机器人非常重要,上面提到的三个部分的技术都与人工智能相关。


  从应用角度看,机器人由于有一定的自主性,能与人和环境交互,与之前的计算设备(包括电脑,手机等)相比,对智能的要求较高,这也是人工智能逐渐受到关注的一个原因。


  传统的人工智能做为一门学科,起源于20世纪50年代的达特茅斯会议,后来经过几次大起大落,在基础理论和方法上积累了丰富的成果。从早期的符号计算系统,到专家系统,再到90年代发展起来的机器学习,大数据分析,都可以算是人工智能的范畴。在图像、语音、搜索、数据挖掘、社会计算等领域,又派生出了一些相关的应用研究。其中与机器人联系较为紧密的包括计算机视觉,语音和自然语言处理,还有智能体(Agent)等。


  从技术上看,人工智能要达到人类级别的智能,要走的路还非常远,因为目前对人的智能机理尚未研究清楚。但从实用角度看,根据目前技术的进展,如果能够部分模拟人的智能行为(比如认出主人并进行相应的交互)并达到较好的用户体验,将会在短期内取得突破性进展。当然这在技术研发上还需进一步解决技术的实用性、鲁棒性问题。毕竟以往的不少机器人都还在实验室或者受限的环境中(比如养老院)进行研发和测试,而新兴的家庭服务机器人,将在家庭环境中独立或者半独立地(通过与人的协作)完成某些服务,这对技术的鲁棒性提出了更高要求。其中的一些,如计算机视觉、语音识别等核心技术还在不断地改进中,还没有发展到完全成熟。所有这些,都决定了需相当深入的研发工作,才能实现真正的实用化、智能化的家庭服务机器人系统。



 二. 机器人不是一堆机械和芯片


  在以往对服务机器人的研究中,一个典型的目标应用是机器人可以做家务劳动,这就要求机器人可以用手臂去操作物体(抓放)。在这些方面的研究虽然较多,但从目前的技术进展看,在几年内实现机器人做家务劳动,仍有诸多的挑战。


 1.目前的机器人,尤其是人形机器人的成本过高。举例说,一条机器人的手臂可能需几万美元,而机器人的手部就需要1万多美元,整个机器人的造价,更是普通家庭无法承受的。


 2.机械手的灵巧程度,仍然难以和人手相媲美。


 3.在安全性方面也存在需要解决的问题。有着钢铁之躯的机器人一旦进入家庭,由于程序错误,不小心挥挥手、伸伸胳膊,都可能对血肉之躯的人造成巨大伤害。


  机器人如果暂时不能做家务劳动那又有何用,这是不少人关心的一个问题。如果不能应用,机器人不过是一堆机械和芯片而已。目前除了类似扫地机器人这样能够实现比较单一功能的机器人外,还有不少机器人的用途正在发展之中。


  机器人作为一个新型智能设备,普通用户最关心的是机器人可以为他们做些什么? 如前文所述,机器人目前还难以实现类似做家务这样的应用。而要达到人的智力水平,也还需要较长的发展时间。所以在应用方面也需要针对人工智能技术,特别是感知认知技术的现状进行设计,要充分利用最新技术,实现在过去看来不可能实现的功能。


 三. 关键技术与挑战


  前面提到过机器人的技术领域,包括感知、认知和行为控制。其中行为控制技术相对来说,已经有不少技术积累。而对于在不久的将来可以实际大规模应用的服务机器人,将会更偏向于发展低成本的机器人。诸如机械结构比较简单的轮式机器人(只有轮式移动平台加上一个可活动的头,一般没有手臂或者手臂比较简单),由于其控制部分较为简单,因此在感知和认知方面的技术,显得尤为重要。根据以往机器人领域的研究进展和对应用的初步分析可以认为如下的感知、认知技术,将是实现应用的关键。


 1.三维导航定位技术。不管什么机器人,只要可移动,即需要在家庭或其他环境中进行导航定位。其中SLAM(Simultaneous Localization and Mapping)技术可同时进行定位和建图,在学术研究方面已经有不少技术积累。但对于实际系统,由于实时性低成本(比如无法采用比较昂贵的雷达设备)的要求和家庭环境的动态变化(物品的摆放),因而对导航定位技术提出了更高要求,仍需进一步研发。


 2.视觉感知技术。其中包含人脸识别、手势识别、物体识别和情绪识别等相关技术。视觉感知技术,是机器人和人交互的一个非常重要的技术。


 3.语言交互技术。其中包含语音识别、语音生成、自然语言理解和智能对话系统等。


 4.文字识别技术。生活中有不少文字信息,如书报和物体的标签信息,这也要求机器人能够通过摄像头来进行文字识别。与传统的扫描后识别文字相比,其可通过摄像头来进行文字的识别。


 5.认知技术。机器人需要逐步实现规划、推理、记忆、学习和预测等认知功能,从而变得更加智能。

从目前的研究现状看,服务机器人面对的关键技术均有了长足进步,但还有相当多的问题要解决。


 四. 推动技术的研发与实际应用结合


  英特尔中国研究院的一个重要研究方向是服务机器人,研究范围主要包括鲁棒的三维导航定位、人和环境的视觉感知以及人-机器人交互(包含感知、认知、行为控制的结合)等领域,致力于为英特尔的合作伙伴提供先进的服务机器人技术。


  研究方法以特定的目标应用领域为出发点,并以此来推动技术的研发和在实际应用中的测试。前面提到的助手类应用、少儿教育应用、老人看护应用,是研究重点。


  为了进行应用测试,英特尔中国研究院建立了实际的机器人硬件原型,图3是平板机器人原型。左边是其内部结构,由一个带有英特尔Realsense摄像头的电脑来控制一个全向移动底盘和头部的转动,其高度可调,以便适应成人与儿童的互动要求。


  目前研究院已经在视觉感知等领域取得了阶段性成果。如图4中,显示了利用Realsense摄像头和SLAM技术生成家庭环境地图,这在后续就可用来定位导航。研究院还开发了鲁棒的跟踪技术,可在多人同时出现的情况下,长时间正确地跟踪一个特定用户。在未来还会研发出更多相关技术和应用,这些技术也将服务于业界的合作伙伴助力开发出先进的服务机器人产品。


 五. 推动技术的研发与实际应用结合


  对于机器人技术,大家关心的一个问题是,是否需要采用专用的人工智能芯片。


  目前探索的一个方向被称作混血计算(Hybrid computing),其是指用通用处理器和其他架构一起合作来进行计算。不过,还处于早期探索的阶段。


  一个架构是否能成功地应用于服务机器人,需要看性能是否满足应用的需求,功耗等是否合适,这是一个考虑多种因素平衡的选择。


  可以说现在的通用处理器与已有的一些其他计算单元(如向量处理单元、GPU),已经可以为服务机器人提供一个理想的硬件架构,尤其是多功能的具有感知、认知功能的服务机器人。目前机器人主要的瓶颈,还是在应用需求的开发和感知、认知技术上。当然,未来的架构,也会随着对应用的深入开发而不断创新。硬件设计面临的挑战越来越大,需要不断地适应未来发展的演变。同时也可以考虑用FPGA架构来为一些比较专门的应用提供加速,这样在应用发生变化的时候,将具有更多的灵活性。