图源:《西部世界》

许晨光本以为,这项工作难度跟组装宜家橱柜差不多,哪晓得路上的坑一个接着一个,填到现在,他已经解锁了机电、雕塑、解剖等一堆新技能。在许晨光的努力下,一条机械手臂投入训练工作,这只是一个阶段性的成果,接下去,他还要为机器人添上另一条手臂、整个上半身躯干,以及头部和面部表情。

看得懂人的车

短短2年间,在路上奔跑的AliOS互联网汽车已有数十万台。而互联网汽车热销,多模态交互系统功不可没。

触屏、语音、人脸、手势相结合的多模态交互系统,能够为司机带来颠覆性体验——比如通过人脸识别技术,汽车在认出司机身份后,会按照司机习惯调整好座椅、后视镜、空调风量以及歌单,就连油门灵敏度和换挡逻辑,也可以根据司机驾驶习惯设定。人车之间,不仅可以通过“语音+触摸”的方式交流,还可以通过“语音+手势”或“快捷手势”沟通。

AliOS还在不断进化,今年6月下旬,许晨光所在的团队,主要任务就是支持包括手势识别、语音识别等多模态交互的升级测试,进一步将工具硬件化和产品化。

当老师的代价

AliOS能看懂人类的手势,是因为应用了视觉计算技术。和其他AI技术一样,视觉计算也要通过基于大量样本的训练,去不断优化模型和参数,这样AliOS才能更准确地识别不同角度的不同手势。

在训练的过程中,团队面临的最大问题在于,缺少手势图形数据,这些手势图形不但对定位精度有要求,还要经过人工打标签才行。

“深度学习的主要特点就是跟数据相关,实际生产中的问题,不是开发一个或者买来一个模型就能解决的。”许晨光想,使用人手的图像数据,需要花大量人力为手势图形打标签,“对于我们这样成本压力较大的部门来讲,这种方式不是最优解。”

朗葛文每完成机器人身体的一部分,就会在网上与人分享制作过程以及所需的材料等,重点是,朗葛文还说“这件事的难度和组装宜家橱柜差不多。”

廉价解决方案

盯着朗葛文提供的开源项目图纸,许晨光认为自己找到了一条捷径。7月中旬,他的办公桌上多了一台3D打印机,然后用随笔记录了整个项目的进程:

第一周:3D打印及加工手指、手掌、前臂等机械手部件,购置Arduino控制板、舵机、杜邦线、电钻、钻头、胶水、3mmPLA丝等部件。

第二周:打印完毕后,连接机械手手指、手掌、手腕、前臂零件装配、舵机安装及传动线,实现了可以通过arduino(开源电子原型平台)控制机械手进行单个手指的屈伸及手腕旋转运动。

3D打印切片软件上一根手指的横截面数据

第三周:终于实现了同时控制多个手指运动,并通过leap motion(体感控制器)实时追踪模仿人手手指运动(手指、手掌、手臂前臂部分基本制作完毕)。

第四周:制作上臂和肩膀部分,期间也在改进手指的机械结构,进一步提升机械的耐用性和控制的精确度。

学解剖找问题

3D打印的过程异常缓慢,许晨光算过,一个5厘米厚的前臂零件,如果一切顺利,也要7-8个小时才能完成。

在组装前臂和肱二头肌的环节中,肘关节一个连接部位出了问题,只要许晨光想测试收起前臂的动作,总能听到“啪”一声脆响,连接部位8毫米厚的塑料零件被掰成了两半,“为什么手臂弯曲90度都不行?

许晨光低头摆弄着零件,在脑子盘算着:是不是零件在打印的时候参数没调对?3D打印有三四个小时等待时间,他也没有闲着,把没舍得扔掉的零件,拿强力胶粘起来再试,这一次前臂只弯曲到80度就断了。

“啪”“啪”“啪”,当零件第四次断裂时,许晨光抬起头,发现办公室里空空荡荡,就剩下他自己了,时间早就过了零点,他把第五片零件的参数设置好,第二天再赶来测试。

62小时36分钟的努力全报废了

回家后,许晨光下载了《奈特人体解剖彩色图谱》,把这本书中第419页至第454页,关于“肘和前臂”以及“腕和手”的解剖图仔细研究了一遍。在一次又一次的试验中,许晨光最终找到问题所在,通过调节前臂中电机和零件的距离,便能在手臂弯曲时保全零件。“只能靠一次次试验,没有捷径。”

努力不会白费

重压之下,有时候一点小挫折就能造成整个人的情绪崩溃。有天早上,许晨光刚坐上班车,同事就发来了照片和信息,“许晨光,你的设备好像出错了,造出了一堆头发来。”同事还打趣,这不是在设计一个艺术品吧。

看着满屏缠绕着的白线,许晨光不敢放大图片,62小时36分钟的努力,全部报废了。本来坐得很挺的许晨光,猛地向椅背一靠,低垂下了脑袋,“什么都想不了,就想赶紧去看看它。”

看着一堆失败的“艺术品”,许晨光反而静下心来,他拿着小铲子把打歪了的零件一点点铲下来,一边铲,一边找原因,铲完废品之后他明白了,打印头温度不够高,并且在一层层叠加的打印中,没有支撑点让其附着,一层出错,全盘皆输。

调整参数和打印速度,增加支撑力,3D打印再一次启动。62小时36分钟的等待,又开始了。

现在,许晨光的机械手臂很灵活了,可以通过手指屈伸完成数字等手势动作,正在完成上臂及肩部组装,从而支持绝大部分手势操作,并通过与语音、手势、屏幕操作的结合,实现AliOS多模态一体化测试框架,落地到自动化测试的日常检测中。

有时候,许晨光会想起美剧《西部世界》第二季中的一个场景,女一号德洛丽丝是个机器人,利用深度学习,定量数据训练以及对抗神经网络,制造并训练出另一个机器人,男二号伯纳德。“比起德洛丽丝,我只是一个制作工具的人。”许晨光说。

就下来许晨光想要和女儿一起制作个机器人

加入社群

机器人大讲堂Rob社群开始招募啦!如果您正在从事或想要从事机器人行业、想要学习这一方向,都欢迎您加入我们共同探讨机器人前沿科技。

由IEEE(国际电子和电气工程师协会)机器人与自动化学会主办,北京理工大学等单位承办的2018年IEEE-RAS仿人机器人国际学术会议( Humanoids 2018)将于2018年11月6日至9日在北京友谊宾馆举行。大会主席由黄强教授、戴斌教授共同担任。

现已全面开启企业赞助和招展通道,强烈推荐机器人、科研仪器等与高校合作有关的企业参展。

联系人:堂博士 13810423387(同微信)

IEEE-RAS仿人机器人国际会议是仿人机器人领域最权威、最有影响力的国际学术会议,从2000年开始在全球各国巡回举办,目前已成功举办了17届,会议涉及的信息具有极高的前瞻性和应用价值。2018年IEEE-RAS仿人机器人国际会议首次在中国举行。

查看原文 >>
相关文章