亮亮视野AI研究所:眼里有AI,万物可识别
(图片来源:SOOGIF)
毫秒之间识别逍遥法外的逃犯、在行进车流中迅速识别车牌、戴上AR眼镜就能化身专家检修飞机故障、装配汽车……拥有一幅优秀的AR眼镜仿佛拥有了“超能力”。
AR眼镜要想扮演好人类的助手,需要先唤醒AI。从“看见”到 “识别”,对于AI来说是一个神奇又惊险的跨越,尤其是在AR眼镜端这个小巧的设备上要做到高效运行,更是一种极致考验。
作为第一视角识别领域的拓荒者,亮亮视野的产品也是目前屈指可数的真正实现AI在眼镜端独立运算、拥有全栈AI能力的产品,落地场景丰富,涵盖人脸识别、车牌识别、故障识别、物体识别、OCR 识别、QR码识别等多个应用场景。
人脸识别
得益于在AI与AR领域的自主研发技术加持,亮亮视野AR智能眼镜在人脸识别领域一直表现优异。VPU芯片、Laffe引擎以及算法的优化使得人脸识别速度大幅提升,而将计算部署在眼镜端也相比云端识别大幅降低了识别成本。
亮亮视野AR智能眼镜可快速进行身份核验,人脸识别距离达到8米,支持多人脸动态识别,可同时识别10张人脸,响应时间在毫秒级别。支持黑/白名单比对,完成人像的检测采集后,通过与数据库比对,可完成前后端同步预警,实现10万人离线、10亿级人脸库在线识别。目前,亮亮视野人脸识别方案广泛适用于治安防控、公安监管、边防边检、智慧园区、VIP识别等场景。
2018年初,郑州铁路警方率先使用亮亮视野警务智能眼镜,查获了涉嫌拐卖人口、交通肇事逃逸等重大刑事案件的网上在逃人员7名、冒用他人身份证件的人员26名。
今年,亮亮视野的人脸识别解决方案也广泛用于疫情期间人员管控、“两会”报道等领域。
车牌识别
车牌识别也是智慧安防的重要组成部分。车牌识别的痛点在于,如何实现快速移动识别,以最大限度降低识别过程对交通的影响。例如在疫后复工期间,如果让每辆通过的车停下来依次检查,就要将本已拥堵的交通推向更为恶劣的情况。
亮亮视野AR智能眼镜实现了快速移动识别,疏而不漏。其车牌识别最远距离可达18米,静态以及车速低于20km/h,均可实现快速识别。目前,北京中关村软件园就采用了以亮亮视野AR眼镜为智能前端的园区疫情防控解决方案。园区7个出入口都使用了AR眼镜进行日常的疫情防控车辆管理排查。早高峰时段,一个小时内监测管理的车辆达1000多辆。园区保安人员在对车牌进行识别排查的过程中,AR眼镜也实时地将当时车辆及其背景画面一起拍摄回传到后台,这也为事后进行回溯、还原现场提供了现场取证依据。
工业领域物体识别
工业是AR应用的重点领域,AR技术可以用于设计创新或改型,也可辅助装配。在销售环节,可帮助销售人员进行交互式、虚拟化的选装选配,同时,还可帮助企业进行产品的发布,让观众更好的体验新产品的功能、优点。
例如吉利集团杭州湾基地装配流程就引入亮亮视野AR眼镜。对于汽车装配流程来说,尽管工厂内有着非常严格的管理制度、流程控制,但是在实际的操作过程中还仍然会出现因工作人员的失误而导致的产品装配错误。结果可能会导致返工,更严重的还会致使产品召回以及发生重大事故。
针对如何将工作流程步骤规范化,吉利集团杭州湾基地与亮亮视野合作,找出了一套切实有效的解决方法:搭载智能AR眼镜的标准作业流程,聚焦质量异常点,起到了对整个装配环节有了检查监督指导作用,让汽车装配环节有了更精准的保障,使作业流程标准化。
工业领域故障识别
AI+AR在工业领域另外一个重要应用就是故障识别。以某知名航空公司基于AR智能眼镜的飞机 AI 巡检系统为例,飞机巡检流程复杂多样,而民航质检要求确保万无一失,人工巡查存在安全隐患。如果采用AI+AR技术,面临的最大问题是工业领域目标识别需求千变万化,训练样本却是稀缺的。
亮亮视野提供的解决方案是结合小样本学习,采用半自动化标注,企业只需提供少量原始数据样本,就能快速训练出 AI 识别算法模型。最终实现了关键节点AI 自动故障识别,例如润滑油盖状态自动检测与识别等。AI识别算法运行速度快,达到10毫秒级高速识别,一旦发现错误立即近眼提示报警。并且专家能远程在线指导,与检修人实时通过音视频交流。最终实现整体错误率明显低于单纯的人工巡检。
OCR识别
OCR识别即利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人可以理解的格式。OCR技术是计算机视觉的主要应用场景,也是比较成熟的识别技术。近年来深度学习的出现,让OCR技术焕发第二春。亮亮视野的OCR识别支持高密度排列和弯曲的文字识别,准确率达98%。
QR二维码识别
亮亮视野利用专利技术合成100多万张QR二维码检测数据集,采用已申请专利的轻量、高效神经网络结构,依托公司的通用目标检测训练平台,训练了自己的QR二维码检测模型。与传统的QR二维码识别算法结合,亮亮视野的QR识别技术在识别距离、识别速度等关键指标上达到了与国际知名条码识别公司scandit算法相同水平,并且支持对贴在不同水平面上的多个二维码同时检测识别这一工业应用上的常见情形。
vpas视觉定位
vpas即视觉定位与增强服务。在地下车库或者其他信号较若的场所,GPS定位精度会大打折扣,瞬间“智商下线”的定位常常让人十分抓狂。视觉定位服务就能很好改善这一问题。亮亮视野与百度合作开发的vpas技术,只需要用户提供一张图片便可返回6DoF的包含三维位置信息和朝向的姿态信息,结合放置AR内容的参考模型,通过渲染将虚拟信息在真实物理世界进行精准叠加显示。
以室内导航为例,通过采集摄像头或者其他传感器数据,vpas可以很好地覆盖信号较弱的场景,通过深度融合实现精准定位,弥补GPS信号在室内环境下衰减、稳定性差的问题,帮助用户精准锁定目标的空间位置,请示实现室内定位导航。
此外,VPAS还可用于古迹复原、工业巡检、物流分拣等场景。
万物识别,让AI读懂人类世界,亮亮视野一直致力于用科技改变人与万物的沟通方式。目前,亮亮视野已经实现了丰富的商业场景落地,未来我们将继续努力,将AI+AR工具运用到更多垂直行业,帮助人们更加高效地创造价值。