视觉互联网时代:《智能平台白皮书》发布
2020年10月29日,由商汤智能产业研究院、中国企业家联合会智慧企业推进委员会、上海市人工智能技术协会共同调研编写的《智能平台白皮书》,在“2020年上海人工智能行业进出口公平贸易及产业发展论坛”上正式发布,商汤智能产业研究院战略生态研究主任杨燕、商汤科技智能产业研究院主任刘志毅在论坛上进行主题发言。
白皮书以“未来先至,智能平台点亮智慧生活”开篇,概括智能平台发展趋势,介绍当下的智能平台生态,总结智能平台的产业价值。
一、5G+AI+XR 引发“视觉古登堡”媒介革命
科技(计算设备、通信网络)是媒介革命的起因。活字印刷和邮政网络,创造了以书报、纸刊为媒介的图文传播时代,广电网络和视听技术的共振,将大众娱乐带入了千家万户,客厅电视成为媒介中心,而随着移动通信网络的升级换代,以及从服务器、云计算到超算中心的计算变革,媒介形态不断更迭,从PC到手机,再到AIoT、 XR(扩展现实)。
媒介变革印证了麦克卢汉理论——“媒介是人类感官延伸的一切工具和技术”。随着技术的发展,人类感官体验不断被“数字化”,从早期印刷时代以文本数据为主,到广电视听阶段语音和平面视频数据的多元共生,再到移动互联网时代随着视频技术和带宽不断拓展,视频数据逐渐成为主流,据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》显示,截至2020年3月,中国网络视频(含短视频)用户规模达8.5亿,视频数据占全网数据已超过一半(2018年统计)。随着5G带宽进一步提升,媒介终端进一步向IoT、XR拓展,以及光电传感器、3D摄像头设备的广泛普及,愈来愈多的终端将会具备“智能视力”,视频数据将会迎来下一轮爆发性增长,且呈现多模态、全景化发展。思科预测2022年底有79%的移动数据流量来自视频,而英特尔预测2028年90%的互联网流量是视频,人均视频需求将增长7倍。因此我们判断,未来二十年,人类社会将加速步入“视觉互联网”时代。正如古登堡印刷技术下的图文传播推动了西方契约型社会的形成,5G背景下,“视觉物联网”也将开启新商业“古登堡”革命。
二、智慧视觉平台:“视觉互联网”新商业基础设施
视觉数据大爆炸时,智能开放平台、AI超算中心、AI芯片成为视觉物联网“新商业基础设施”。依靠第一代集中式服务器机房,美国世界500强支撑起全球商业模式;依靠第二代分布式并行CPU的云计算中心,FAANG、BATH等公司支撑起网络游戏、电子商务、在线搜索等移动互联网商业模式;依靠第三代分布式并行AI芯片的机器学习超算中心,Netflix、抖音/Tictok、快手、B站等正在探索视觉物联网商业模式。通过云边端部署的训练芯片、推理芯片,持续推动着“视频商业”的飞速进化与行业创新。
正如“双11”海量级订单数据处理催生了“云计算”平台,视觉商业浪潮来袭必将催生新一代智慧视觉计算平台,作为“视觉物联网”的新商业基础设施,将加速视觉商业的飞速进化。疫情期间,在线视频教育、在线视频会议、在线视频医疗、影音娱乐、直播带货、短视频社交等等视频消费行为形成常态,并引领生产端向“视觉商业”全面转型——基于平台化赋能,全球逾千万的APP快速上线视频交互功能,近百亿的AIoT设备主动嵌入智慧视觉系统,“无商不视”成为企业共识。
过去5年,商汤在全球智能手机、智慧城市、自动驾驶、在线视频娱乐、AR、智慧医疗、智慧教育、遥感等诸多行业AI实战中,沉淀出业界领先的端到端开放视觉计算平台,依托强大的算力底座,深度学习训练框架、视觉数据辅助标注、视觉算法工具链、分布式异构计算等能力模块,支持企业在视觉商业场景中必需的行业解决方案。
商汤自主研发的SenseParrots开放计算平台具有高性能、强兼容、低成本、大规模、快速部署五大特征,并在政务、交通、电信、金融、移动互联网、娱乐文化、广告传媒、智能手机、汽车、遥感、零售等多个行业生根发芽,帮助所有嵌入视觉互联网系统中的企业提供技术支撑,形成了丰富多彩的中国智慧视觉商业生态圈。
三、 智慧视觉平台:赋能产业升级的核心思路
以SenseParrots为例,智慧视觉平台主要从两个方面赋能产业升级,一是AI产业化,二是产业AI化。
AI产业化 一方面,SenseParrots综合行业共性,为企业提供通用型视觉AI产品或解决方案,加速AI工业化进程,推动视觉AI快速、规模化产业落地,同时AI落地过程中所产生的大量的产业数据,进一步训练底层算法引擎,持续提升AI技术使能。结合SenseParrots平台全流程支持,商汤视频大数据团队推出面向广电用户的标准化搜索剪辑产品,直接赋能广电机构短视频搜索和剪辑,盘活广电媒资资源,而由于传媒节目迭代迅速,新的标签识别数据经过算法迭代训练也将不断丰富产品性能。
另一方面,面对一些非标场景,平台为企业提供模块定制、动态调参、组件选型等定制化功能,将AI深度定制化能力以较低的门槛下放给企业,企业可根据自身需求,获取强相关的功能并大规模复用。譬如,中东某企业移动智能车载执法方案中,SenseParrots平台基于已有算法经验积累,结合中东地区特殊的执法要求,为该企业提供定制化的模型训练和部署服务,帮助企业快速达成机动执法需求。
在商汤看来,加快AI工业化进程,本质上即是整合内部资源和技术能力,进行高度的模块化和标准化,再通过AI开放平台的方式对外灵活输出,将AI技术与具体行业有机结合,根据不同场景需求提供高度匹配的产品与服务,最终实现赋能百业的战略目标,这与“AI产业化”思路不谋而合。
产业AI化 中国企业的竞争模式大体上经历了三个不同阶段:互联网尚未普及的90年代,信息不对称是企业制胜的法宝,当时的市场分割,信息流动性不高,使得掌握一手市场或政策信息的企业获得了快速发展的机会;2000年,对土地等核心资源的占有形成企业的竞争壁垒,造就了地产行业的黄金十年;而到了今天,随着技术迭代加速,变化已成常态,如何控制和利用变化所带来的不确定性成为企业的新命题。
智慧视觉平台赋能产业AI化,一方面,即是利用视觉AI技术手段提升企业业务运营和决策效率,驱动企业的新模式转型和智能化升级,以技术的确定性应对未来的不确定。以某知名传统车企为例,在向AI化升级的过程中面临巨大的转型风险,需要平台为其提供AI技术支持,帮助其从0到1建立并拥有AI自主研发能力。
另一方面,融合视觉AI的新产业将陆续诞生,在新旧交替的不确定环境下为社会发展带来新的可能和生机,并成为未来社会发展的新支柱。自动驾驶即是新兴领域之一,将为城市可持续发展带来巨大价值,但现阶段自动驾驶公司普遍遇到痛点在于海量级自动驾驶数据的存储和扩容问题,问题能否有效缓解将决定产业的可持续发展,以商汤Parrots平台为例,其AI全栈技术经验可以协助自动驾驶公司建设一套融合存储系统,为其存储资源,并进一步为自动驾驶模型研发和应用赋能。
在“双循环”政策背景下,加速产业智能化升级、智慧城市建设等将是促进国内大循环的主要抓手,此外,现阶段中国老龄化浪潮不可阻挡,年轻劳动力短缺导致用工成本不断攀升,人口红利逐渐消失,将加速倒逼众多企业和传统行业的智能化转型进程,因此,如何帮助企业实现“全生命周期”的智能化转型,也是商汤SenseParrots智慧视觉平台的核心工作和时代使命。
一切过往,皆为序章。从“无视频,不营销”到“无视觉,不智能”,拉开了视觉产业互联网变革的大幕,城市、机场、工厂、学校、医院、铁路、汽车、社区、楼宇等场景中,智慧视觉学习能力驱动的产业互联网模式纷至沓来,视觉感知网络、视觉互动人机界面、视觉认知产业智能的三重革新已经不均匀地分布在我们每一个人身边,未来十年都将是各行各业+视觉智能的基础设施安装期。