强调技术与场景深度结合,重整体解决方案,突出客户价值与用户体验……在2019安博会上,AI规模化落地的趋势已愈发明显。伴随数字化、网络化的日趋成熟,在人工智能、5G、云计算等新兴技术的深度融合推动下,城市的智能化建设正积极演进,越来越多的企业也开始加入智慧城市的建设队伍当中。
2017年,AI头部企业商汤科技在业界首次提出“城市视觉中枢”的概念,并于去年全面展示了面向城市级分析场景的SenseFoundry方舟视觉开放平台。
顺应智慧城市发展热潮,在刚过去的2019深圳安博会上,商汤为SenseFoundry方舟城市级视觉开放平台(以下简称“方舟平台”)带来了“新伙伴”——SenseSpring深泉智能模型生产平台(以下简称“深泉平台”),对其“城市视觉中枢”进行全新升级,并在此基础上首次定义“智能城市操作系统(AI City OS)”。
深泉平台到底是什么?能解决什么实际问题?在智能城市操作系统的整体框架中承担什么角色?商汤科技副总裁、智慧城市综合业务事业群CTO闫俊杰博士的解读或许能为你我带来答案。
揭秘深泉平台:以最低技术门槛解决用户需求
方舟系统面世近两年,其在商汤“城市视觉中枢”中的作用有目共睹,目前已在不少城市级落地项目中成效显著。然而随着城市智能化建设脚步的加快,不少新的痛点有待解决。例如城市级分析需求规模的剧增与现有算法储备不匹配、当前AI模型开发周期难以满足各类长尾需求、细分多变的场景业务需求难以满足……正是基于以上现实背景,深泉智能模型生产平台顺势而生。
“人工智能主要涉及算法怎么用以及模型怎么训练两个环节,而深泉平台就是用来解决这两个环节的问题。”
在闫俊杰看来,开发超过2年的“深泉”可以被认为是一款端到端的模型训练和部署平台。“通过图形化操作界面,基于用户提供的数据和标注信息,深泉平台不但可以提供模型的自动训练,还能对得到的模型进行评估、迭代,从而筛选出最佳模型自动完成部署,供用户进行调用。”
得益于商汤长期在计算机视觉和深度学习上的研发积累,以及近期在自动机器学习(AutoML)技术上的深化,深泉平台中内置了大量商汤原创的,在特定真实场景得到实践检验的高精度算法模型结构。同时,商汤还将这些模型进一步抽象,得到专门用于物体检测、图像分类、人脸活体检测等多种场景的模型框架。以这些框架为基础,配合用户自有且不断积累的业务数据,只需用简单且低成本的方式,就可通过“深泉”进行算法模型的训练。
目前,深泉平台提供两种训练模式:增量训练及零一训练。
增量训练对应已经具有特定功能的算法模型,如人脸识别、人体识别等。在业务数据之上,“深泉”可自动进行数据聚类、数据清洗等工作,进而提升已有模型的精度。而零一训练面对的则是客户急需,但此前不存在的模型。客户对深泉初步筛选出的训练数据进行标注,在此基础上“深泉”即可自动训练生成客户所需的模型。
也可以这样理解,增量训练适用于通用场景的算法训练,而零一训练则是用来满足城市管理者各类长尾需求以及碎片化需求。
但两者的目的都在于以最低的工程成本和技术门槛,解决用户的各类实际需求。在闫俊杰看来,深泉的推出可以说打破了以往智慧城市中算法开发的模式。“算法的开发将不会再由客户提需求反馈商务、商务反馈产品、产品反馈到研发、研发接单处理的工作流程。前置在客户业务系统的深泉,即可直接按需进行算法的定制化生产、训练、部署和迭代。”
水流之处,万物生生不息。深泉二字,取意即为如此。经过两年多的潜心研发,此次深泉平台的推出,更是站在客户角度,打造了一个开放的模型训练平台,在缩短反馈链周期的同时,尽可能确保最终产品满足客户预期,用最低技术门槛快速解决各类需求。
对于城市级场景,99%的算法精度还远不够用,那么深泉平台的能力如何与商汤城市视觉中枢、智能城市操作系统打通?
闫俊杰表示,简单来说方舟负责模型的调用,深泉则负责模型的生产与训练。也就是说,在整个商汤科技的智能城市操作系统中,方舟与深泉共同扮演着“底座”“基石”的角色。
在闫俊杰眼中,智慧城市的本质应该是通过科技手段便捷每一个人的生活。但从目前的建设现状来看,这一目标还远远没有达到。尽管经过一年多的实战应用,方舟系统已快速从1.0迭代至2.0,支持十万路级别系统设计、进一步扩大分析数据库、升级后的城市级多源、多态、融合分析引擎……但不得不承认,在落地更多的场景应用之后,商汤科技发现:在落地智慧城市建设中,AI能力的多样性愈发重要。
目前而言,方舟算法仓中已经积累了超过400组商汤原创的算法能力,这些多元化的能力部署在方舟上,用户可以进行自定义,例如哪些视频需要匹配怎样的AI能力支持。
但现实问题是这400多个算法模型如何在不同的场景下确保精度足够?
当前行业中不时传出算法精度已经见顶、够用的声音,闫俊杰则不以为然。他表示,一个摄像头一天24个小时,每小时有60分钟,每分钟又有60秒,每秒的话是25帧,这样的话单个摄像头一天记录的数量级大概在200万帧左右。“如果你的算法精度是99% (为了简化后面的描述,此处的精度指的是1-误报率), 那意思是说如果你真的跑200万帧,200万乘以99%,大概就是有2万次错误,这种算法其实是没法用的。所以说得变成‘6个9’,这样的话它才可以用。”
“当然也可以降低单个摄像头的采集频率,但对于城市级场景中海量的数据和摄像头,即便算法精度来到‘4个9’都还无法满足使用要求。”闫俊杰表示,这类模型精度的提高就需要通过深泉平台的不断训练得以加强。人脸识别之所以能够大规模用,是因为现在精度已经到了“10个9”,甚至“12个9”的区间。
此外,智能城市生态的构建仅靠400个算法模型远远不够,更多算法模型的产生也均要靠深泉平台加以驱动。
类比自动驾驶,商汤内部将算法的精度划分为S1、S2、S3、S4四个等级。在智慧城市的建设中,以摄像头智能视频分析中需要的人工干预程度来划分,S1级别的算法对应单个摄像头基本不需要人工干预;S2级别的算法对应一百个摄像头基本不需要人工干预;S3级别的算法代指区级地域摄像头基本不需要人工干预,摄像头数量一般为千级;S4级别的算法则对应一个城市级别的摄像头基本不需要人工干预……
目前除了人脸识别之外,大部分算法都是S1或者S2的级别,而深泉平台的推出,则将能进一步助力模型能力逐渐向S4的应用场景迈进。
深泉+方舟,能看懂、能思考、能指导行动
“深泉平台训练出的模型可直接放在方舟系统中进行使用,而方舟所产生的业务数据又可以直接给到深泉进行模型的生产、迭代。”闫俊杰表示,可以简单认为这两者的融合应用打通了AI数据应用的闭环。
而除了数据闭环的打通,深泉与方舟系统形成的合力,更是不容小觑。他们打通从数据采集标注、模型训练部署、业务系统上线的整个链路,构建多样化场景需求与模型高效生产的闭环。方舟与深泉结合在一起,共同支撑商汤城市视觉中枢能力的持续演进。
持续升级的视觉中枢将实现城市全场景覆盖,以应对新型智慧城市AI City建设中,超大规模、多源、多态、融合分析需求,为城市提供“能看懂、能思考、能指导行动”的核心分析能力,推动智慧城市建设全面进入AI时代。
从城市视觉中枢理念的推出、“方舟开放平台”以及“方舟2.0”的发布,再到深泉的面世。以升级的城市视觉中枢为基础,商汤科技所提出的“AI City OS”已经逐渐形成闭环。
简单理解,深泉平台之于方舟,是其多元化AI能力得以形成的坚实后盾。而深泉平台之于智能城市操作系统,是其AI能力得以提升的助推器,极大提升了“城市视觉中枢”的能力。
城市级标杆案例就像经历一次“双11”的极端考验
从噱头到落地,近年来,人工智能推动城市智能化的进程已逐渐从“试试看”变成“摸得着”“看得见”的现实。
细数2019年,AI+智慧城市具体可体现在以下三个方面:一是算法更加强调工业化,多元AI能力逐渐成为一大趋势;二是人工智能与场景、行业的结合已成为了产业共识;三是更多解决方案的出现将用户体验感提升到新高度。
但智慧城市的建设光靠技术支撑远远不够,城市运营服务也应与城市发展建设相结合,专业的城市运营队伍将加强城市智能化建设的体验感。而这也是商汤智慧城市板块瞄准的下一个发力点。
“让人欣慰的是,我们已经能够非常明显的感受到智慧城市从噱头、到局部可用、到越来越可依赖。”闫俊杰表示,“在未来的一段时间里,随着AI与各行各业的深度结合,城市智能化建设速度将继续呈现出指数增长的态势。”
据悉,截至目前商汤所参与的智慧城市级项目已经覆盖了全国30多个省份,在取得了不菲成绩同时也还存在巨大的覆盖空间。
闫俊杰表示,目前在单个系统视频接入量方面,商汤有几款系统都排名全国前茅。做这种大型的系统不管是对算法的精度,算法的多样性还是系统的并发和高可用都是巨大的考验。单个系统的接入量大概每年大一个数量级,现在已经到了10万,明年单个系统接入量可能会有近百万。“做这种系统就像商汤内部的双11,通宵达旦自然少不了,但系统做完之后,可以沉淀非常多的核心能力,后面批量做中小型系统就变得简单自然。”
展望未来,商汤科技将以智能城市操作系统为核心理念,基于城市视觉中枢的持续演进,为智慧城市的智能化建设赋予更多、更深的价值,用全栈AI原创实力助推智慧城市再升级。