过去两年中,赛文围绕“互联网+交通”撰写了大量的市场观察文章,也非常高兴我们一直有机会接触到这场智能交通变革中来自阿里云、滴滴、百度、高德等互联网巨头的焦点人物,以及正在经历变革的传统业界精英们,能让我们倾听来自不同方向的声音,基于此有了更充分的思考空间。
我们不断促成新进入智能交通领域的互联网公司与业界有更多对话,在这个过程中,我们发现,有两个问题长期存在:
互联网公司是否真的给智能交通行业带来了技术进步?
来自行业的争议和抵制是话语权之争,利益的抵制还是对互联网的交通技术不认可?
我们始终带着批判的眼光审视不同方面的观点,力求基于全面的信息作出客观的判断。
6月19日,在2018 WTC现场,我们与阿里云机器智能首席科学家,阿里云人工智能ET大脑领导者闵万里(花名山景,下文称“山景博士”)进行了一次独家对话。
在准备访问大纲时,我们找到了众多科技媒体对山景博士的专访和报道,却鲜有来自智能交通行业的、从实战落地角度出发的提问,于是我们罗列了一些我们认为智能交通业界最为关心的问题,与他深入探讨。
见面时,山景博士正嚼着一块三明治,面带笑容略显无奈的说“连吃饭也是互联网的节奏”,于是我们拿着一份他事先并未看过的访谈大纲,“突袭式”地开始了这段对话,力求真实表达。
什么是交通大脑
管控平台,指挥平台,数据中心,如今“大脑”出现了:阿里云ET城市大脑(ET即Evolutionary Technology,不断进化的技术)、滴滴大脑、百度大脑,还有来自业内厂商各种称呼的交通大脑。
“大脑”是什么?
山景博士说,人类的大脑经过了几亿年的生物进化,而ET城市大脑也经历了几代科技人的努力——做传感器的采集数据,做云计算的提高计算速度,做大数据的提升算法准确性,这么多年技术迭代和积累之后才出现了完整的大脑。
山景博士把ET城市大脑定义为把城市数据资源转化为智慧决策的增值反应堆。它具备三个特征:
第一, 它能“吃得进去”,各种各样的数据能吃进去并收集起来,不挑食 。
第二, 它能快速消化这些数据,而且消化得掉。举个例子,如果计算能力不够,就算把全北京的某类数据都给你,机房立刻就爆掉了,更别说挖掘出有价值的信息。
第三,“吐得出来”,言之有物。用最好的算力,处理最好的数据,最终得出的结果是智慧的,有预见性的,而不只是事后统计报表。
山景博士认为“吃得进”、“消化得动”、“吐得出来”三者要一气呵成,达到“知行合一”的境界。 他举了一个交通场景的例子,当有一个急迫的出行需求,例如救护车要从A点到B点,怎么样迅速给它开一路绿灯,这就是阿里云ET城市大脑想“吐出来”的内容。
在我们看来,“吃得进”、“消化得动”、吐得出来”与业内对智能交通的四个特征描述“采集”、“传输”、“处理”、“发布”是基本一致的。
从数据采集和分析的角度来看,ET城市大脑追求的是“全网、全量”。“全网”是指数据采集覆盖全部路网,全量则代表多来源的交通数据:地磁、视频、线圈、微波、浮动车数据、APP数据等。这也恰恰是ET城市大脑相较传统智能交通之间的不同之处。
山景博士认为,算力的提升,使得先进的算法变得可行,从而挖掘出数据深层次的价值,最终产出的内容智慧含量就大超以往。
ET城市大脑发展经历多个关键节点。山景博士提到,2015年国庆之前首次上线浙江省高速公路未来60分钟路况预测,准确率高达90%以上;2016年8月份在广州市海珠区上线 “互联网+信号灯” 试点成功并被媒体报道;2017年在杭州市成功上线了城市大脑交通1.0版本,包括在萧山区试点的“救护车先行” 的绿色通道……“每一次,ET城市大脑都是通过首创的业务应用展现其引领性的技术实力和眼光”,山景博士说道。
任何人都知道数据的价值巨大,任何人也都无法准确描述出数据的价值到底有多大,但就上面的分析和阿里云目前ET城市大脑实战建设来看,阿里云ET城市大脑目前所落地的工作也仅仅是冰山一角,嫩绿刚刚发芽的状态,但是作为先驱开创者它向业界证明了一个新的方向。
交通大脑与管控平台的区别
一夜之间,几乎所有传统智能交通厂商都不再将自家的平台类产品称为“交通指挥管控平台”或是“交通数据中心”……它们都叫作“大脑”。
交通大脑与管控平台有什么区别?
山景博士认为,两者之间差别非常大。
首先,尽管管控平台在交通管理机制和信息采集下发渠道方面都相对成熟,但恰恰在“吐出来”内容的智慧含金量上,传统的管控平台与ET城市大脑之间有很大差别 。
“ET城市大脑对数据智能引用的追求趋于极致,从“事后统计”到“预测性调控”,从“被动自适应”到“主动介入”, 从 “固定相位差/绿信比” 到 “客制化”, 从 “选择预设模板”到 “创造新模板”… 这些都是ET城市大脑的创新之处。”
第二个不同点是对非结构化数据(视频数据)的处理。过去交通指挥中心对视频数据的使用是滞后的,一般都是出现状况之后再去调出来查看。今天ET城市大脑要做到实时自动看,而且主动发掘重要信息。
山景博士又举了一个交通场景案例来说明这点的难度。当有了视频数据、线圈数据、微波数据,再加上移动互联网的实时路况数据,如何一起实时融合消化?例如,高德APP告诉你这个路口是拥堵的,而另外一个视频信息则显示其实是不堵的,两者之间该信谁?
这就带出了ET城市大脑“消化得动”的特点——表象上有矛盾的数据同时涌来的时候,可以做到准确及时“去伪存真”。以往在交通管控中心,这些视频数据需要交警人力凭经验判断,高度依赖人脑做工作。今天ET城市大脑就希望能把人脑的智慧,几十个、几百个有经验的老民警的智慧固化为一个再也不“老眼昏花”的程序。
山景博士说,今天不是说ET城市大脑做得比人好,但是我们一定可以超过人的生理极限,“老虎也有打盹的时候”,在这一点上ET可以超越单个的人。ET城市大脑一定是向这些老师傅们去学习,学习之后把他们的经验用程序的方式继承下来,最重要的是“吐出来”的信息有本质不同了。
山景博士认为,ET城市大脑需要给既有的渠道赋予崭新的内容,而这个内容就是告诉用户哪个地方的拥堵可能在10分钟之后会消失、现在走这条路可能会遇到三个红灯五个绿灯……而不是仅仅告诉用户这一路有多少个路口、有多少个信号灯而不告知信号灯的状态。
能够很明显地感受到,山景博士在交流中会不断地用交通场景去描述说明所要表达的内容,这说明他们自己也在积极对照智能交通领域的场景,这也是当下互联网公司和传统智能交通行业能在同一个场景下进行交流的重要条件。
阿里云ET城市大脑扛把子,阿里巴巴技术委员会主席王坚曾经描述第一次与杭州市公安局交通警察局副局长孔万锋开会场景,孔局长对王坚说:王博士,你要把交通控制的书再好好看看。王坚感觉到工作压力巨大。后面突然有一天,孔局长问王坚:“飞天”是什么?(阿里云自主研发、服务全球的超大规模通用计算操作系统)。这次发问让王坚感觉到了杭州开始接纳这样的创新。
当新技术来临,当互联网+交通来临,传统业界与互联网公司都需要不断的跨界学习。
由硬及软的变化
技术之外,阿里云给传统行业带来了什么,这是个我们思考了很久的问题。
山景博士首先提到了IT行业“从硬到软”的变化,认为在智能交通领域也有同样的趋势。他认为,多年以来,国家智能交通投入巨大的资源做基础设施的建设,价格卖到硬件上,软件则免费赠送,但这种模式难以持久。
出行者最终需要的是服务,而不是那些硬件。
山景博士说,云计算就是服务的模式。云计算的提出就是为解决中小创业企业没有办法承载大机房,但又需要海量的计算能力,于是有了租用的方式,弹性调动的方式。
今年以来,我们会听到关于阿里云就城市交通大脑服务报价过高的“抱怨”,相对于以往智能交通行业软服务的市场价值,阿里云的软件平台,视频分析服务报价被抱怨高得“非常离谱”。
但是也会有很多人意识到,软件和软服务价值的提升不正是多年以来传统智能交通业内所追求但始终不被认同的吗?阿里云的到来至少有机会从一个点打破“常规”,并被期望带动作用显著。
尽管在政府项目型智能交通市场中,那些纯软件的公司生存空间仍然狭小,但我们也看到近两年时间里,特别是长三角地区比较集中的涌现出了一批专业的软件、大数据类公司,而阿里云在智能交通市场的进入则是这场悄然发生的由硬及软的市场变革中,重要的代表事件。
对于更多的智能交通硬件产品供应商而言,所需要思考的是坚持将硬件进行到底,还是需要软硬结合,加大对软服务,对数据的结构化,初步分析结果等服务的投入,答案已经很明确了。
山景博士说,阿里云在智能交通市场中从硬到软的转变挑战巨大,经常会被回复“另外一家的软件是免费的”云云。
他认为,ET城市大脑的价值体现在两个层面,第一,它用全球首创的典型应用自证对行业的创新价值,例如:全球这么多年没有一款软件能做出来弹性绿波带,把救护车的一路绿灯做出来,阿里云做出来了,而这对老百姓的价值是无可争辩的。第二,它又证明了ET城市大脑的数据底盘有更多潜能,可以让行业伙伴们协同打造更多创新应用。
数据整合
就目前为止,智能交通行业对阿里云的认可主要有两点共识,一个是由硬及软的产品发展变化的趋势引领;另外一个就是“全量”数据的整合,同部门内多业务数据,跨部门多类型数据的整合。
数据整合说过多年,直到阿里云的出现,杭州市数据资源管理局的出现,才明显感觉工作的力度不同,尽管仍有人并不同意杭州市数据资源管理局的整合是因为阿里巴巴的发展影响,但我们认为这也是技术之外,阿里云给传统行业带来的变化。
山景博士说,阿里云ET城市大脑对交通的最大贡献是对有效的数据做实时整合,做有智慧的整合,整合成功的时候是可以带来前所未有的价值。
为什么是阿里云而不是其他传统智能交通企业?
山景博士认为,最重要的一点是视频数据,因为视频数据的计算量是极大的,尤其是在实时计算的需求下,而以往没有云计算的时候这种计算能力并不能满足需求,最后数据使用就都变成了抽样,做简单的车辆号牌识别,这在十年前就可以实现了。
基于实时的每一辆车从哪个地方来,途径哪几个地方,把OD的路径实时的还原出来,甚至预测它下面去哪,这个计算量非常大。
山景博士认为,阿里云具有其他企业不具备的数据整合能力,这种能力是在阿里巴巴电商场景下沉淀下来的,而这也正是吸引他回国加入阿里巴巴的重要原因。
淘宝、聚划算、天猫,用户搜索的数据、评论的数据、购买的数据、物流的数据、支付的数据全部都进行整合。阿里巴巴发展十多年,加上它服务了几亿日活用户,沉淀出了把各种复杂的数据源进行实时整合的能力。而传统智能交通公司缺乏这种场景,缺乏这种锤炼。
山景博士说,阿里巴巴的数据能力从电商当中释放出来,走到其他行业市场的时候,首先看的杀手锏就是数据整合能力。
奇货可居的大数据能力
2017年,阿里云在杭州、衢州、苏州等城市示范建设了ET城市大脑。
2018年半年时间里,阿里云又在吉隆坡、上海、西安、重庆、江西以及浙江省内更多的城市不同程度的推广了ET城市大脑。
我们看到其他互联网公司在2018年放慢了互联网+交通的城市复制速度,开始逐渐深入行业技术,而阿里巴巴仍旧在快速地进行城市大脑的复制。
山景博士说,政府是中国最大的公共数据资源所有者,他们手上握有金矿,但这个金矿的生命价值非常的短暂,任何数据可能过了一天就变成了无效数据。阿里云是在帮助政府减压,把数据瞬时的价值捕捉住、释放出来。
一幅江湖行走图出现在脑海中。
风清扬左手拿着视频算法,右手攥着阿里云算力,背靠奇货可居的大数据之剑,走在前方光明但路途曲折的ET城市大脑之路上。
只做别人做不了的事情
山景博士长着一张机智的娃娃脸,跟他交谈会强烈的感受到他的自信,观点犀利。
出身于安徽大别山区,他是当地出了名的“少年神童”。
1991年底,在一次奥林匹克竞赛冬令营培训上,中科大的教授一眼便选中了这个在数学思维方面表现出过人天赋的孩子,于是14岁的时候山景进入中科大少年班。
1997年19岁的山景本科毕业后赴美进入芝加哥大学攻读物理学硕士,1999年转型统计学研究,2004年获得芝加哥大学统计学博士学位。先后加入IBM T.J. Watson 研究所,IBM Singapore及Google 担任研究员。
2005年他与合作者发表了两篇理论文章:
“On linear processes with dependent innovations”, Stochastic Processes and their Applications, Volume 115, Issue 6, June 2005, Pages 939–958;
“On Canonical Correlation Analysis of multivariate time series”, Statistica Sinica 15 (2005), 303-323
这两篇文章解决了复杂网络下随机过程的大样本理论,有着丰富的应用场景。
这些研究最开始应用在手机塔台网络的动态频率带宽分配上,帮助电信运营商优化不同地区的频率带宽分配从而提升通话质量,降低通话断线的比例。这个应用场景对实时更新的速度要求不高,因为频率带宽的分配方案是一个周期性非常强的缓变过程。
2007年,30岁的山景在IBM赫赫有名的“TJ Watson”实验室工作时,就曾研究新加坡的智慧城市交通管理,开发的预测算法对新加坡CBD区域不同等级的地面道路进行预测,准确率超过85%,山景博士说,这是业界第一个能准确预测未来路况的实战系统。
当时的主流媒体包括CNN、 Yahoo都作了专题报道。他所撰写的道路交通流预测研究,是在该领域被引用最多的公式之一,达到300-400次。
在美16年后,2013年山景回国加入阿里巴巴,最新也是最受关注的工作状态是领导阿里云人工智能ET大脑系列, ET城市大脑, ET工业大脑,ET环境大脑, ET航空大脑,到最新的ET农业大脑。
为什么选择交通作为ET城市大脑的切入点?
交通场景下的数据量巨大,数以百亿计的城市交通管理数据、公共服务数据、运营商数据、互联网数据,为ET城市大脑提供了最完美的“练兵场”。
此外,山景博士在交通领域也有着深入的技术积累。
除去2007年利用道路交通的浮动车和传感器数据,预测新加坡中央商务区未来60分钟里的交通状况的工作积累之外。
回国后,在ET城市大脑项目之前的2015年国庆期间,山景博士带领团队成功开发上线了一套系统能够准确预测浙江省内1300公里高速的未来60分钟路况,他说,那是全球第一次最大规模的实时使用路况预测。
阿里云希望从数据的角度来发现一些交通的规律,尤其是在全量数据联动时,实时发现那些地方不合理,量化出来再做分析,然后决定在哪些地方做微调,微调多少,这是阿里云在交通上选择的数据切入点。
山景博士说,鉴于以往的工作经历,他很了解当下交通管理工作的局限性,也知道行业里哪些方式是不能碰的,他说见过太多国内的专家们做过很多漂亮的工作,但是始终没有落地。过去那么多年的交通发展,智能交通领域出了很多学术文章,但是与此对比的是我们城市的交通状况并没有得到改善。
交通管理,所有人都说很复杂,越是复杂的东西背后越有一些数据可以告诉我们蛛丝马迹。山景博士做了一个比喻:你观察某一个规律观察一天的数据看不出来,看一年,十年,二十年,甚至在交叉对比中就能够有蛛丝马迹的结论,这就是大数据的威力。
所以,不害怕现在不懂,只要 “见多” 就可能在未来变得 “识广”。 害怕“不复杂”,不复杂的东西早被做过了,今天阿里云就是要做最复杂的!
结尾
一个小时的专访结束了,但在我们的提问问卷上,仍然有一些我们非常感兴趣的题目没有来得及与山景博士交流:
怎么看智能交通业界对阿里云ET城市大脑比较多的不认可评论。
交通信号优化,弹性绿波带这些ET城市大脑作为重要工作场景所描述的技术功能实现不被认可,是因为传统智能交通技术方案可以实现,还是虽然可以实现但并不能作为常态使用,亦或者是阿里云方案实现的技术路线不同,所能调用的数据信息和所能产生的影响不同。
交通管理、交通控制发展这么多年,无论怎么样的场景,使用怎样的技术路线方案,我们认为传统智能交通行业都可能有实现过,都有能力实现。
我们需要观察的是阿里云技术方案的优势是什么,阿里云技术方案对已有应用实现了哪些提升,阿里云做了哪些传统智能交通行业没有做到的事情,并且这些事情是被双方所认可的。
我们都知道大数据具有巨大价值,但关于数据的未来阿里云也在不断的摸索。阿里云ET城市大脑目前所能落地的工作也仅仅是冰山一角,嫩绿刚发芽。
需求驱动算法,算力结合需求,而阿里云的数据整合也还远未到“全量”状态。
也许是因为我们对阿里云给予了过高的期望,过多的关注,也许喧嚣也只是阿里云ET城市大脑持续发展下去的必然,但不可否认的是,优秀的算法+超能的算力+全量的大数据,未来是具有无限可能的。
基于此,阿里云与行业合作伙伴合作的商业逻辑,阿里云的大数据战略解读,阿里云商业模式解读都显得比较清晰了。
最后
城市大数据并不会一家独大,数据的整合也才刚刚开始,这个整合的过程将会十分漫长,还会出现很多具有实力的巨头玩家。
基于数据的圈地之战还没有到来,而优秀算法+超能算力的门槛也不会高到无法进入,我们期待新的商业生态布局出现。