专业IT科技资讯平台,关注科技、手机、电脑、智能硬件、电脑知识!
当前位置:主页 > VR >

一文看懂京东城市计算平台如何感知、管理、分析城市数据

导读:

  智能城市已进入资本快速入局、巨头圈地暗战的阶段,尤其是随着《粤港澳大湾区规划纲要》等文件的发

  智能城市已进入资本快速入局、巨头圈地暗战的阶段,尤其是随着《粤港澳大湾区规划纲要》等文件的发布,传达出政府对城市智能化的巨大需求以及民众对城市生态的呼唤,城市问题日益严峻、日益增多的政府订单使得智能城市拥有一片巨大的蓝海。据统计,国内争先上马智能城市项目的城市多达500+。

  无独有偶,学术界对于智能城市也格外关注。今年年初,在国际人工智能领域最权威的会议AAAI 2019上,我们注意到“城市计算”成为争相热议的焦点。城市计算理念的提出者、京东集团副总裁郑宇更是成为首个受邀在AAAI大会上发表主题演讲的中国大陆学者。

到底什么技术模式才适合城市?

  到底什么技术模式才适合城市?

不可忽视的问题是,在行业野蛮生长的同时,到底需要怎样的技术和模式才能够真正支撑智能城市发展的这片蓝海?

  在雷锋网看来,随着感知技术的成熟,各种大数据在城市里悄然而生。与此同时,人工智能技术的日趋成熟也使数据分析更为便利。如果使用得当,我们就可以利用这些城市大数据和智能算法来解决城市所面临的问题,如城市规划不合理、交通拥堵和能源消耗增加等。也就是说,对城市数据的处理和使用,必然将是IoT、云计算、大数据、和AI等技术的互相融合。

  在国内,做智能城市有以下几种模式,第一种是传统智慧城市提供商,主要提供系统集成、数据收集等服务,第二种是云服务提供商,以出售云服务获利,第三种是只解决局部点问题的新型人工智能公司,第四种是以城市痛点出发,能够提供顶层设计的科技公司。

  互联网巨头智能城市的技术逻辑也均有所不同,比如在京东,行业首提打造城市计算平台,对特殊的时空数据进行感知、管理及分析,做城市操作系统的野心毕露无疑;在阿里,ET城市大脑的总体架构中有数据资源平台,视觉AI项目4箭齐发;在腾讯,超级大脑的背后是一套云智天枢的系统,数字广东也顺势搭建了公共服务平台。。。。。。此外,这个领域还活跃着平安、百度等巨头和千寻位置、高德地图等主打定位导航的一批垂直公司。

  可以说,智能城市不是一场营销套路的比拼,而是实打实的技术架构、技术实力的较量。从技术角度来看,AI+云+大数据是基本的能力,这一点目前市面上主要厂商基本具备。但我们有三点疑问:

  ·第一,技术的构成是没有绝对标准的,各界在AI+云+大数据上是入门级别还是专业级,这是两回事;

  ·第二,无场景即无落地能力,因为城市并不是孤立的一个系统,交通、环境、民生、政务、能源、商业等复杂因素盘根错节,如何组合AI、云、大数据是重大考验,如何找到具有行业背景的专业人才去落地技术也是问题所在。

  第三,从政府的角度来看,智能城市需要构建生态而不是孤立的数据系统,数据安全和隐私如何保护?

  所以,有必要就市面上出现的“城市大脑”、“城市计算”类的平台做重点技术剖析。

  为什么是城市计算?

  以京东城市的城市计算平台举例,我们注意到,城市计算平台针对城市数据的流动性设置了4个梯次,分别为城市感知和数据获取层、数据管理层、数据分析层和服务提供层。例如,在城市感知层面,通过车载 GPS 或用户的智能手机产生的轨迹数据来不断感知司机的驾驶状态。在数据管理层面,通过时空索引结构把感知到的数据组织起来,用于后续实时分析和挖掘。在数据分析层面,可以根据这些轨迹数据较为准确地确定城市的异常状况发生的时空范围。在服务提供层面,这些信息会被及时地传递到交管部门和周边通行的人群,以快速处理异常并避免更多人陷入混乱。

城市计算架构图

城市计算架构图

  BATJ等专业的厂商在打造智能城市时,第一步必然是用传感器获取数据,但是不可避免会遇到同一类问题,比如有限传感器下如何最大化获取关键数据?如何部署和评估?怎么规避偏性样本问题?如何防止由于数据稀疏性带来的数据缺失?怎么应对数据丢失后的价值填补?这是行业必须跨过的第一个门槛。

  以北京的空气质量检测和交通流量预测为例,即便35个空气质量监测子站已全面覆盖这座城市,但由于空气质量随着时间和地点的不同发生巨大的非线性变化,给空气质量检测带来难度。同样如果从出租车的GPS轨迹来预测城市交通流量,也会遭遇偏性样本的挑战,毕竟私家车和出租车属性不同,出租车的分布并不具有普遍的代表性。

  这里就不得不引申出一个重要概念——时空大数据。

  为什么说它重要?因为时空数据能很好解决前面遇到的问题,并为后续的数据管理、分析和服务提供奠定基础。时空数据这个提法是计算机技术发展下的产物,因为人类获取信息的渠道不仅在局部地面、地球表面,甚至已经扩展到地球各圈层乃至外太空。时空数据不仅数据庞大,还具有非线性和时变等特征。

  而城市计算平台正是融合了这一重要的技术。在业内,京东城市就曾提出著名的“时空数据6种模型”,为今后数据收集进行分类匹配,定义数据管理和机器学习的算法,使之具备可扩展性和重复利用属性。

一文看懂京东城市计算平台如何感知、管理、分析城市数据

  具体来说,根据结构,城市计算平台把城市数据分为2类,即基于点的数据、基于网络的数据;而根据相关性,把数据分为3类,即时空静态数据、时间动态-空间静态数据和时空动态数据。

  时空静态数据以POI数据(兴趣点数据)最为典型,比如位置固定的加油站、商场、地铁等,最大特点就是人流量的变化,其他属性不变;空间静态时间动态数据以IoT数据(物联网数据)最有代表性,传感器数据随时间推移在变动;时空动态数据最直观的就是Check in数据(打卡数据),滴滴与Uber上的请求就是不同人和车建立联系的调度过程。由于城市内部最为复杂的就是轨迹数据,集合了时间、空间、方向等信息,因此上图中第二行的基于网络的数据就以道路网数据集作为典型代表进行研究。

  另外,由于现有机器学习和云计算处理能力达不到精确处理时空数据的要求,城市计算平台还加入了其他一些“有意思的”设计,比如时空数据混合索引(与常用的关键词搜索方式不同,现在需要搜索过去某个时间段的某个事件的发生,挑战极大);比如对多样数据集的处理(以空气质量检测为例,城市计算可以对实时与历史的天气情况、气象学数据、交通流量、POI数据、道路网络数据等做精确分析);比如交互式视觉数据分析(用简单的算法得到初级的结果,反馈给该领域的专家,用专业知识来进行提炼和剔除无用环节,最后这个数据将返还给算法,让机器学习计算出最新一轮结果)。