摘要:海量数据和数据开放对建设人工智能发展的“上海高地”有多重要?
8月29日,中共中央政治局委员、上海市委书记李强在 2019世界人工智能大会开幕式致辞时指出,上海将以更具包容的生态滋养人工智能,要“在释放上海科教资源优势、应用场景优势、海量数据优势、基础设施优势上持续用力,在推动人工智能数据开放、技术推广、市场准入上率先突破……全力打造上海人工智能‘一流创新生态’”。一句话中两次提到“数据”,那么,海量数据和数据开放对建设人工智能发展的“上海高地”有多重要?
海量数据是人工智能发展的基石
人类历史上曾经出现过两次人工智能的大发展时期。1956年,来自斯坦福大学、麻省理工学院、卡内基梅隆大学、贝尔实验室等机构的著名学者汇聚于美国达特茅斯,首次确立了“人工智能”概念:用计算机模拟人的智能,揭开了人工智能第一次大发展的序幕。1980年,人工智能的发展进入了第二次大发展时期。1982年,日本计划投入8.5亿美元开发人工智能计算机,希望制造出能够与人对话、翻译语言、解释图像,并能像人一样推理的机器。该计划于1992年以失败告终。
进入21世纪之后,以2011年IBM的Waston系统参加美国“危险边缘”节目打败人类选手获得冠军和2016年DeepMind开发的AlphaGo击败前世界围棋冠军李世石为标志,人工智能再次升温。2016年10月,美国联邦政府报告《国家人工智能研发战略规划》中提出:“人工智能正处于可能出现第三次浪潮的初始阶段。”
人工智能第三次浪潮是算法、高性能计算和数据收集及整理等技术突飞猛进的产物。2000年以来,人工智能算法不断创新,机器学习技术进步很快。利用机器学习,人工智能系统就可以依据通用的学习策略,读取海量的“大数据”,并获得归纳推理和决策能力。深度学习技术将机器学习能力推向了更高的层次,计算机能够完全自主地学习、发现并应用规则。人工智能算法的实现需要强大的计算能力的支撑,特别是深度学习算法的大规模使用,对计算能力提出了更高的要求。2015年以后硬件算力的提升是人工智能快速发展的又一个重要因素。此外,正如人类需要从食物中获得能量一样,人工智能也需要“食物”,也就是稳定的数据流。深度学习算法需要数据来进行“训练”,数据量越大,输出结果就会越准确。因此,各国在制定人工智能发展政策时都格外强调数据的重要性。例如,2019年2月11日,特朗普政府签署行政命令,扩大人工智能研究人员使用政府数据授权。英国则积极推动数据开放,鼓励企业利用数据发展人工智能技术和产业,促使伦敦发展成为人工智能的欧洲“首都”。
上海的数据资源存量和增量具备优势
上海人口基数大,网民数量多,信息化素养高。2018年上海人口数仅次于东京和新德里,在世界各城市排名中居第三位。2017年上海市互联网网民规模超过1857万人,网民渗透率达76.8%。2018年底,上海“一网通办”移动端APP注册人数就超过1千万。上海市民人均下载APP10—30个,大部分用户每天使用APP时长为3-8小时。数量庞大的网民在使用网络的过程中源源不断地产生着数据。随着长三角一体化的推进,整个长三角地区网民产生的数据也已经成为上海可用的数据资源。
智慧城市建设产生的数据量更为可观。早在2010年,上海就正式提出“创建面向未来的智慧城市”战略,是最早开展智慧城市建设的城市之一。“十三五”期间,上海致力于建设“物联、数联、智联”三位一体覆盖全市的新型城域物联专网,各区也积极推进城市精细化管理,用途各异的传感器遍布城市的各个领域,不间断地采集和传输数据。以浦东新区城市运行综合管理中心为例,该中心可共享设备数据的总数就高达312万个。
上海市政府积极推进政务信息整合、共享和公共数据开放,形成了相对完整的公共数据资源库。上海市政府致力于打造透明高效的智慧政务服务体系,已经基本建成全市统一管理的政务数据资源目录体系,累计汇集数据资源目录2.1万条、数据项32万多个;上海市政府数据服务网累计开放数据集超过1500项,涵盖了经济建设、资源环境、教育科技、道路交通等12个重点领域、11个应用场景,在由第三方机构发布的“中国开放数林指数”评估中,上海市连续三年位列第一。今年8月16日,上海市政府常务会议审议通过了《上海市公共数据开放暂行办法》,为公共数据开放提供了制度保障,开放力度进一步加大。
充分发挥数据优势,打造上海人工智能高地
提高数据的流动性,大幅度地降低获取和使用数据的经济成本和制度成本,才能让丰富的数据资源真正成为人工智能发展壮大的“食粮”。
首先,继续加大公共数据开放力度,创新数据开放模式。
据调研,很多企业希望获得那些与民生紧密相关、社会迫切需要、行业增值潜力显著的高价值公共数据,以开发形成自己的优势产品和服务,但现在的公共数据开放力度和开放形式无法满足他们的需求。
国外有些城市在公共数据开放方面进行了较多的探索。例如,伦敦市政府整合全市交通、安全、经济等跨部门跨行政区的数据,建设了一站式数据开放平台——“伦敦数据仓库”,通过免费的统一API接口为开发人员提供超过80种数据源,从一个系统为1.3万多名开发人员提供准确的实时数据。2017年,利用伦敦交通局的开放数据开发的APP就有675个,供超过41%伦敦人使用。纽约有很多开放式数据门户,方便开发者便捷地获取各领域的海量数据,从而催生了全球最多的智能应用部署,尤其是在医疗健康及政府、社区和住房方面。上海可以借鉴这些城市的做法,在确保数据安全可控的前提下,形成具有上海特色的公共数据开放模式。
其次,合理提供应用场景,鼓励企业发展人工智能。
能直接面对新需求的、开拓性综合应用场景对于人工智能、云计算、物联网、移动互联网等技术的产业化非常重要,而智慧城市是一个大型的综合系统,是智能交通系统、通信系统、智能电网、电子政务等多种系统组成的复杂系统,能够为技术产业化、形成企业联盟乃至创新创业生态系统提供实验平台。
实际上,全世界有不少城市在尝试搭建各种各样的人工智能创新实验平台。例如,迪拜与施耐德电气和SAP公司合作,把“迪拜硅谷绿洲工业区”作为当地智能应用的测试基地,开发智能灌溉系统之类的智能应用,产品成熟之后再将其推广到整个城市。维也纳的Adpern智慧城市是欧洲最大的节能示范项目,由多个政府部门、当地公共事业企业、研究机构和各行业企业共同协作实施,政府辟出新的城市开发区,由消费者对该项目进行测试。
上海市域面积广大,可以选择若干合适的区域作为智能数据、可持续性和城市服务的实验平台,为人工智能企业进行应用试验提供更接近实际的条件。
最后,加强数据市场建设,提高数据资源流动性。
组建上海数据法律和伦理研究中心,发挥上海的人才优势,积极探索与数据采集、数据保存、数据交易、数据使用和数据监管相关的法律问题和伦理问题,建立上海在数据市场领域的学术声誉。鼓励上海数据交易中心开展数据资源定价、交易标准、交易流程、交易管理等试点,并逐步扩大交易范围和增加交易量,建成世界领先的数据交易市场。
上海有着长期信息化和智慧城市建设所积累的海量数据资源,有着对人工智能发展的前瞻性战略性分析与规划,有着各级政府部门系统性的部署与推动,这些都在推动着这座积极进取的城市朝着全球人工智能创新的重要策源地大步迈进。
(作者为中国浦东干部学院教授)
责任编辑: