大数据是信息化发展到一定阶段的产物。随着信息技术和人类生产生活深度融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会进步、国家治理、人民生活都产生了重大影响。习近平同志在中共中央政治局就实施国家大数据战略进行第二次集体学习时指出,大数据发展日新月异,我们应该审时度势、精心谋划、超前布局、力争主动,深入了解大数据发展现状和趋势及其对经济社会发展的影响,分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。这一重要讲话精神,为推动实施国家大数据战略指明了方向和任务。
我国大数据发展具有独特优势
综观世界,我国大数据发展具有独特优势。虽然很多国家把经济数字化作为实现创新发展的重要动能,在前沿技术研发、数据开放共享、隐私安全保护、人才培养等方面进行前瞻性布局,一些发达国家还相继出台了大数据发展规划,但没有一个国家能像中国这样将发展大数据上升为国家战略,并持续深入推动。2015年,党的十八届五中全会提出“实施国家大数据战略”;2016年,“十三五”规划纲要对全面促进大数据发展提出方向性目标和任务;2017年,党的十九大报告提出“推动互联网、大数据、人工智能和实体经济深度融合”。这种持续性的方向引导和顶层设计,使我国在大数据发展规划布局、政策支持、资金投入、技术研发、创新创业等方面均走在了世界前列。而且,我国在数据资源上具有规模化和多样化优势,在互联网和移动互联网数据应用上具有后发优势,涌现出一批基于大数据应用的创新企业。所有这些都表明,我国运用大数据推动创新发展具备比较好的基础和条件,也说明党和国家实施大数据战略的极端重要性和正确性。
但也要看到,我国大数据发展整体上仍处于起步阶段。虽然快速发展的格局基本形成,但在数据开放共享、核心技术突破、以大数据驱动发展等方面都面临重重挑战。在推动实施国家大数据战略中,实践路径仍不够清晰,对需求的认知还比较模糊;数据开放共享滞后,数据资源红利尚未得到充分释放;企业赢利模式不稳定,产业链坚韧性和完整性不足;核心技术尚未取得重大突破,应用仍处于较低水平;安全管理与隐私保护存在漏洞,制度体系仍不够完善;市场活跃程度不够,人才供给严重不足。这些突出问题是制约我国大数据发展的主要因素。目前,大数据发展正进入从概念推广到应用落地的关键时期,科学认识大数据、增强对大数据发展规律的把握能力十分重要和必要。
准确把握大数据价值产生的规律
从根本上说,制约我国大数据发展的问题在很大程度上源于认识和思维层面,即源于对大数据的内涵、大数据价值产生的机理和规律认识不清。大数据价值产生有其内在规律,只有深刻认识并掌握这些规律,才能提高科学运用大数据的能力。
数据量大是大数据具有价值的前提。当数据量不够大时,它们只是离散的“碎片”,人们很难读懂其背后的故事。随着数据量不断增加,达到并超过某个临界值后,这些“碎片”就会在整体上呈现出规律性,并在一定程度上反映出数据背后的事物本质。这表明,数据量大是数据具有价值的前提,大数据具有大价值。大数据的“大”是相对的,与所关注的问题相关。通常来说,分析和解决的问题越宏观,所需要的数据量就越大。
数据关联是大数据实现价值的基础。运用大数据解决的问题通常涉及多部门、多领域、多个体、多视角,单纯的数据量的积累不一定能让人认识事物的全局,只有将不同侧面、不同局部的数据汇聚起来并加以关联,才能产生对事物的整体性和本质性认识。数据汇聚使数据可能产生价值,数据关联使数据实现价值,因此必须推动数据开放共享。政府、企业是大数据的主要拥有者。要推动大数据转化为发展动能,就要保障数据供给和合理合法开放共享。
计算分析使大数据最终产生价值。大数据通常价值巨大但价值密度低,很难通过直接读取提炼价值。只有通过综合运用数学、统计学、计算机等工具进行大数据分析,才能使大数据产生价值,完成从数据到信息再到知识和决策的转换。大数据价值链包括数据采集、流通、储存、分析与处理、应用等环节,其中分析与处理是核心。如果只存储不分析,就相当于只买米不做饭,产生不了实际效益。当前,我国大数据产业在某些环节(如储存)过于集中,有产能过剩之虞,但在分析与处理环节的产能又严重不足,这应引起关注。还要看到,传统用于分析数据的统计学方法和数据挖掘方法对于大数据并不适用,必须重建大数据的统计学基础、计算基础与数据挖掘方法基础。
广泛使用使大数据效益倍增。大数据及其产品具有易复制、成本低、叠加升值、传播升值等特点,能够被广泛、重复、叠加使用,具有较高的边际效用和正外部性。同一组数据不仅可以在合理合法的前提下以较低成本提供给不同使用方,使单一数据服务多个主体;而且还可以针对不同目的、使用不同方法进行分析,使单一数据产生多样价值。因此,大数据能够一次投入、反复使用,产生倍增效益,有利于提升各行各业应用数据解决困难和问题的能力。
大数据是新型生产要素和重要的基础性战略资源,蕴藏着巨大价值,经过深入挖掘并加以应用,能够有力推动经济转型发展,重塑国家竞争优势,提升国家治理现代化水平。大数据是能够靠制度、积累、科技撬动的,因而可以成为欠发达地区异军突起的发展驱动力。大数据具有通用技术性,可以广泛而深入地应用于企业生产、政府管理和社会治理、民生改善等各个领域,产生难以估量的价值和效益。各级领导干部、企业家、创业者乃至全民都应形成大数据思维,提高自觉、合法、有效利用大数据的意识,增强利用数据推进各项工作的本领,使大数据在经济社会发展中发挥更大作用。
突破瓶颈,深入实施国家大数据战略
习近平同志关于“分析我国大数据发展取得的成绩和存在的问题,推动实施国家大数据战略”的重要论述表明,推动实施国家大数据战略必须坚持问题导向,审时度势、精心谋划、超前布局、力争主动,努力突破大数据发展瓶颈。
解决好宏观规划落地问题。“十三五”规划纲要和习近平同志在中共中央政治局第二次集体学习时的重要讲话,对实施大数据战略作出了宏观规划和顶层设计。各级政府部门应尽快制定实施细则,解决好宏观规划和顶层设计的落地问题。第一,既要补齐汇聚数据与分析数据的短板,又要谨防存储等环节产能过剩,防止出现重存储、轻分析的情况,促进大数据产业健康发展。第二,引导数据中心合理布局,充分发挥大数据国家工程实验室作用,整合分散的数据资源,推进重点领域大数据高效采集、有效整合。第三,推进数据资源整合和开放共享,确保数据资源供给。第四,把握“一带一路”建设机遇,有序推进数据跨境流动。
加强核心技术攻关。应集中力量协同攻关,突破大数据的十大技术瓶颈,包括数据供给层面的区块链技术、数据交换技术,数据处理层面的大数据存储管理技术、分布式计算技术、编程语言技术,数据分析层面的大数据基础算法、机器学习、数据智能技术,大数据应用层面的大数据可视化、真伪判定技术。加强大数据科学基础问题研究,围绕大数据科学理论体系、大数据计算系统与分析理论、大数据驱动的颠覆性应用等重大基础研究进行前瞻布局。加强现代信息技术的综合应用,推动互联网、大数据、人工智能同实体经济深度融合,谨防将现代信息技术孤立化、概念化。
在重点领域实现突破。巩固我国大数据发展优势,除了推动大数据产业创新发展,还必须在重点领域实现突破。一是鼓励电力、交通、金融、互联网、制造业等一批对国家经济影响巨大、数据丰富、相对容易共享的行业率先运用大数据加快发展,起到示范和带动作用。二是推动大数据在政府治理、民生服务领域实现重点突破,如推动法院、信访系统等积极应用大数据技术,提升政府决策和风险防范水平,推动从源头上预防社会矛盾,提高社会治理的精准性和有效性。三是在教育、医疗、住房、交通等民生服务领域布局一批大数据应用工程,促进相关领域转型升级,显著提升公共服务水平,增强人民群众获得感幸福感。
加快建设人才队伍。当前,有关大数据发展的人才需求旺盛,迫切需要加快相关领域人才队伍建设。一是通过组建大数据服务中心、激活大数据产业市场、加强教育培训等,鼓励数学、计算机科学、信息技术等领域的人才转型进入大数据领域。二是根据发展需求,完善配套措施,鼓励海外高端人才回国,积极引进大数据高层次人才和领军人才。三是构建多层次大数据人才培养体系,鼓励高校设立数据科学和数据工程相关专业,鼓励采取跨校联合培养方式开展跨学科大数据综合型人才培养。四是实行行业、学会、大学协同育人,培育大数据技术和应用创新型人才。
切实保障国家数据安全。大数据蕴含着巨量信息,随着大数据的广泛应用,国家数据安全逐渐成为国家安全的一项重要内容。保障国家数据安全,根本之策是建设自主可控的大数据安全体系。应以国家各类重要信息基础设施建设为突破口,推进国产芯片、国产网络设备、国产操作系统、国产数据库和国产云平台、云存储、云安全等关键软硬件产品大规模应用,分期分批实现关键软硬件的自主化。强化大数据技术在信息安全领域的创新应用,加强对关键安全技术的研发,抢占基于大数据的安全技术先机,形成自主核心技术优势,提高我国大数据安全技术水平,逐步形成大数据传输、存储、挖掘、发布以自主可控技术和设备为主的格局。还应加快法规制度建设,在法律框架下明确国家、集体、个人的数据权益,制定数据资源确权、开放、流通、交易相关制度,完善数据产权保护制度,有效维护人民利益、社会稳定、国家安全。
(作者分别为中国科学院院士、西安交通大学管理学院副教授)