我国首次数据资源“全面体检” 来看都有哪些新发现

　　今天(24日)，在第七届数字中国建设峰会上，《全国数据资源调查报告(2023年)》正式发布。这是我国首次对数据资源进行“全面体检”。根据国家数据局等多部门的最新调查结果，我国数据生产的规模优势基本形成。

　　我国数据年产量相当于千万个国图的数字馆藏

　　2023年，全国数据生产总量达到32.85泽字节(ZB)，这相当于1000多万个中国国家图书馆的数字资源总量。和2022年相比，我国数据年产量增长22.44%，其中，和智能网联汽车相关的出行数据，同比增幅达到49%；和工业机器人等智能生产设备相关的制造数据，同比增幅为20%。今年，预计我国数据生产量增长将超过25%。

　　国家工业信息安全发展研究中心主任蒋艳：随着5G、AI技术的快速发展，内容制作、影像视听等民生消费领域的新的业态不断涌现，随之带来的非结构性数据对我国数据总规模的贡献是巨大的。

　　与此同时，调查发现：在2023年全年生产的数据量中，只有2.9%被存储，这意味着一些数据在源头就被抛弃；另外，在存储数据中，一年未使用的数据占比约为四成，这说明不少数据被存储后不再被读取和复用。

　　北京交通大学信息管理理论与技术国际研究中心教授张向宏：数据生产多、存储少，这是一个全球的普遍规律，数据就像我们的水果一样，容易腐烂而会失去价值。当然从另一方面也说明，我国在数据资源开发利用方面还有待于进一步提高。

　　算力规模增长快智能算力占比约30%

　　算力，被称为人工智能的“发动机”，是新质生产力。新出炉的《全国数据资源调查报告(2023年)》显示，我国算力规模增长快，大模型计算需求不断增加。

　　到2023年年底，全国2200多个算力中心的算力规模约为230百亿亿次浮点计算/秒(EFLOPS)。什么概念？这可以让100辆新车的上万次碰撞测试在1分钟内完成。在过去的2023年，全国算力规模同比增长约为30%。目前，在所有算力中，智能算力占比提高到约30%。

　　中央财经大学中国互联网经济研究院副院长欧阳日辉：智能算力的需求增长这么快，主要来自大模型的发展，我们的通用大模型发展很快，行业的垂直的这种大模型发展也很快。比如说，我们在金融行业、医疗行业、政务领域里面，对智能大模型和智能算力的需求是越来越大。

　　在算力的区域分布上，最新调查结果显示，京津冀、长三角、珠三角地区的算力规模占比达到近60%，东部地区的数据存储和计算利用率要高于西部地区。

　　2023年我国公共数据开放量同比增长16%

　　公共数据，是数据领域中最大的“富矿”。《全国数据资源调查报告(2023年)》显示，我国公共数据开放共享已经初见成效。

　　2023年，我国公共数据开放量同比增长16%；省级政府开放数据量比2022年增长18.5%。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索“公共数据授权运营机制”，就是把公共数据拿出来，授权给相关企业，形成公共数据产品，向社会提供服务。

　　中央财经大学中国互联网经济研究院副院长欧阳日辉：我们看到公共数据对外开放的量增速非常快，也可以看到公共数据获取的渠道和场景越来越丰富。

　　今年以来，记者注意到，不少地方纷纷成立“数据集团”，加快盘活公共数据。不过整体来看，现有的数据供给难以满足当下旺盛的需求，例如，在数据交易机构中，消费民生领域数据产品购买方数量是供给方的2.4倍。

　　国家工业信息安全发展研究中心主任蒋艳：随着数据技术快速发展，数据基础制度不断完善，数据产业发展壮大，数据资源开发利用水平不断提升，供需不匹配的现象将在一定程度上得以缓解。

　　(总台央视记者刘柏煊陈茜高淼黄玮李鹏冲)

【编辑:张燕玲】

相关推荐