查看原文
其他

数据要素专题研究:大模型与数据共振,数据要素市场方兴未艾

(报告出品方:国金证券)

1.数据要素市场是数字经济发展的核心引擎

1.1 数据成为生产要素,成为数字经济时代的“石油”

数据要素作为较新的经济学概念,准确清晰地理解和定义数据要素市场相关概念是探索和 培育数据要素市场模式和方向的重要前提,根据国家工业信息安全发展研究中心报告,我 们给出以下对数据、数据资源和数据资产的定义:1)数据:是指所有能够输入计算机程序处理、反映一定事实、具有一定意义的符号介质 的总称。2)数据资源:是指按一定规则排列组合的物理符号集合,用于承载或记录信息,这些信 息可以是数字、文字、图像,也可以是计算机代码的集合。3)数据资产:本质上是产权的概念,是指个人或企业拥有或控制的、以物理或电子方式 记录的能够为个人或企业带来经济利益的数据资源。数据已成为新型生产要素,具有劳动工具和劳动对象的双重属性。生产要素是指进行社会 生产经营活动所必需的资源和环境条件,随着经济的发展,生产要素的具体形态和主次序 列不断变化,传统的生产要素主要包括土地、资本、技术和劳动力,在 5G、物联网、云 计算、大数据、区块链和人工智能等技术的共同作用下,数据对生产的贡献日益突出。作 为新型生产要素,数据具有劳动工具和劳动对象的双重属性,作为劳动对象,数据通过采 集、加工、存储、流通和分析等环节具有价值和使用价值,作为劳动工具,数据通过融合 应用能够提高生产效率,推动生产力的发展。数据要素市场的目标是实现数据要素的市场 化配置,将数据要素从尚未完全由市场配置转向由市场配置的动态过程,其目的是建立以 市场为基础的调配机制,实现数据的流动价值或在流动中产生价值。

数据要素主要通过业务贯通、数智决策和流通赋能三条途径实现自身价值。首先,数据投 入生产的一次价值体现在支撑企业和政府的业务系统运转,实现业务间的贯通,为释放数 据要素的初级价值,政府和企业的主要任务是推进业务的数字化和各类业务信息系统的建 设。其次,数据要素二次价值释放体现在通过加工、分析、建模等过程,揭示出更深层次 的关系和规律,从而使生产、经营、服务和治理等环节的决策更加智慧、智能和精准,该 过程对企业的数据挖掘和分析能力提出了更高的要求。最后,数据要素的三次价值释放体 现在将数据流通到更需要它的地方,让不同来源的优质数据在新的业务需求和场景中汇聚 和融合,实现双赢和多赢的价值利用。

从产业链的角度出发,我们将数据要素市场归结为数据采集、存储、加工、流通、分析和 生态保障六大模块。数据采集环节关注确保数据采集的准确性和全面性。数据存储环节关 注确保数据存储的安全性和实时调用的可行性。数据加工环节关注确保数据加工的精度和 准确性。数据流通环节是数据要素市场的核心环节,关注在保障所有者权利的前提下进行 合理合规的数据流通。数据分析环节关注深度分析和挖掘数据的价值和潜力。生态保障环 节包括数据资产评估、登记结算、交易撮合、争议仲裁以及跨境流动监管等,旨在为数据 要素市场各主体提供有效的保障,并构建一个良好的市场生态。

数据要素产业图谱清晰,国内企业集中度较高。虽然数据要素作为一个较新的经济学概念, 但与数据相关的产业已经在国内经过了较长时间的发展,例如在数据存储方面信创之风已 经提前带领国内数据库反弹复苏,以华为、阿里和腾讯为首的云数据库,以及以达梦、南 大通用为首的传统数据库,还有 OceanBase、GoldnDB 和 TiDB 等国内分布式交易型数据库 快速发展。除此之外,AI 大模型的快速崛起也大幅增加了对模型训练的需求,数据加工 中的数据清洗、标注和审核等工作需求激增,百度 EasyData、海康 NLP 等技术获得关注。数据流通环节作为二级市场的关键环节,在数据确权和隐私计算方面的国内企业如拓尔思、 易华录等公司获得市场资金大幅支持。生态保障的主要参与者是政府机构和组织,例如北 京数据资产评估中心、大数据交易所以及国家数据局等监管机构等。

我国数据要素市场规模持续扩张,数据要素成为数字经济发展新引擎。数字化的本质是在 信息化的基础上,对系统产生的数据要素,利用大数据、AI、区块链等数字技术,进行流 程改造、数据决策、商业模式重构等全新的价值开发,核心目的是实现商业增量。国家工 业信息安全发展研究中心数据显示,我国 2021 年数据要素市场规模达 815 亿元,预计“十 四五”发展期间年均增长率达 25%,有望在 2025 年达到 1,990 亿元的市场规模。同时可 以发现,2022 年我国数据要素市场中数据存储、分析和加工行业位列前三,随着人工智 能和互联网技术的进步,数据量的增大对数据存储提出了更高要求,数据的安全、可靠和 隐私存储市场需求逐步扩张,AI 大模型的快速演进带动数据加工中的清洗和标注工作需 求量激增,我们看好数据要素行业相关企业未来的快速发展。

1.2 政策催化强劲,行业景气度拐点已至

从政策到顶层管理架构,数据要素体系根基逐渐稳固。2019 年党的十九届四中全会首次 将数据列为生产要素,表明国家大力发展数字经济的决心,并标志着数据从资源向要素的 转变。2020 年 4 月,中共中央、国务院发布了《关于构建更加完善的要素市场化配置体 制机制的意见》,明确将数据市场与土地市场、劳动力市场、资本市场和技术市场列为加 快培育的五大核心生产要素市场之一,数据要素进入市场化阶段。2022 年 12 月,国务院 发布“数据二十条”这一纲领性文件,确立了数据要素发展顶层指导框架。2023 年 3 月, 国家数据局成立,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用, 统筹推进数字中国、数字经济、数字社会规划和建设等。地方层面,多个省市密集发布数 据要素相关政策,数据要素产业进入实质性落地阶段。

顶层文件“数据二十条”搭建数据要素“四梁八柱”。2022 年 12 月 19 日,《中共中央国 务院关于构建数据基础制度更好发挥数据要素作用的意见》正式对外发布,又称“数据二 十条”,这是继 2020 年 4 月 10 日发布的《中共中央国务院关于构建更加完善的要素市场 化配置体制机制的意见》之后首次全面明确国家级政策文件中的数据基础制度。“数据二 十条”涵盖了四个制度领域,包括数据产权、流通交易、收益分配和安全治理。在数据产 权方面,建立数据资源持有权、数据加工使用权和数据产品经营权的“三权分置”结构。在流通交易环节,建立场内外结合的数据要素流通和交易制度。在收益分配方面,遵循了 “谁投入、谁贡献、谁受益”的原则。在实行贡献值分配的基础上,还关注公益和相对弱 势群体的利益,在再分配环节进行相应的考虑。在安全治理方面,通过“以链治数”的监 管模式,实现了数据要素的安全可信流通。“数据二十条”的发布对于更好地发挥数据要 素的作用具有重要意义,为数据基础制度的建设提供了全面的指导和规范。

国家数据局获批成立,职责权限明晰集中有望实现数据要素发展再提速。2023 年 3 月,《党 和国家机构改革方案》印发,该方案在保持现有工作格局的总体稳定的前提下,提出了整 合共享和开发利用数据资源的职责相对集中的要求。根据该方案,国家数据局作为国家发 展和改革委员会管理的国家局,负责协调推进数据基础制度建设,统筹推进数字中国、数 字经济、数字社会规划和建设等任务。我国数字经济规模全球排名第二,约占国内经济总量的 40%左右,设立国家数据局展示了与时俱进的态度,体现了国家对数字经济发展的顶 层设计,符合时代要求和发展需求。国家数据局由发展和改革委员会直接管理,有助于消 除部门之间、系统之间和地区之间的壁垒,实现数据要素的互联互通,将解决过去数字经 济管理中的碎片化问题,并减少地方数字经济发展不均带来的数字鸿沟,提高数据交换的 效率和准确性,加快数据要素产业的发展进程。

多个省市成立数据集团,有望成为各地政府参与数据运营的抓手。央企层面,中国电子数 据产业集团于2022年12月成立,是国内首家由中央企业设立的数据产业集团;地方层面, 上海、河南、福建、陕西、成都、南京等地陆续成立数据集团,多为政府主导。数据集团 以数据为核心业务,实现公共数据、行业数据和社会数据的交汇、供给、配置及市场化开 发利用,开展数字资产运营、数据交易服务和数字产业投资。

各地大数据交易所陆续挂牌运营,加速数据要素价值转化。我国自 2014 年开始探索建立 类似证券交易所形式的数据交易机构,随着数据要素相关政策的推动,数据产品交易迎来2.0 时代。2015 年 4 月,贵阳大数据交易所正式挂牌,根据数据交易网,截至 2023 年 6 月 21 日,贵数所已累计集聚“数据商”、“数据中介”等市场主体 629 家,上架产品 1055 个,交易 888 笔,共计交易额达 14443 万元。2021 年 11 月,上海数据交易所揭牌交易, 根据数据交易网,2022 年上海数据交易所数据产品挂牌超 800 个,涉及金融、交通、工 业、通信等 12 个行业领域,交易金额突破 1 亿元。2022 年 11 月,深圳数据交易所挂牌 运营,截至 2023 年 6 月,深数所已累计交易突破 700 笔,覆盖 165 个应用场景,生态合 作机构突破 900 家,汇集数据产品超 1500 个,服务触达 2000 家以上市场主体。截至 2022 年底,全国数据交易所已近 50 家。各大数据交易所交易主题、上架产品以及交易规模都 处于快速发展态势,数据产品和服务类型日益丰富,能够提供数据 API、数据集、数据报 告等多种形式的产品和服务。

土地财政收入增速下降,数据要素探索“数据财政”可能性。土地财政主要指政府通过出 售土地或者收取土地使用权等方式获取财政收入的政策,然而土地资源的有限性在我国经 济转型升级和高质量发展的背景下,探索通过财政税收工具和手段从数字经济的关键要素 中取得一定比重的财政收入,并发挥财政的基础性、支柱性国家治理作用是非常有意义的。数据财政是基于大数据和人工智能等新兴技术的发展,将数据视为新的财富来源的理念, 具体而言数据财政包括数据进入市场之前,在数商组建、数据产品开发、登记等环节的监 管伴随的财政活动,以及数据进入市场之后,在数据开发、服务、再生产等过程,通过财 税手段实现对数据市场的激励和管理。欧洲地区率先对数据服务进行征税,在国际税收改 革背景下提出的一种对数字服务进行征税的新模式,主要针对的是那些利润丰厚但却往往 在欧洲本土纳税不多的跨国数字巨头,给我国推行数据财政提供了参考意义。

“数据财政”制度将在数字经济发展和国家治理中扮演重要角色。数据资源具有公共性, 数据权利分置创新拓宽了数据流通空间,建立数据财政制度是完善数据基础制度的需求, 体现数字经济公共利益和全民共享数字经济红利;同时,数据财政发挥现代国家治理中财 政作用,推动数据要素成为新生产要素,创造良好环境实现要素市场化配置,注入新时代 寓意。数据财政主要通过财政支出和收入发挥治理数据要素市场的功能,在数据市场化起 步阶段应当以财政激励和适当轻税推动数据供需市场发展,并力争形成良性循环;同时确 立数据财政方式和手段,包括归并公共数据、提供公益性服务和有偿服务、采用财税政策 和管理要求等;此外,建立数据财政制度和政策,涵盖公共数据资产管理、数据定价、数 据税收、收入分配等也是试试数据财政的主要工作之一;最后,运营包括主体准入、运营 级次选择、运营体系、税费征管等。由单一强调“土地财政”转向“土地财政+数据财政”双轨并行。相较于土地财政,数据 财政的核心标的从土地转变为数据,从而利用虚拟性、共享性和异质性等特点,排除了土 地资源有限、主体独有不可共享和边际效应等问题。在财政收入方面,数据资源的资产性 让其能够参与抵押活动,同时主要的收入来源变成了数据授权或出售过程中的收入,参考 欧洲地区的数据服务税,还可在数据流通、交易和服务等环节征税。从“土地财政”到“土 地财政+数据财政”双轨并行,这种转变反映了政府财政模式的演进和创新,不仅能有效 避免单一依赖土地财政的风险,还能充分利用数据资源,增加财政收入的多样性,进一步 推动社会经济的发展;同时数据财政也可以为政府提供更准确的数据支持,帮助政府更好 地进行政策决策和提供公共服务。

2.垂类 AI 大模型加速落地,推动数据要素市场发展

2.1 AI 大模型向行业垂类模型落地演进,数据成为核心壁垒

(本文仅供参考,不代表我们的任何投资建议)

文琳编辑

免责声明:转载内容仅供读者参考,观点仅代表作者本人,不构成投资意见,也不代表本平台立场。若文章涉及版权问题,敬请原作者添加 wenlin-swl  微信联系删除。

为便于研究人员查找相关行业研究报告,特将2018年以来各期文章汇总。欢迎点击下面红色字体查阅!

文琳行业研究 2018年—2023年6月文章汇总


今日导读:点击下面链接可查阅

公众号 :文琳行业研究

  1. 2023企业新媒体矩阵营销洞察报告

  2. 2023中国社交媒体平台指南

  3. 2023中国通用大模型内容生成及安全性能力评测报告

  4. AI教育行业研究:看好智慧教育、教育信息化和AI人才培训

  5. 2023中国教育行业市场需求洞察报告

  6. 洞察抖音教育新生态

  7. 2023彩票行业深度报告

  8. 2023全球手游买量报告

    ▼长按2秒识别二维码关注我们


《文琳资讯》

提供每日最新财经资讯,判断经济形势,做有价值的传播者。欢迎关注

今日导读:点击下面链接可查阅

  1. 证监会召开重磅会议!

  2. 国资委部署专项行动!聚焦15个重点产业领域

  3. 2023年中国经济金融展望报告

  4. 罕见狂欢!中概股"接力"暴涨,牛市最强信号来袭!高盛:做多中国窗口现已打开

  5. 人口转折点


▼长按2秒识别二维码关注我们
公众号 :就业与创业
点击下方可看
  1. 曾两次倾家荡产,他最终靠股票赚来巨额财富,有何启示?

  2. 私募基金员工跟投实务探析

  3. 说说这位混得最差的公务员:是什么让他把一手好牌打烂?

  4. 6年攒20万后,90后女生裸辞回乡过低欲望生活,是一种怎样的体验?


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存