热点推荐词:

行业动态

下一代数据治理三大趋势

文字:[大][中][小] 手机页面二维码 2024/2/6     浏览次数:    

  近年来,我国大数据产业一直处于持续向上向好的态势。中国信通院作为行业智库和产业创新发展平台,始终通过行业研究与各位同仁同频共振,梳理和总结发展的趋势、面临的挑战,形成体系化的观察。在2023数据资产管理大会——数据资产化分论坛上,中国信通院云计算与大数据研究所尹正发表了《下一代数据管理,敏捷化、分布式、智能化》的主旨演讲,总结了数据管理的变革趋势,和中国信通院在数据管理发展的未来规划。

演讲内容如下

  大家好,非常高兴时隔多年终于在线下办数据资产管理大会。今天由我为大家带来《下一代数据管理,敏捷化、分布式、智能化》的主旨演讲,也是基于我们以前对数据管理研究的成果做基本介绍。

  2023年我国在数据领域、科技产业有很大进步,实行了很多重点举措。比如“数据二十条”的颁布,“数据要素”的提出和迅速落地,国家数据局的成立和近期发布很多相关的制度,像数据基础设施和数据成本计划等等。

  

  关于大模型方面,我们认为大模型更像是数据原生的应用。以前提数据应用大多是从软件思维出发,大模型的出现让我们看到数据应用应是从数据思维出发来解决问题,这也给我们带来很多的新想法、新思考,让我们看到很多发展的契机。

  基于此,我们发现几点变革趋势。

  

  第一是流程变革:从职能驱动到流程驱动。

  举一个例子,我们之前调研一个大的企业,技术对接人半年换十几个人,业务突然进行不下去,这就是职能驱动的劣势。流程驱动的好处是每个人在流程当中处理一件事情,可以明确个人的责任和义务,以及看到目前存在的问题,并从流程上进行优化。

  基于此,我们于今年四月份发布了Dataops白皮书,同时更新了Dataops2.0白皮书。丰富了实践成果,给出了规范、流程、度量的标准,从效率、质量、成本上提升了收益。

  

  第二是架构变革:从集中式架构到分布式架构。

  结合目前的需要,越来越多企业面临着数据量越来越大和数据链路越来越长的问题,许多集团被如何处理和下面分、子公司之间的数据关系所困扰。

  从现在来看越来越多企业考虑分布式管理的形式,个人认为这是一种顺势而为的管理理念。因为数据就是在各个公司领域产生的,如果被动的把他们集中起来再用,这个链本身就会加长。对于此,我们与中国移动集团共同研究下一代的数据治理体系,并共同产出了《通信行业数据编织技术白皮书》。

  

  第三个趋势是体系变革:从BI数据管理到AI数据管理。

  数据量的倍增和非结构化数据的持续增长使我们面临着新的问题。以前更多的关注点在如何治理结构化数据。随着大模型的产生,迫使我们重新思考非结构化数据治理的问题,许多方面的内容都需要重新补充,比如对非结构化数据质量的评价、智能化的数据治理、面向人工智能的数据治理等方面。

  目前,我们已经启动了人工智能数据治理白皮书的编制工作,从AI for DG和DG for AI两个角度阐明人工智能与数据治理之间的关系。

  

  在Dataops方面将今年形成完整的体系框架,发布《DataOps实践指南1.0》,24年持续的迭代更新2.0版本,其中包括了方法论和体系标准的完善。

  在Data Fabric方面,今年启动基于数据虚拟化的调研,明年会陆续的发布数据编织基本能力要求,给予产业指引,探索如何一步步构成数据编织式数据架构。
  在AI数据治理方面将会在非结构化数据治理体系、智能化数据治理体系、多模态数据治理体系等方面进行探索。
  谢谢大家。

返回上一步
打印此页
[向上]