热点推荐词:

行业动态

数据保存的策略必须适应新兴技术及数据增长需求

文字:[大][中][小] 手机页面二维码 2024/6/18     浏览次数:    

  当前GenAI、物联网、区块链技术的高速发展,数据要素的重要性和数据资产价值变现的需求使得组织越来越关注数据的量级、增长能力及高质量。

  但是也带来一个很现实的问题,组织如何处置大量的存量数据及持续新增数据的存储及管理。

  大量过时的、无价值的、当前无价值的数据的保存及运管将给组织带来资源的浪费,常规僵化的数据生命管理策略将不适应现状数据管理及新兴技术的变化。

  重新评估过时的数据生命周期和保留策略

  企业必须重新评估、重新思考和现代化其数据保留策略,不仅要保护企业数据,还要遵守不断扩大的全球数据隐私法规生态系统。

  由于数据源的庞大数量跨越多个资产和不同目的地的不同系统,复杂性是前所未有的。因此,组织必须在整个数据生命周期中重新评估其数据治理框架,包括数据分类(例如,自动标记数据及其持续时间)、数据保护、数据清洁和数据销毁。

  一旦确定了组织内数据增加的驱动因素,企业在开始更新数据保留策略之前应采取以下步骤:

  执行数据审计:公司必须首先确定生成、存储或处理数据的所有来源。当今的许多组织都采用混合数据存储方法,使用本地、云和端点存储来满足其需求。例如,敏感或关键数据可以存储在本地以增强安全性,而不太敏感的数据或存档数据可以存储在云中。虽然在员工设备端上存储数据可能会提供更多便利,但如果设备丢失、被盗或受损,它也可能容易受到数据丢失或被盗的影响。实施端点安全措施(如加密、数据备份和执行远程数据清理的能力)对于保护公司数据至关重要。最后,记录审计结果也很重要,包括发现的任何漏洞或风险。此类文档将作为制定补救计划和改进数据存储实践的基础。

  对数据进行分类:审计完成后,应根据数据对组织的敏感性和重要性对数据进行分类,并将其放入包含个人身份信息 (PII)、财务数据、知识产权或敏感业务信息的“存储桶”中。此步骤应包括确定数据的陈旧时间,将“良好”数据与冗余、过时和琐碎 (ROT) 数据分开,以及标记不再需要通过数据清理立即销毁的任何数据。

  降低克隆数据带来的风险:从本地到云端的数据复制是企业的常见问题。这不仅增加了存储的数据(和存储成本),还增加了因泄露而导致数据被盗的风险。管理克隆问题的第一步是确定哪些数据被复制了,以及它位于何处。对数据位置的调查可以更好地了解数据是如何克隆的,以及谁可能未经授权访问它。克隆数据还可能包括敏感信息和/或 PII。使用加密等保护措施可以保护数据,无论数据是在传输中还是“静态”。最后,应从所有存储位置和备份中安全地擦除克隆的数据。

  数据盘点并确认数据的可信及数据的确权:解决数据是否是组织中有价值的数据的首要步骤是通过数据盘点来梳理,按价值链、按业务链盘点组织当前所拥有的数据有什么?能不能满足组织数字化转型的需要,哪些业务需要进行进一步的业务数字化,哪些业务已可以进入数字业务化阶段,有哪业务数据将可以通过数据产品去实现数据资产化及资产变现等。建议较合理的做法是在盘点过程中技术与业务共同协作将元数据信息补充完整,同时将数据的可信认证及数据的所有权、使用权、管理权等数据权属进行确认,数据安全的分类分级可以在此过程中或者在后续通过智能工具进行分级打标。

  面向人工智能时代的数据保留策略

  随着组织采用 AI,他们还必须调整数据生命周期和保留策略。一旦审计、分类和调查阶段完成,公司将能够更好地更新保留策略以反映当今的 IT 环境。适合 2024 年的政策的一个关键方面是可扩展性,以适应训练和部署 LLM 所需的不断增长的数据量。重申一下,为了获得更好的 AI 结果(和 ROI),数据必须准确、最新且完整。

  当今有效的数据保留计划还需要有效的生命周期管理和治理流程,这些流程优先考虑明确的保留策略和程序,以确定保留期、数据清理流程以及问责制和报告措施。

  最后一点,数据越多,与数据隐私、合规性和安全性相关的风险就越大。组织必须实施强有力的措施来保护保留的数据免受未经授权的访问、泄露和滥用。除了采用加密、访问控制和匿名化技术外,进行一致的安全审计还可以有效地保护敏感信息并遵守越来越多的全球隐私法规。

  重新评估任何政策都需要时间和大量协作工作。但是建立新的数据生命周期流程和数据保留策略的艰苦过程将使公司能够为在人工智能时代更有效地利用数据奠定坚实的基础,同时降低风险并确保合规性。

转载自公众号lishan 转型数据治理

返回上一步
打印此页
[向上]