数据是数字经济时代的关键生产要素。然而,数据价值看不见、摸不着,交易时缺乏依据,种种问题制约着数据要素市场的发展。
基于在全国近百家企业的数据资产服务经验,近日,开鑫科技全资子公司鑫元数科成功取得“基于机器学习融合效益与市场因素的数据资产估值方法”发明专利。该方案融合机器学习与博弈论中的夏普利值,让数据价值得以量化呈现。

从“难以估量”到“心中有数”
简单来说,本专利可以理解为一套科学评价数据“贡献度”的体系。首要维度是场景化评估,给数据一个“相对价格”,针对它在具体业务场景中发挥的作用来评价其价值。第二个维度是公平分配,借鉴“夏普利值”原理,通过大量模拟计算量化每条数据对模型结果的边际贡献。第三个维度是机器学习驱动,以机器学习模型为技术载体,通过模型性能的变化客观反映数据效用。
针对夏普利值在大数据量时计算复杂的问题,开鑫科技设计了差异化计算路径。对小型简单场景,可执行精细化“逐点评估”,深入分析每一条数据的价值。对大规模复杂场景,则采用“分块评估”与蒙特卡洛采样等近似算法,在保证时效的同时输出可靠评估结果。
数据“用得明白”、投入“花得放心”
该技术在多个现实场景中具有重要应用价值。
对数据投入方而言——花钱获取数据资源不再“凭感觉”。假设一家医院已有一套病理数据用于疾病预测模型,此时想引入新的数据源来提升诊断准确率。利用本专利方法,医院可以基于现有诊断模型,分别加入新数据进行效果测试,计算新数据中每条记录对模型效果的“贡献值”,并结合市场因素形成定价参考,让采购决策有据可依。
对数据持有方而言——清晰呈现数据价值。以金融行业为例,金融机构拥有大量企业财务数据,希望将其用于信贷风险评估并实现资产化。本技术可以分析数据集里哪些财务指标、哪些时间段的数据对风控模型贡献最大、价值占比如何,为数据交易、资产化提供量化支撑。
对数据管理者而言——优化数据资源配置。在内部数据治理中,该方法能帮助识别哪些数据质量高、效用显著,应重点维护和采购;哪些数据价值较低,可考虑归档或清理;从而实现数据资源的精细化管理。
一直以来,开鑫科技力争创新,致力于让数据价值的“隐性贡献”变得“显性可见”,让“无形资产”变得“有价可依”。相关方法已成功落地实践——旗下鑫欣保理2025年成功发行全国首单数据资产ABS,持续引领数据资产金融创新。未来,开鑫科技将在数据要素领域持续深耕,助力数据价值被看见、被衡量、被激活,释放其作为生产要素的巨大潜力。