对大规模数据集的公正与效用导向的质量评估的理解 Academic Article uri icon

abstract

  • 在复杂的数据环境中建立并维持非常高的数据质量是很昂贵并且往往不可能实现的. 对质量的定量评估能够为制定改进措施的优先顺序提供重要的帮助. 本文探索了一套方法, 能够对数据质量的公正评估与效用导向评估两种方法进行评价. 公正评估可以评价和衡量数据缺陷的程度, 效用导向的评估能够衡量在一个特定的使用环境中, 质量缺陷的存在对降低数据效用的程度. 本文介绍的质量评估方法通过一个实际的校友数据库得到了实际验证. 这个数据库是一个巨大的数据资源, 它对校友关系和发起的承捐活动进行管理. 质量评估的结果能够为这个数据库执行和管理改进数据质量的策略提供帮助.

publication date

  • January 1, 2008

published in