摘要: 为保证数据迁移后新系统的数据质量把数据清理应用于数据迁移之中提出一种集成数据清理的交互式数据迁移系统并分析其工作原理.为了提高该系统中相似重复记录的检测效率在相似重复记录检测中采用长度过滤等方法优化相似检测算法避免了不必要的编辑距离计算从而提高了整个数据迁移系统的数据迁移速度.此外构造了合适的实验环境作了大量的检测实验实验结果验证了长度过滤方法的科学性.
中图分类号:
陈伟 丁秋林 谢强. 交互式数据迁移系统及其相似检测效率优化[J]. 华南理工大学学报(自然科学版), 2004, 32(2): 58-61.
Chen Wei Ding Qiu-lin Xie Qiang. Interactive Data Migration System and Its Approximately-detecting Efficiency Optimization[J]. Journal of South China University of Technology(Natural Science Edition), 2004, 32(2): 58-61.