声明
摘要
第1章 绪论
1.1 研究背景
1.2 选题依据
1.3 本文研究的内容和贡献点
1.4 本文的组织结构
第2章 相关工作
2.1 传统数据结构的实体解析
2.2 复杂数据结构的实体解析
2.3 基于语义信息的实体解析
2.4 实体解析的优化策略
2.5 本章小结
第3章 背景知识和相关定义
3.1 相关定义
3.2 基于属性权重方法的分析
3.3 基于标记记录方法的分析
3.4 本章小结
第4章 基于属性权重的实体识别方法
4.1 属性权重的分配
4.1.1 信息增益方法
4.1.2 概率统计方法
4.2 最佳匹配属性的选择
4.2.1 top-k方法
4.2.3 阈值方法
4.3 相似度计算
4.4 基于Blocking技术的优化策略
4.5 本章小结
第5章 基于标记记录的合并方法
5.1 挑战
5.2 基于标记记录的合并算法
5.2.1 父子关联关系
5.2.2 合并算法
5.3 算法的性能分析
5.3.1 存在的合并算法性能分析
5.3.2 M-Swoosh算法的性能分析
5.4 本章小结
第6章 实验结果与分析
6.1 实验环境和评测标准
6.2 基于属性权重的实验分析
6.2.1 解析结果的评价
6.2.2 解析时间的优化
6.3 基于标记记录的实验分析
6.3.1 记录比较次数的对比
6.3.2 运行时间的对比
6.4 本章小结
第7章 结论
7.1 工作总结
7.2 工作展望
参考文献
致谢
攻硕期间参加的项目及发表的论文