首页> 中文会议>2016年全国通信软件学术会议 >基于条件随机场的文献记录分析算法

基于条件随机场的文献记录分析算法

摘要

随着互联网的快速发展,网页已成为获取信息的主要来源.为了使出版机构能够及时从大量网页中发现所需文献,需要设计能够从HTML页面中自动提取文献信息的算法.为此,本文设计了基于条件随机场的文献记录分析算法:首先,设计了文档对象树的分割算法,通过分割标记将页面数据分成独立的部分,这些数据块由标签和文本序列构成;随后,将该序列作为条件随机场模型的特征向量,建立文献信息标记模型;最后,设计启发式算法,从标记模型中提取文献信息数据,并通过实验验证了其有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号