首页> 中文期刊> 《中文信息学报》 >微博客蕴含交通事件信息抽取的自动标注方法

微博客蕴含交通事件信息抽取的自动标注方法

         

摘要

微博客文本蕴含丰富的实时交通事件信息,能够为现有交通信息采集手段提供补充.然而,当前事件抽取方法缺少对地理实体关系的判断过程,对涉及多个地理实体及关系表达的地理空间要素抽取效果不佳,难以准确识别交通事件信息的位置描述.该文提出一种自动标注方法,将地理实体关系识别引入事件抽取过程来解决这一问题.该方法利用条件随机场模型实现交通事件角色标注,利用支撑向量机模型实现角色关系与要素关系标注,完成了交通事件信息空间要素识别.以新浪微博为数据源开展的实验分析表明,该文所提出的微博客蕴含交通事件抽取方法,正确率和召回率均达到90%,优于现有的基于模式匹配的抽取方法.%Microblog messages usually contain a great amount of real-time traffic information which can complement the sensor based traffic information collecting technologies.In this paper,we propose an automatic event labeling method to extract traffic information from microblog messages.Specifically,we apply the spatial relation identification between geographic entities in event extraction to determine the spatial elements in traffic event messages.Firstly,a conditional random field model is used to label the event role in the message texts.Secondly,the relations between the roles and the relations between the elements are tagged by SVM models.The experiment on Sina microblogs shows the precision and recall of the proposed approach are both over 90%,which is superior to the wellknown pattern matching method.

著录项

  • 来源
    《中文信息学报》 |2017年第2期|107-116|共10页
  • 作者单位

    中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101;

    中国科学院大学,北京100101;

    中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101;

    中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101;

    中国科学院大学,北京100101;

    中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室,北京100101;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    微博客; 信息抽取; 交通事件; 条件随机场; 支撑向量机;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号