TP-AS:一种面向长文本的两阶段自动摘要方法

王帅; 赵翔; 李博; 葛斌; 汤大权

首页> 中文期刊> 《中文信息学报》 >TP-AS:一种面向长文本的两阶段自动摘要方法

TP-AS:一种面向长文本的两阶段自动摘要方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着互联网上信息的爆炸式增长,如何有效提高知识获取效率变得尤为重要.文本自动摘要技术通过对信息的压缩和精炼,为知识的快速获取提供了很好的辅助手段.现有的文本自动摘要方法在处理长文本的过程中,存在准确率低的问题,无法达到令用户满意的性能效果.为此,该文提出一种新的两阶段的长文本自动摘要方法T P-AS ,首先利用基于图模型的混合文本相似度计算方法进行关键句抽取,然后结合指针机制和注意力机制构建一种基于循环神经网络的编码器—解码器模型进行摘要生成.通过基于真实大规模金融领域长文本数据上的实验,验证了TP-AS方法的有效性,其自动摘要的准确性在ROUGE-1的指标下分别达到了36 .6%(词)和33 .9%(字符),明显优于现有其他方法.%With the explosive growth of information on the Internet ,it becomes more important to improve the effi-ciency of knowledge acquisition.Automatic text summarization techniques provide a good means for fast knowledge acquisition by compressing and refining information.Existing automatic text summarization methods ,when dealing with long text ,exhibit poor accuracy ,and fail to meet users' need for performance.In this paper ,we propose a two-phase automatic summarization method for long text ,namely ,TP-AS .Firstly ,it employs a hybrid semantic similarity computation method based on a graph model to extract key sentences .Then ,it constructs a recurrent neural network encoder-decoder model with attention and pointer mechanisms to generate summaries .Through experiments on real large-scale long-text corpora in financial area ,the effectiveness of TP-AS is verified ,and its accuracy for automatic summarization notably outperforms other existing methods .

著录项

来源
《中文信息学报》 |2018年第6期|71-79|共9页
作者
王帅; 赵翔; 李博; 葛斌; 汤大权;
展开▼
作者单位

国防科学技术大学信息系统工程重点实验室,湖南长沙410073;

国防科学技术大学信息系统工程重点实验室,湖南长沙410073;

地球空间信息技术协同创新中心,湖北武汉430079;

国防科学技术大学信息系统工程重点实验室,湖南长沙410073;

国防科学技术大学信息系统工程重点实验室,湖南长沙410073;

地球空间信息技术协同创新中心,湖北武汉430079;

国防科学技术大学信息系统工程重点实验室,湖南长沙410073;

地球空间信息技术协同创新中心,湖北武汉430079;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
自动文本摘要; 自然语言处理; 抽取和生成; 循环神经网络;

相似文献

中文文献
外文文献
专利

1. 一种面向自动文本摘要特征评价的新方法 [J] . 王大亮 ,孙建涛 ,陆玉昌 . 计算机工程与应用 . 2004,第033期
2. 一种基于BERT的自动文本摘要模型构建方法 [J] . 岳一峰 ,黄蔚 ,任祥辉 . 计算机与现代化 . 2020,第001期
3. 一种新的基于段向量的文本自动摘要方法 [J] . 申强强 ,熊泽宇 ,熊岳山 . 计算机工程与科学 . 2019,第006期
4. 一种面向自动化标检的文本分类方法 [J] . 郭泽 ,焦倩倩 . 现代防御技术 . 2020,第005期
5. 一种面向突发事件的文本语料自动标注方法 [J] . 刘炜 ,王旭 ,张雨嘉 . 中文信息学报 . 2017,第002期
6. 一种面向论文标题和摘要的短文本分类研究 [C] . Xue Feng ,薛峰 ,Hu Yue . 全国第27届计算机技术与应用（CACIS）学术会议 . 2017
7. 面向长文本的两阶段自动摘要算法关键技术研究 [A] . 王帅 . 2017

TP-AS:一种面向长文本的两阶段自动摘要方法

摘要

著录项

相似文献

相关主题

期刊订阅