古汉语双字词自动获取方法的比较与分析

段磊; 韩芳; 宋继华

首页> 中文期刊> 《中文信息学报》 >古汉语双字词自动获取方法的比较与分析

古汉语双字词自动获取方法的比较与分析

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Word extraction is of great importance in the research fields of natural language generation, computational lexicography, parsing, corpus linguistic, etc. To address the issue of automatic extraction of two-character word from ancient Chinese, this paper takes the "Records of the Grand Historian" corpus as an example, and uses the statistical methods that based on frequency, mutual information and hypothesis testing to extract two-character word, respectively. Then it compares and analyzes the results according to the manual marked result in detail. It paves the way for the scheme design for the two-character word extraction from ancient Chinese in different applications.%词汇的自动获取在自然语言生成、计算词典编纂、句法分析以及语料库语言学等领域均有着重要的研究价值.该文针对古汉语双字词的自动获取问题,以《史记》全文语料为例,分别应用基于频率、互信息、假设检验的统计方法获取古汉语双字词,并结合人工标注结果进行了详细的比较和分析,评价了各方法的优缺点及可靠性,为不同应用背景下的古汉语双字词自动获取提供了相应的解决方案.

著录项

来源
《中文信息学报》 |2012年第4期|34-42|共9页
作者
段磊; 韩芳; 宋继华;
展开▼
作者单位

北京师范大学计算机科学与技术学院,北京100875;

北京师范大学计算机科学与技术学院,北京100875;

北京师范大学计算机科学与技术学院,北京100875;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
中文信息处理; 古汉语; 史记; 双字词; 统计模型;

相似文献

中文文献
外文文献
专利

1. 基于统计模型的词语搭配自动获取方法的分析与比较 [J] . 全昌勤 ,刘辉 ,何婷婷 . 计算机应用研究 . 2005,第009期
2. 上古汉语中"党"字词义分析 [J] . 王秀丽 . 齐鲁师范学院学报 . 2005,第002期
3. 中日双汉字同形词比较--以《新大学日语简明教程》的汉字词为例 [J] . 林韶南 . 湖南科技学院学报 . 2013,第006期
4. 基于句对比较的自动获取翻译模板方法改进 [J] . 方淼 ,关小薇 ,高庆狮 . 计算机工程与应用 . 2007,第034期
5. 英汉字词比较及教学方法的借鉴 [J] . 郑会敏 ,蒋仕会 . 基础教育研究 . 2016,第005期
6. 《新撰字镜》与古汉语字词考释 [C] . 张翔 . 第八届出土文献研究与比较文字学全国博士生学术论坛 . 2018
7. 蒙古汉语教材比较研究以《标准中文》与《快乐汉语》为例比较分析 [A] . UUGANTETSEG(乌干其其格) . 2015

古汉语双字词自动获取方法的比较与分析

摘要

著录项

相似文献

相关主题

期刊订阅