规则与统计相结合的中文新词识别研究

王琳琳

首页> 中文期刊> 《嘉兴学院学报》 >规则与统计相结合的中文新词识别研究

规则与统计相结合的中文新词识别研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对目前分词方法无法识别网络中不断出现的普通新词,设计了一种新的基于规则与统计相结合的分词方法.针对新词不同的构词模式特点,利用语言学的知识把新词识别问题分类细化,将单字串模式的新词和后缀串模式的新词作为本文的主要识别对象.对于单字串模式的候选新词,在使用内部词概率模型的基础上,通过分析候选新词的内部紧密结合度以及上下文环境依赖程度等特征信息,采用平均互信息和左右邻接信息熵相结合的方法进行识别;对于后缀模式的候选新词,通过大规模语料训练得到的噪声尾词典进行噪声串的过滤得到新词.

著录项

来源
《嘉兴学院学报》 |2014年第6期|124-130|共7页
作者
王琳琳;
展开▼
作者单位

枣庄学院信息科学与工程学院,山东枣庄277160;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP393.08;
关键词
新词识别; 左右信息熵; 内部词概率; 平均互信息;

相似文献

中文文献
外文文献
专利

1. 基于规则和概率统计相结合的中文命名实体识别研究 [J] . 闫萍 . 计算机与数字工程 . 2011,第009期
2. 统计和规则相结合的中文姓名识别方法研究 [J] . 刘竞 ,苏万力 . 福建电脑 . 2006,第007期
3. 一个统计与规则相结合的中文命名实体识别系统 [J] . 向晓雯 ,史晓东 ,曾华琳 . 计算机应用 . 2005,第010期
4. 基于CRF与规则相结合的中文电子病历命名实体识别研究 [J] . 翟菊叶 ,陈春燕 ,张钰 . 包头医学院学报 . 2017,第011期
5. 双层 CRF与规则相结合的中文地名识别方法研究 [J] . 孙虹 ,陈俊杰 . 计算机应用与软件 . 2014,第011期
6. 混合统计模型与规则相结合的中文命名实体识别 [C] . 王丹 ,樊兴华 . 第八届中国Rough集与软计算、第二届中国Web智能、第二届中国粒计算联合会议（CRSSC-CWI-CGrC'2008） . 2008
7. 规则与统计相结合的中文命名实体识别 [A] . 乔永波 . 2007

规则与统计相结合的中文新词识别研究

摘要

著录项

相似文献

相关主题

期刊订阅