基于统计和浅层语言分析的维吾尔文语义串快速抽取

吐尔地·托合提; 维尼拉·木沙江; 艾斯卡尔·艾木都拉

首页> 中文期刊> 《中文信息学报》 >基于统计和浅层语言分析的维吾尔文语义串快速抽取

基于统计和浅层语言分析的维吾尔文语义串快速抽取

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

该文提出了一种基于统计和浅层语言分析的维吾尔文语义串快速抽取方法,采用一种多层动态索引结构为大规模文本建词索引,结合维吾尔文词间关联规则采用一种改进的n元递增算法进行词串扩展并发现文本中的可信频繁模式,最终依次判断频繁模式串结构完整性从而得到语义串.通过在不同规模的语料上实验发现,该方法可行有效,能够应用到维吾尔文文本挖掘多个领域.%A fast Uyghur semantic string extraction method is proposed based on statistical model and shallow lin-guistic parsing .It employs a multilayered dynamic indexing structure to build word index for large-scale text .Com-bined with the Uyghur word association rules ,an improved n-gram incremental algorithm is designed for word string extension ,trying to capture the credible frequent patterns in the text .The final semantic strings are determined af-ter the structural integrity of the frequent pattern is verified .Experiments on different corpus indicate that this method is feasible and effective .

著录项

来源
《中文信息学报》 |2017年第4期|70-79|共10页
作者
吐尔地·托合提; 维尼拉·木沙江; 艾斯卡尔·艾木都拉;
展开▼
作者单位

新疆大学信息科学与工程学院,新疆乌鲁木齐 830046;

新疆大学信息科学与工程学院,新疆乌鲁木齐 830046;

新疆大学信息科学与工程学院,新疆乌鲁木齐 830046;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
语义串; 多层动态索引; 词串扩展; 可信频繁模式; 邻接特征分析;

相似文献

中文文献
外文文献
专利

1. 基于语义串抽取及主题相似度度量的维吾尔文文本分类 [J] . 吐尔地·托合提 ,维尼拉·木沙江 ,艾斯卡尔·艾木都拉 . 中文信息学报 . 2017,第004期
2. 基于语义串特征提取及融合评价的维吾尔文文本聚类 [J] . 吐尔地·托合提 ,维尼拉·木沙江 ,艾斯卡尔·艾木都拉 . 中文信息学报 . 2017,第005期
3. 基于浅层语义树核的阅读理解答案句抽取 [J] . 张志昌 ,张宇 ,刘挺 . 中文信息学报 . 2008,第001期
4. 基于合一句法和实体语义树的中文语义关系抽取 [J] . 虞欢欢 ,钱龙华 ,周国栋 . 中文信息学报 . 2010,第005期
5. 基于浅层语义分析技术的语义检索 [J] . 孙志军 ,郑烇 ,袁婧 . 计算机科学 . 2012,第006期
6. 基于浅层语义树kernel的阅读理解答案句抽取 [C] . 张志昌 ,张宇 ,刘挺 . 第三届全国信息检索与内容安全学术会议 . 2007
7. 基于统计特征的维吾尔文离线手写签名鉴别技术研究 [A] . 祖丽皮亚·艾尼 . 2017

基于统计和浅层语言分析的维吾尔文语义串快速抽取

摘要

著录项

相似文献

相关主题

期刊订阅