掌桥科研
一站式科研服务平台
科技查新
收录引用
专题文献检索
外文数据库(机构版)
更多产品
首页
成为会员
我要充值
退出
我的积分:
中文会员
开通
中文文献批量获取
外文会员
开通
外文文献批量获取
我的订单
会员中心
我的包量
我的余额
登录/注册
文献导航
中文期刊
>
中文会议
>
中文学位
>
中国专利
>
外文期刊
>
外文会议
>
外文学位
>
外国专利
>
外文OA文献
>
外文科技报告
>
中文图书
>
外文图书
>
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
工业技术
基础科学
医药卫生
农业科学
教科文艺
经济财政
社会科学
哲学政法
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
自然科学总论
数学、物理、化学、力学
天文学、地球科学
生物科技
医学、药学、卫生
航空航天、军事
农林牧渔
机械、仪表工业
化工、能源
冶金矿业
电子学、通信
计算机、自动化
土木、建筑、水利
交通运输
轻工业技术
材料科学
电工技术
一般工业技术
环境科学、安全科学
图书馆学、情报学
社会科学
其他
美国国防部AD报告
美国能源部DE报告
美国航空航天局NASA报告
美国商务部PB报告
外军国防科技报告
美国国防部
美国参联会主席指示
美国海军
美国空军
美国陆军
美国海军陆战队
美国国防技术信息中心(DTIC)
美军标
美国航空航天局(NASA)
战略与国际研究中心
美国国土安全数字图书馆
美国科学研究出版社
兰德公司
美国政府问责局
香港科技大学图书馆
美国海军研究生院图书馆
OALIB数据库
在线学术档案数据库
数字空间系统
剑桥大学机构知识库
欧洲核子研究中心机构库
美国密西根大学论文库
美国政府出版局(GPO)
加利福尼亚大学数字图书馆
美国国家学术出版社
美国国防大学出版社
美国能源部文献库
美国国防高级研究计划局
美国陆军协会
美国陆军研究实验室
英国空军
美国国家科学基金会
美国战略与国际研究中心-导弹威胁网
美国科学与国际安全研究所
法国国际关系战略研究院
法国国际关系研究所
国际宇航联合会
美国防务日报
国会研究处
美国海运司令部
北约
盟军快速反应部队
北约浅水行动卓越中心
北约盟军地面部队司令部
北约通信信息局
北约稳定政策卓越中心
美国国会研究服务处
美国国防预算办公室
美国陆军技术手册
一般OA
科技期刊论文
科技会议论文
图书
科技报告
科技专著
标准
其它
美国卫生研究院文献
分子生物学
神经科学
药学
外科
临床神经病学
肿瘤学
细胞生物学
遗传学
公共卫生&环境&职业病
应用微生物学
全科医学
免疫学
动物学
精神病学
兽医学
心血管
放射&核医学&医学影像学
儿科
医学进展
微生物学
护理学
生物学
牙科&口腔外科
毒理学
生理学
医院管理
妇产科学
病理学
生化技术
胃肠&肝脏病学
运动科学
心理学
营养学
血液学
泌尿科学&肾病学
生物医学工程
感染病
生物物理学
矫形
外周血管病
药物化学
皮肤病学
康复学
眼科学
行为科学
呼吸学
进化生物学
老年医学
耳鼻喉科学
发育生物学
寄生虫学
病毒学
医学实验室检查技术
生殖生物学
风湿病学
麻醉学
危重病护理
生物材料
移植
医学情报
其他学科
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
人类生活必需品
作业;运输
化学;冶金
纺织;造纸
固定建筑物
机械工程;照明;加热;武器;爆破
物理
电学
马克思主义、列宁主义、毛泽东思想、邓小平理论
哲学、宗教
社会科学总论
政治、法律
军事
经济
文化、科学、教育、体育
语言、文字
文学
艺术
历史、地理
自然科学总论
数理科学和化学
天文学、地球科学
生物科学
医药、卫生
农业科学
工业技术
交通运输
航空、航天
环境科学、安全科学
综合性图书
主题
主题
题名
作者
关键词
摘要
高级搜索 >
外文期刊
外文会议
外文学位
外国专利
外文图书
外文OA文献
中文期刊
中文会议
中文学位
中国专利
中文图书
外文科技报告
清除
历史搜索
清空历史
首页
>
中文会议
>
工业技术
>
自动化技术与计算机技术
>
中国中文信息学会二十周年学术会议
中国中文信息学会二十周年学术会议
召开年:
2001
召开地:
北京
出版时间:
2001-11-11
主办单位:
中国中文信息学会
会议文集:
中国中文信息学会二十周年学术会议论文集
会议论文
热门论文
全部论文
相关中文期刊
个人电脑
计算机网络世界
计算机仿真
计算机应用文摘
电脑知识与技术-经验技巧
自动识别技术与应用
微处理机
计算机与现代化
化学传感器
电脑知识与技术(数字社区与智能家居)
更多>>
相关外文期刊
International Journal of Smart Engineering System Design
Linux Journal
International journal of mobile computing and multimedia communications
International Journal of Web Based Communities
Foundations and trends in theoretical computer science
Agile project management advisory service executive report
I·O/アイ·オ—
Journal of gaming & virtual worlds
Microfluidics and nanofluidics
International journal of agent-oriented software engineering
更多>>
相关中文会议
2007全国理论计算机科学学术年会
全国第四届Web信息系统及其应用学术会议、全国第二届语义Web与本体论学术研讨会、全国电子政务技术与办公自动化学术研讨会
2008工业自动化与仪表应用学术交流会
2014湖北省计算机学会学术年会
1999年全国开放式分布与并行处理学术会议
全国第四届Java技术及应用学术会议
第七届全国高校计算机网络教学暨网络工程专业建设研讨会
2013中国计算机大会
全国抗恶劣环境计算机第二十一届学术年会
测控、计量与仪器学术年会
更多>>
相关外文会议
Formal Methods for Open Object-Based Distributed Systems
The 17th IEEE Workshop on Local and Metropolitan Area Networks
Proceedings of the Second SIGCSE technical symposium on Education in computer science
International workshop on underactuated grasping 2010
Pan-Sydney Workshop on Visual Information Processing(VIP 2000); 200012;
International Conference on Intelligent Data Engineering and Automated Learing(IDEAL 2007); 20071216-19; Birmingham(GB)
Computational forensics
Co-HPC 2014: 1st International Workshop on Hardware-Software Co-design for High Performance Computing, Held in conjunction with C14: The International Conference for High Performance Computing, Networking, Storage and Analysis
Component-based software engineering
Proceedings of the 2011 ACM international conference on ada and related technologies
更多>>
热门会议
2015第十届全国体育科学大会
2019年中国城市规划年会
2018中国城市规划年会
中国工程热物理学会2014年年会
第三届世界灾害护理大会
第30届中国气象学会年会
2017年中国地球科学联合学术年会(CGU2017)
中华医学会第十八次全国儿科学术会议
2006中国科协年会
2011年第二十八届中国气象学会年会
更多>>
最新会议
2005中国首届国际铜板带研讨会
全国小儿病毒性肝炎学术会议
模糊系统及其应用成果学术交流会
中国金属学会高温合金中微量元素的控制及其作用鉴定会
中国有色金属学会冶金设备学术委员会第一届年会
2003年全国理论计算机科学学术年会
2015年齐鲁高教论坛
中国石油学会油品应用技术交流会
中国化工学会第一届流体流动传热传质及燃烧技术会
中国金属学会第四界炭素材料年会
更多>>
全选(
0
)
清除
导出
1.
全信息标注语料库的开发与应用
亢世勇
;
常宝宝
;
刘海润
;
徐艳华
;
俞士汶
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
2000年我们和德国Konstanz工业技术大学国际术语和应用语言学研究中心合作开发了全信息标注语料库.该语料库包含被标注的汉语词语8000个.这是迄今为止我们见到的首次标注全信息的语料库.本文对该全信息语料库的开发与应用进行介绍.全文分为四个部分:一、全信息及全信息的内容;二、全信息的标注与语料校对,三、问题研究,四、全信息标注语料库的应用.
语料库;
全信息标注语料库;
现代汉语;
2.
信息处理用现代汉语语义分类词典的设计与实现
陈群秀
;
李坚
;
王健
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
信息处理用现代汉语语义分类体系和信息处理用现代汉语语义分类词典是现代汉语语义系统的一个重要组成部分.本文描述了信息处理用现代汉语语义分类词典管理系统的设计和实现,在语义分类词典管理系统支撑下对60000个汉语词语进行了机助标注,形成了一个信息处理用现代汉语语义分类词典并由计算机统一管理.信息处理用现代汉语语义分类体系和现代汉语语义分类词典作为强大的语义资源之一,在自然语言处理和语义学研究中将起到越来越重要的作用.
信息处理;
现代汉语;
语义分类词典;
3.
汉语句法知识的自动获取研究
周强
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文提出了一种行之有效的汉语句法知识自动获取体系.以浅层句法分析作为预处理工具,并结合现有的概率分析器,可以从大规模真实文本中自动习得汉语概率型上下文无关规则和结构优先关系等有用的句法知识,从而形成一个具有自学习能力的汉语句法分析器.实验结果显示出其较好的分析性能和应用前景.
句法分析;
机器学习;
知识获取;
汉语;
4.
基于数据库的现代汉语词类优势语法功能统计研究
亢世勇
;
刘海润
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文以北京大学计算语言学研究所开发的《现代汉语语法信息词典》为基础,对现代汉语各类词的优势语法功能进行了统计研究,从量的方面说明了现代汉语词语词类优势语法功能.
现代汉语;
数据库;
语法功能;
语法信息词典;
5.
基于《知网》的词义排岐方法
杨尔弘
;
米丽萍
;
郝秀兰
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
词义排歧是NLP中的热点和难点问题,支持排歧的资源提供了排歧的知识,同时也决定了排歧的方法.本文通过挖掘《知网》中提供的信息,实现了一种基于实例的词义排歧方法.该方法在确定词义时,充分利用了隐藏在词形背后的词义信息,以《知网》中提供的例子作为初始实例库,通过不断的自学习,达到了良好的排歧效果.
词义排岐;
知网;
6.
信息处理用汉语句子语序的认知研究
鲁川
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
汉语句子是语块的序列.一个句子有(7±2)个语块.在无语用制约的里层句子中,语块顺序取决于对时间序列的“摹象性”.在有语用制约的表层句子中,语块顺序取决于对交际情境的“应境性”.总之,汉语句子的语序取决于“语意的先决性,句法的强制性,语用的选定性”.
语块序列;
汉语句子;
信息处理;
7.
智能Agent技术在个性化WEB信息代理中的应用研究
丁山山
;
陈世平
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
如今,因特网所能提供的信息越来越多,网上的Web信息呈指数级增长,但是Web信息急剧膨胀的同时,一些问题也随之出现,就信息服务方面而言,主要是信息过载、信息干扰、资源迷向和信息拥塞.目前,因特网上的主流技术——万维网技术,和信息查询的主要工具——搜索引擎,在解决上述问题时,显得力不从心,而新崛起的智能agent技术却让我们看到了希望.
智能agent;
元搜索引擎;
机器学习;
8.
笔画的信息与数字编码
徐万胥
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文将汉字的基本笔画赋予顺序值和位置关系值,以笔画的顺序值与位置关系值作为汉字编码依据.数字统一码是基于笔画的信息设计的汉字输入法,码元为“1”~“9”,码长1~6码,编码字符包括GB2312、GB_13000_1、GB18030中定义的全部汉字.数字统一码符合国家标准GB18031对数字键盘汉字输入法要求,是一个易学易用的数字编码输入法.
数字编码;
数字统一码;
汉字输入法;
9.
中国人需要什么样的汉字编码
郑远泾
;
虞志球
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文分析了我国汉字编码现状,提出了“以形出发、以形为主、形音结合、输入与书写结合”的“形音码”编码原则,主张中文信息处理应有利于继承和弘扬汉字的民族文化传统,提高全民族识别汉字的能力,促进汉字的学、写、认教学;文中论述了促进中文信息处理的规范化、科学化等问题,并重点阐明了对汉字实施“书写拆分”的重要性和必要性;最后建议政府有关职能部门应尽早规范汉字技术市场.
汉字编码;
形音码;
10.
藏文信息交换技术的研究与实现
于洪志
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
分析了藏文编码国际标准的技术指标,论述了藏文DOS、藏汉双语信息处理系统、藏文视窗平台、藏文字处理软件和藏文网站的研究与实现.
藏文信息技术;
藏文编码;
藏文DOS;
藏文网站;
11.
基于向量空间模型的文本过滤系统
黄萱菁
;
夏迎炬
;
吴立德
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
文本过滤指的是从大量的文本数据流中寻找满足特定用户需求的文本的过程.本文首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议——文本检索会议(TREC)及其中的文本过滤项目;然后详细地描述了我们提出的基于向量空间模型的文本过滤系统,该系统参加了2000年举行的第九次文本检索会议的评测,取得了很好的成绩,其中自适应过滤和批过滤的平均准确率分别为26.5﹪和31.7﹪,在来自多个国家的15个系统中名列前茅.
文本检索;
文本过滤;
向量空间模型;
12.
汉阿机译研究(一)从汉语单句若干结构谈论汉阿机译
希夏姆
;
马利克
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本论文试图从科技文体角度,研究汉语和阿拉伯语若干句子结构的异同,主要目的是把汉语和阿拉伯语的语法知识形式化,并从理论上设想能否进行汉阿机器翻译……
机器翻译;
阿汉机器翻译;
13.
机器翻译系统中句法分析技术的研究实践
赵铁军
;
李生
;
孟遥
;
黄玉
;
杨沐昀
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
自然语言句法分析是机器翻译不可缺少的前期处理过程,文中总结了几代机器翻译系统中句法分析的经验,在最新研制的英汉双向机器翻译系统MTS2000中设计并实现了一个模块化的统计与规则相结合的句法分析模型.整个句法分析采用综合的策略,分别使用了隐马尔可夫方法、统计决策树方法、基于历史的句法分析等多种方法,并注意语义知识在句法分析中的应用.实验结果表明,模块化的句法分析器的设计方法,不论是对英语句法分析还是对汉语句法分析都是一种可取的方法.
句法分析;
自然语言;
14.
基于纹理特征的版式识别研究
田学东
;
郭宝兰
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
在简要介绍版式识别技术现状及面临的主要困难的基础上,提出了一种基于纹理特征的版面分析与字体识别方法,介绍了利用Gabor滤波器提取纹理特征进行字体识别的过程.实验结果表明,这种方法对于版式识别是有效的.
版式识别;
版面分析;
字体识别;
纹理特征;
滤波器;
15.
基于语言学知识的多分类器融合方法在手写体汉字识别中的应用
林磊
;
王晓龙
;
徐志明
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
在模式识别的各个应用领域中,多分类器融合技术被认为是一种有效提高系统性能的方法.本文描述了一种基于语言学知识的多分类器融合方法,同时研究了其融合略,为分类器的融合提供了基础.这些融合策略经联机手写体汉字识别系统测试,系统性能有了较大提高.
多分类器融合技术;
手写体;
汉字识别;
N-gram模型;
16.
从中文电子出版到中文电子传播
陈晓鸥
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
随着互联网技术的发展,中文电子出版技术进入了中文电子传播的新的发展阶段.本文着重介绍中文电子传播系统的技术结构及其相关技术.
中文电子出版;
中文电子传播;
17.
汉语自动分词研究的若干最新进展——清华大学相关工作简介
孙茂松
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文着重介绍清华大学智能技术与系统国家重点实验室在汉语自动分词方面的部分研究工作.
汉语;
自动分词;
18.
计算语言学的应用研究与基础研究
俞士汶
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文回顾北大计算语言学研究所的发展轨迹,探讨计算语言学研究中应用研究与基础研究的关系.本文也概要介绍了北大计算语言学研究所在中文信息处理领域所取得的一些基础研究成果以及正在做的的准备做的一些研究工作.
计算语言学;
现代汉语;
语法信息词典;
汉语标注语料库;
中文概念辞书;
19.
汉语内涵逻辑及其应用
陆汝占
;
高峰
;
陈玉泉
;
靳光瑾
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文用内涵逻辑方法讨论语料加工平台中关于词与短语的区分问题,同时,用该方法分析了对话实例中的语句意义,特别指出了汉语在处理名词谓语句上的独特之处.
内涵逻辑;
切分;
标注;
对话理解;
汉语;
20.
面向网络计算的汉语语音信息处理
徐波
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
在多项国家科技计划的支持下,过去十年汉语语音信息处理技术在通用基础领域已基本达到国际先进水平,尤以体现语音综合研究实力的大词汇量、连续语音、非特定人(LVCSR)的技术突破为标志.然而,面向正在到来的网络计算时代,研究开发具有重大应用背景的语音专用技术、解决语音识别的鲁棒性问题还有很多工作要做.面向网络计算的语音应用,一方面要求语音技术特别是语音识别技术再一次从现代信号处理中汲取营养,另一方面还需要不断与语言处理技术融合,以完成更高层次的口语人机对话和语音翻译.本文还将就中文语音识别的应用观、中文语音语言处理的国际化和中文语音语言技术的发展方向进行讨论.
语音识别;
汉语;
语音信息处理;
网络计算;
21.
流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究
张普
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文概述了术语、术语学、术语数据库研究的必要和国内外研究的现状,探讨了术语的界定、术语的基本特征、术语与一般词语的共同特征和区别特征,流通度与术语的自动提取等有关问题.
术语;
术语数据库;
动态语言识别更新;
流通度;
汉语信息处理;
22.
中文输入法的“傻瓜”境界——《智能手机码》简介
黄金富
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文介绍的智能手机码具有易学性和智能化.编码设计和软件操作均很简单,上手能用.另外它采用中文语言模型技术,实现整句输入.
中文输入法;
智能手机码;
23.
企业网络监管系统CNM的设计与实现
陈文亮
;
朱靖波
;
姚天顺
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
CNM系统的主要特点是在互联网的代理服务器中应用基于FIFA算法的内容主题识别技术,实现企业网络信息监管.本文详细介绍了CNM系统的三个主要模块:数据获取、内容主题分析、统计分析.最后讨论CNM系统的不足和改进.
FIFA算法;
主题识别;
信息安全;
24.
专有名词与网络词语识别软件技术研究
刘开瑛
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文就山西大学采用语料库方法和人工智能结合的技术路线,建立一套有未有名词识别和网络词语识别的理论和方法,在处理复杂多变的真实语言时,提高了分词的精确度.
专有名词识别;
网络词语识别;
软件技术;
25.
汉语专名的初步研究
宋柔
;
邹嘉彦
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
专名对于自然语言处理有重要意义.本文对专名进行了界定,提出了汉语专名的特点,讨论了这些特点在信息量表示、词语聚类、专名识别方面的应用.
汉语;
专有名词;
26.
Linux国际化和中文本地化的实现
孙玉芳
;
王守华
;
吴健
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
中国政府于2000年3月17日日颁布的GB18030-2000编码标准采用了单字节、二字节和四字节符混合的方式进行汉字编码,并且要求操作系统必须在2001年9月分之前遵守这个标准.本文介绍了基于GB18030编码标准字符集的中文Linux操作系统的设计和实现,提出基于GB18030编码标准字符集的中文Linux操作系统的实现框架,把实现分为核心支持系统、基本支持系统和完全支持系统,同时实现了核心支持系统的所有功能和基本支持系统的绝大多数功能.使得Linux系统能够正确识别和转换GB18030编码标准字符集中的字符,同时不管在字符界面还是图形界面下,都能够正确输入和显示GB18030编码标准字符.这项工作也可以作为下一步实现少数民族语言信息化工作的基础.
Linux;
编码字符集标准;
四字节;
汉字识别;
27.
多语机器翻译及其系列应用系统研究进展
陈肇雄
;
黄河燕
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
多语机器翻译及其系列应用系统是我们设计并实现的一个多语种、多专业机器翻译核心以及面向不同软硬件平台的系列应用解决方案.本文,我们给出了多语机器翻译及其系列应用系统的设计考虑、总体结构设计、关键技术问题及其主要技术特点.
机器翻译;
总体结构设计;
应用系统设计;
28.
英汉机器翻译:现状和未来
史晓东
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文试图通过考察几个具体的机器翻译软件,指出机器翻译应当在未来几年内解决的具体技术问题,以促进国内机器翻译的研究和开发.
机器翻译;
英汉翻译;
29.
TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索
施水才
;
肖诗斌
;
王弘蔚
;
王洪俊
;
苏东庄
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文介绍了TRS文本检索系统的主要技术特点,分析了搜索引擎技术的优点和不足,提出了基于自然语言处理的文本检索技术,介绍了TRS自动分类、自动摘录和相似性检索技术.所有这些技术都经过大数据量和开放环境的实际检验,有许多成功的案例.
文本检索技术;
自然语言处理;
TRS自动分类;
30.
汉字识别技术现状与展望
刘昌平
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文简要介绍了国内汉字识别技术与市场的现状,并就汉字识别技术的发展趋势提出了作者的看法.
汉字识别技术;
手写笔软件;
中文OCR软件;
脱机手写汉字识别;
31.
信息技术领域术语自动提取和动态更新研究
李芸
;
王强军
;
张普
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文主要讨论信息技术领域的术语自动提取和动态更新研究.分析了人类知识总框架(GFHK)的概念,在此基础上提出信息技术领域知识体系的初步构想,以此作为信息技术领域术语自动提取和动态更新研究的基础和指导框架.结合第三代动态流通语料库理论和术语研究现状,对术语自动提取和动态更新进行分析,列出了部分实验结果.
术语;
信息技术;
动态更新;
知识体系;
32.
基于转换的错误学习方法的汉语词性自动标注研究
张艳
;
徐波
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
词性标注是自然语言处理的基础.本文采用了基于规则与统计相结合的标注方法.首先用基于词性与词相结合的三元统计模型对汉语分词及标注进行一体化处理,完成对语料库的初始标注;然后用Brill的基于转换的学习方法通过转换规则完成最终的词性标注.对大规模真实语料的标注实验表明基于转换的方法与三元统计模型方法相得益彰;高起始点的初始标注对于提高Brill方法的准确性至关重要;Brill的基于转换的方法在高精度的初始标注的基础上又有明显的提高.
词性标注;
三元统计模型;
错误驱动;
学习算法;
汉语词性;
33.
英文译名自动识别方法研究
郑家恒
;
杨晓岩
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文以真实的国际新闻语料的中英文译名和《英文人物、地名、事件名词典》《新英汉词典》中译名为资源,建立了译名用字库、译名用词库和译名音节信息库;统计了译名用字可信度;提出了概率估值公式来评价译名用字构成译名的能力;构造了译名识别的规则库;在充分地利用上下文信息和英文译名中的音节信息基础,研制出英文译名自动识别的实验系统.经测试召回率为84.79﹪,准确率为91.46﹪.
译名音节;
信息库;
英文译名;
自动识别;
34.
基于写作风格的作者识别
孙晓明
;
马少平
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
根据写作风格来识别作者这一问题在国外很早就已经开始研究了,并有很多成功应用.而针对中文的研究却非常少.本文首次提出了使用文章中虚词频率分布作为特征来研究这一问题,采用了两种不同的规格化方法来消除文章长度的差异,并采用了多种不同的分类方法.实验结果表明采用虚词频率作为特征是行之有效的,即使采用最简单的模板匹配的识别方法都能够取得很好的识别效果,采用SVM等方法可以进一步提高识别率.此外可以在一定范围内减少使用的虚词的数量,而不损失识别效果.
写作风格;
文本分类;
虚词频率;
作者识别;
35.
中国数字图书馆建设中的若干关键问题
孙茂松
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文从以下几个角度讨论了中国数字图书馆建设中的若干关键问题:(1)数字图书馆在科学研究中的作用;(2)社会效益与经济效益的关系;(3)数字图书馆的建设步骤;(4)几点具体建议.
中国数字图书馆;
WWW;
中文信息处理;
36.
Linux下的中文打印
王守华
;
吴健
;
倪剑
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文首先简要概述了Linux下的打印机制,指出这种打印机制所存在的问题以及对中文打印支持方面的不足,然后介绍了实现中文打印的各种途径,最后根据目前的实现状况,提出了实现Linux中文打印的当解解决方案和最终目标.
中文打印;
Linux;
PS文件;
字库;
Ghostscript;
37.
基于boosting的文本分类在股市领域信息抽取系统中的应用
房一飞
;
张冬茉
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
首先介绍了特定领域多语种信息抽取系统的基本模型,并针对该系统的预处理模块的需要,提出了一种基于机器学习方法的文本分类系统.该系统通过boosting算法,对一个易实现的弱分类器进行增强,最后获得一个强分类器,从而避免了直接构造强分类器的困难.实验证明,相对于直接构造强分类器,该算法具有简单灵活,易于实现的优点,其构造出来的分类器达到了信息抽取系统的要求.
boosting;
文本分类;
信息抽取;
机器学习;
信息处理技术;
38.
英汉机器翻译系统的语言分析和算法设计
《中国中文信息学会二十周年学术会议》
|
2001年
39.
机器翻译系统中的知识工程策略研究
李生
;
杨沐昀
;
赵铁军
;
于浩
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
知识工程是大多数机器翻译系统开发过程中的一个重要环节.针对传统知识工程的人工代价高、周期长而可移植性差的问题,本文提出了一种“知识标注”的策略以解决知识库的复用问题.该策略以语言学为基础,以语料标注为手段,以翻译系统所需知识为核心,使知识工程的设计和实施逐渐独立于具体的系统架构,从而为解决这一瓶颈问题创造条件.
机器翻译;
知识工程;
标注;
语料库;
40.
疑问句中的“怎么”在汉英机器翻译中的词汇歧义化解
吴云芳
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
疑问句中做状语的“怎么”在汉英机器翻译中可以有多种译法,即存在词汇歧义.“怎么”的译法和用法之间存在着比较整齐的对应关系.本文通过考察“怎么”在文本中的表现,详尽描述其用法,并进而发现可能的排歧规则.本文使用的是基于规则的方法.
词汇歧义;
机器翻译;
汉英翻译;
41.
汉语语音合成中的文本分析和韵律处理
陶建华
;
蔡莲红
;
赵晟
《中国中文信息学会二十周年学术会议》
|
2001年
摘要:
本文通过阐述新一代汉语语音合成系统中文本分析、短语合并、韵律代价函数及韵律代价函数在语音基元选取中的体现,从而较为详细的分析了现代汉语语音合成系统的工作流程和有关的关键技术.指出传统意义上文本分析模型,无法体现语音合成中韵律节奏,并使韵律参数的预测变得困难.本文通过引入在文本分析中引入韵律节奏预测机制,从而使文本分析和韵律处理有机的结合起来,并阐明汉语语音合成性能进一步提高的方法.
汉语语音合成;
文本分析;
韵律处理;
意见反馈
回到顶部
回到首页