词频
词频的相关文献在1979年到2022年内共计651篇,主要集中在自动化技术、计算机技术、常用外国语、语言学
等领域,其中期刊论文545篇、会议论文9篇、专利文献97篇;相关期刊393种,包括心理与行为研究、心理学探新、情报理论与实践等;
相关会议7种,包括全国第五次情报检索语言发展方向研讨会、第七届中文信息处理国际会议、第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)等;词频的相关文献由1161位作者贡献,包括闫国利、朱颢东、周红芳等。
词频
-研究学者
- 闫国利
- 朱颢东
- 周红芳
- 白学军
- 彭聃龄
- 张积家
- 张鹏
- 李京徽
- 李想
- 许洪
- 赵渺希
- 金朋荪
- 钟勇
- 钟烨
- 任冬梅
- 任桂琴
- 刘伟
- 刘慧
- 张俤
- 张平
- 徐立
- 朱黎琴
- 李晓倩
- 李楠
- 李艳红
- 武卫
- 王东波
- 王颖
- 谢力
- 陈玉
- 陶晨
- 雷景生
- 马一鸣
- 马军
- 黄水清
- 丁婵婵
- 万辉
- 严妍
- 任宗华
- 任延涛
- 何清林
- 何睿
- 余军
- 佟子健
- 佟忠正
- 侯丽
- 俞士毛
- 冯志伟
- 冯源
- 冯跃进
-
-
葛从兵;
严吉皞;
陈剑
-
-
摘要:
为加强水库安全管理监督工作,提高水库安全管理文档评估效率,研究中文分词技术以及关键词学习方法与文档质量评估方法,提出一种基于词频的水库安全管理文档质量评估方法。选择结巴分词工具,采用Django框架开发水库安全管理文档质量评估系统。实验结果表明,该系统对水库安全管理文档的质量评估结果准确,与实际情况基本一致。该系统能够通过学习全部文档获得评估标准,计算文档质量指数并给出文档质量水平,可广泛应用于水库安全管理文档质量评估工作中,具有一定的实用价值。
-
-
赖康生
-
-
摘要:
在英语词汇学习中,近义词辨析既是重点也是难点。学习者借助词典进行辨析依然感到困难重重。语料库因其语料丰富、搜索功能强大等特点能够很好地取代词典,学习者可以利用语料库进行数据驱动式的近义词辨析。文章基于COCA语料库,从词频、语域分布、搭配、类联接、语义韵切入,辨析了近义动词abolish、cancel和repeal,探索了基于语料库的近义词辨析新路径。
-
-
吕振燕
-
-
摘要:
新媒体时代,对外传播主体越来越多元化。选取YouT ube平台李子柒的相关视频,通过Python技术抓取评论,采用词频计量和文本分析相结合的方法,探讨海外粉丝对李子柒视频中中国传统工艺的认知和情感态度。从受众角度出发探究李子柒在传统工艺跨文化传播中的影响力,并对基于社交媒体短视频传播中国传统工艺提出可行性分析。
-
-
王郢;
方癸椒
-
-
摘要:
词云技术是对学生在课堂中使用的语言和文本进行关键词抓取,通过词频统计、重要性分析等方法确定学生观点、情感和态度的一种分析方法。基于词云技术的言论观点采撷和统计能够帮助教师捕捉学生在课堂教学中的情感体验,进而将内化态度外在表现出来。这种由内到外的转化是突破当前课程思政效果评价瓶颈的有益尝试。在实践应用中,词云技术能够帮助教师更好地把握学生在课堂中态度形成的动态阶段和路径,进而在教学设计中改进课程思政元素的挖掘与融入方式。分析运用词云技术进行课程思政评价的相关内容,对于课程思政评价体系的完善具有重要意义。
-
-
宫媛;
冯玮杰
-
-
摘要:
本文运用手工录入与Python相结合的方法,收集了天山网新疆新闻标题,建立“天山网新闻标题语料库”,并分别使用NLPIR-ICTCLAS汉语分词系统和MyZiciFreq字词频率统计工具对语料进行分词处理和词频统计。本文对天山网新疆新闻标题的统计和社会价值分析,为新闻标题的编写提供了参考依据,同时也展现了新疆地区融媒体所关心的热点事件,也体现出了新疆各族人民团结一心的坚定决心。
-
-
张建;
严珂;
马祥
-
-
摘要:
垃圾信息的识别是自然语言处理方面主要的任务之一。传统方法是基于文本特征或词频的方法,其识别准确率主要依赖于特定关键词的出现与否,存在对关键词识别错误或对未出现关键词的垃圾信息文本识别能力较差的问题,提出基于神经网络的方法。首先,利用传统方法针对这一类垃圾信息文本进行识别训练和测试;然后,利用从垃圾短信、广告和垃圾邮件数据集中挑选出传统方法识别困难的垃圾信息,再从原数据集中随机挑选出同样数量的正常信息,将其组成三个无重复数据的新数据集;最后,以卷积神经网络和循环神经网络为基础,建立了三个模型,并在新数据集上进行识别训练。实验结果表明,基于神经网络的方法可以从文本中学习到更好的语义特征,在三个数据集上均能达到98%以上的准确率,高于朴素贝叶斯(NB)、随机森林(RF)、支持向量机(SVM)等传统方法。实验结果还显示,不同的神经网络适用于不同长度的文本分类,由循环神经网络组成的模型擅长识别句子长度的文本,由卷积神经网络组成的模型擅长识别段落长度的文本,由两者共同组成的模型擅长识别篇章长度的文本。
-
-
梁婷瑜
-
-
摘要:
本文以中国航运企业英文网站企业简介环节为研究对象,本文利用语料库工具antconc, 将我国航运企业相关数据从词汇密度和词频两方面,与美国航运企业网站企业简介文本相关数据进行对比,借以研究中国公司英文网站的跨文化适应程度。研究结果表明,中美航运企业的英文网站词汇密度差异较小,但是用词方面存在一定差异。本文试图从语言学的角度和研究方法来为“走出去”公司的商务交流效能提供有益尝试。
-
-
王奕雯
-
-
摘要:
具体学科学术词表的建立对学习者具有重大意义。Coxhead在2000年推出了Academic Word List学术词汇表(简称AWL),该词表语料来自于文、商、法及理四个学科的英文材料,同时每门学科下还有七个子学科,共计350万字符,涵盖28个学科。尽管其中包含的学术词族总体上适用于理工科,但无法充分覆盖具体学科特别是采矿工程专业的需要。采矿业作为我国经济发展的组成要素之一,其专业学术词表的建立能够满足专业学习的需求。因此本文旨在通过语料库的方法下建立采矿工程英语学术词表。该词表通过提取汇集语料库中高频出现的词汇形成的学术词表,且收录的词汇基于大规模真实语料,能够助力研究者日后的论文写作与翻译实践。
-
-
郑佳莉;
柯小玲;
江晓莹;
陈淑悦
-
-
摘要:
本文提出一种“基于词频分析的K-means特征聚类算法”来分析存疑文献的作者信息。以《红楼梦》为例,根据在前80回和后40回中确定的特征汉字的出现频率,用基于词频分析的K-means特征聚类算法对其分析。以每10回为一个文本,研究前、中、后四十回的相似度,从而得出《红楼梦》的前八十回与后四十回很可能并非一人所作的论断。
-
-
张喆;
徐丽;
闵玲;
姚秋慧;
张玥
-
-
摘要:
目的比较世界中医药学会联合会颁布的《中医基本名词术语中英对照国际标准》(ISNTCM)和世界卫生组织颁布的《WHO西太区传统医学名词术语国际标准》(ISTTM)两大中医术语英译标准在论文发表实践中的使用情况。方法收集两大标准的原始资料并转换为Excel和TXT格式,统计各自的词组和单词数量。收集《中医杂志》英文版和《美洲中国医学杂志》自创刊以来至2019年9月发表的中医药论文共计202篇,建成小型的中医英语语料库,检索两大标准的词组和单词在语料库中的词频。结果两大标准的共有单词超过了各自的特有单词,提示其核心词素基本一致,但是由于搭配的不同导致各自的特有词组多于共有词组。检索两大标准在语料库中的词频发现,同一中文术语所对应的英译,ISNTCM的词频一般高于ISTTM的词频,提示ISNTCM在中医药论文发表实践中的被接受程度高于ISTTM。结论中医术语英译标准既要符合中医学、语言学等学科的语言规约性,又要遵循“约定俗成”的原则。以语料库为工具,检验已有标准在实践中的使用情况,为理论研究提供实证证据支持,是解决理论层面争议的有效手段。此外本研究也表明可以尝试语料库技术建立中医术语英译词典或英译标准。
-
-
-
-
曾立英
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
本文针对类词缀在三字词中能产性强的特征,提出构建一个三字词的类词缀知识库.我们对《现代汉语语法信息词典》数据库的8万多词语进行了抽取,共有13778个三字词,然后综合考虑词频、语法结构、读音、义项等诸多因素,分别建立三字词的类后缀库和类前缀库,并把我们所建立的类词缀知识库放到《人民日报》1998年上半年语料库中去检验、补充.
-
-
席萌;
郭巧
- 《CERNET第十届学术年会》
| 2003年
-
摘要:
设计一个文本过滤实验,首先从语料库的词频统计结果中挖掘出词频的二元关联度,然后用一个Hopfield网络将词频的二元关联关系转化为语境关联关系,训练语言单位在整个上下文环境下的权重,并建立用户模板.该算法改善了词频特征提取算法与文本上下文环境的匹配状况,实验结果表明,对专业性Web文档的过滤可达到更高的精确度.
-
-
-
刘桐菊;
于浩;
杨沐昀
- 《第一届学生计算语言学研讨会》
| 2002年
-
摘要:
针对目前专业词典的建设中如何获取专业词汇这一问题.本文采用了TFIDF算法求加权词频,按词频高低确定专业领域词汇的方法,并针对这一思路给出了在体育领域内研究的样例,同时对这一设想作了预期评估和展望.
-
-
-
王雪梅;
肖仙桃
- 《中国科学院图书馆学情报学第十四次科学讨论会》
| 2005年
-
摘要:
2005年7月6日在美国科学情报研究所(InstituteforScientificInformation,ISI)网络数据库(WebofKnowledge)上检索1900年至今的关于地理信息系统(GeographicInformationSystem,GIS)的文献6988条,本文运用德文特分析软件(DerwentAnalytics3.2a)对其进行数据挖掘和可视化分析,用文献计量学的方法对这一学科的国际发展现状进行科学定量的分析研究,以期对该学科的研究现状获得较全面客观的认识.
-
-
王雪梅;
肖仙桃
- 《中国科学院图书馆学情报学第十四次科学讨论会》
| 2005年
-
摘要:
2005年7月6日在美国科学情报研究所(InstituteforScientificInformation,ISI)网络数据库(WebofKnowledge)上检索1900年至今的关于地理信息系统(GeographicInformationSystem,GIS)的文献6988条,本文运用德文特分析软件(DerwentAnalytics3.2a)对其进行数据挖掘和可视化分析,用文献计量学的方法对这一学科的国际发展现状进行科学定量的分析研究,以期对该学科的研究现状获得较全面客观的认识.
-
-
王雪梅;
肖仙桃
- 《中国科学院图书馆学情报学第十四次科学讨论会》
| 2005年
-
摘要:
2005年7月6日在美国科学情报研究所(InstituteforScientificInformation,ISI)网络数据库(WebofKnowledge)上检索1900年至今的关于地理信息系统(GeographicInformationSystem,GIS)的文献6988条,本文运用德文特分析软件(DerwentAnalytics3.2a)对其进行数据挖掘和可视化分析,用文献计量学的方法对这一学科的国际发展现状进行科学定量的分析研究,以期对该学科的研究现状获得较全面客观的认识.