首页> 中文学位 >社会标签的规范控制及其应用研究——以豆瓣中文图书标签为例
【6h】

社会标签的规范控制及其应用研究——以豆瓣中文图书标签为例

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 国内外研究动态

1.3 本文主要研究内容

1.4 本文主要创新点

1.5 本文结构

第二章 社会标签规范控制及其应用现状研究

2.1 社会标签概述

2.1.1 社会标签的定义

2.1.2 社会标签的特点

2.2 社会标签规范控制概述

2.2.1 社会标签规范控制的必要性研究

2.2.2 社会标签与传统知识组织系统的融合

2.3 社会标签的具体应用

2.3.1 网站服务

2.3.2 个性化信息服务

2.3.3 信息检索

2.3.4 社会标签的应用总结

2.4 本章小结

第三章 中文图书标签特征分析

3.1 社会签特征分析研究现状

3.1.1 社会标签特征分析的目的及意义

3.1.2 社会标签特征分析研究现状

3.2 中文图书标签特征分析

3.2.1 数据来源及预处理工作

3.2.2 图书标签的本质特征分析

3.2.3 图书标签与主题词的对比

3.2.4 总结

3.3 本章小结

第四章 基于概念空间的社会标签规范控制研究

4.1 概念空间及其相关理论

4.2 中文图书社会标签概念空间的构建

4.2.1 构建方法概述

4.2.2 特征选择

4.2.3 关联算法

4.2.4 效果评价

4.3 实验及结果分析

4.3.1 数据来源

4.3.2 预处理

4.3.3 图书标签概念空间的构建

4.3.4 举例说明

4.3.5 实验结果与分析

4.4 本章小结

第五章 基于社会标签的中文图书自动分类研究

5.1 文本分类概述

5.1.1 文本表示

5.1.2 分类模型

5.1.3 效果评价

5.2 基于社会标签的中文图书的自动分类算法设计

5.2.1 设计原理

5.2.2 总体设计

5.2.3 关键技术

5.3 实验结果及分析

5.3.1 数据来源及预处理

5.3.2 结果分析

5.4 本章小结

第六章 总结与展望

6.1 本文总结

6.2 论文的不足与展望

参考文献

附录

致谢

攻读学位期间发表的论文

展开▼

摘要

社会标签类似于传统信息资源组织中的关键词或元数据,它产生于网络环境,创建于大众用户,其中蕴含了丰富的语义信息,将其运用到文本的自动分类中具有一定的现实意义,然而,由于社会标签在被添加时的过度自由与随意,使得社会标签的质量良莠不齐,如标签缺乏语义层次,标签的同义、近义关系频现,标签词间关系不明确等,这些问题都有可能对基于社会标签的中文图书的自动分类应用带来消极影响。因此本文旨在对中文图书标签的特征分析的基础上,提出一种“内核受控,外壳非控”的分类模式,即通过建立“社会标签—主题词”的概念空间模型,实现利用主题词对社会标签的规范控制,并通过实验验证了该方法的合理性和可行性。
  本文具体的工作内容主要有以下4点:
  (1)对社会标签及其相关知识的研究现状进行总结,并详细论述有关社会标签规范控制的国内外研究进展,以及社会标签的具体应用研究动态等。
  (2)对中文图书的社会标签的特征进行分析,通过对图书标签的词长分布、使用量分布、词频分布、以及收词量、平均词长、类平均标引深度等指标的表现,证明中文图书标签具有一般自然语言所具有的特点,为将自然语言的分析处理方法应用到社会标签中的可行性提供了理论依据,同时也提出可以采取建立“社会标签—主题词”概念空间模型的方法实现对社会标签的质量控制。
  (3)根据中文图书标签的特点,引入概念空间的思想,利用基于统计的关联算法建立中文图书的“社会标签—主题词”的概念空间模型,从而实现了利用主题词对中文图书的社会标签进行规范控制的目的。
  (4)根据情报语言学原理提出了基于概念空间的“内核受控,外壳非控”的中文图书社会标签分类模式,即通过标签系统的后台控制,达到对社会标签的规范控制,从而实现基于社会标签的中文图书的自动分类。
  本文的创新点主要有以下2个方面:
  (1)通过对中文图书社会标签特点的调查分析,证实了社会标签具有自然语言的特点,为将自然语言的分析处理方法应用到社会标签中的可行性提供了理论依据,从而引入概念空间控制方法,建立中文图书的“社会标签—主题词”概念空间模型,实现对社会标签的规范控制。
  (2)本文提出面向中文图书社会标签的“内核受控,外壳非控”的分类模式,实现了标签系统内部控制标签质量,外部保留用户操作习惯的文本分类思想。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号