首页> 中文学位 >基于NLP的社交问答网站用户兴趣能力分析方法的研究
【6h】

基于NLP的社交问答网站用户兴趣能力分析方法的研究

代理获取

目录

第一个书签之前

展开▼

摘要

社交问答网站是以用户之间的问答交流作为知识共享和信息传播方式的社交平台。以问答为第一位的需求,用户可以基于自身实际的困惑,发布问题,也可以作为知识载体,将自身经验和智慧以回答的形式分享给其他网站用户,从而形成有问有答的且拥有互动特性的社交平台。然而,现有的社交问答网站也存在回答质量不够高、用户接受信息过载、问答周期过长等问题,因此,需要提高社交问答网站的问答品质,这就需要能够准确地判断分析每个用户的关注点和能力擅长的领域,从而能将匹配的问题和回答用户准确地连接起来,提供高质量的问答服务。 本文的研究目的就是要能准确地判断分析社交问答网站中用户的关注点和能力擅长的领域。将提问与回答用户更准确地匹配,即需要同时发现用户的兴趣点和能力点,才能更准确地将提问推荐至既有兴趣回答又有专业知识提供高质量回答的用户。针对这一点本文主要做了以下研究: (1)针对现有研究一般是将兴趣和能力独立研究的情况,提出了基于NLP(Natural Language Processing,NLP)的用户兴趣能力分析方法N-UICAM(NLP-basedUser Interest and Capability Analysis Method,N-UICAM)。该方法基于NLP对文本进行多项语义分析,从而无需挖掘大量数据作为训练集;并针对文本分析中可能存在的短文本和垃圾回复的情况,增加数据预处理模块,按照给定规则过滤回答和合并问答数据;结合程度值计算方法提取出用户短期兴趣、长期兴趣和能力三个方面的特征,并最终将分析结果呈现为粗粒度的二级分类树和细粒度的标签项向量,从更丰富的角度描述兴趣和能力特征。 (2)提出了不同基准的特征词程度值计算算法。针对用户短期兴趣、长期兴趣和能力特征,结合归一化函数将其映射为线性刻度,再按照其各自的数据特性,分别基于时间衰减、时间窗口和赞同投票数计算程度值,并给出了用户短期和长期兴趣特征项的动态更新方法。 (3)结合社交问答网站知乎的用户数据,以提问内容自有的标签为验证标准,评估算法本身结果的准确性,包括分类树的重合度和标签项的准确率。再将其与现有算法做对比,通过计算分类树的召回率和平均绝对误差,以及用标签项做推荐排序计算出的性能指标,验证了本文提出的方法在用户兴趣和能力分析方面都具有较好的准确性和性能优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号