首页> 中国专利> 一种新闻选题分析方法及装置

一种新闻选题分析方法及装置

摘要

本发明实施例公开了一种新闻选题分析方法及装置,该方法包括:根据用户输入的新闻选题获取互联网关联数据;根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;根据所述实体信息和/或所述类别标签信息获取新闻事件线索;根据所述互联网关联数据的语义内容提取反馈数据;根据所述反馈数据获取新闻事件评估结果;根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。通过本发明的技术方案,解决了运用大数据对新闻事件的报道较片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

著录项

  • 公开/公告号CN106934049A

    专利类型发明专利

  • 公开/公告日2017-07-07

    原文格式PDF

  • 申请/专利权人 天闻数媒科技(北京)有限公司;

    申请/专利号CN201710157066.5

  • 申请日2017-03-16

  • 分类号G06F17/30;

  • 代理机构北京品源专利代理有限公司;

  • 代理人孟金喆

  • 地址 100088 北京市西城区德胜门外大街83号德胜国际中心B座5层

  • 入库时间 2023-06-19 02:48:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-07

    授权

    授权

  • 2017-08-01

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170316

    实质审查的生效

  • 2017-07-07

    公开

    公开

说明书

技术领域

本发明实施例涉及计算机网络通信技术领域,尤其涉及一种新闻选题分析方法及装置。

背景技术

随着新闻传媒业的飞速发展,如何挖掘新闻、制作新闻是报业在媒体竞争中立于不败之地的关键。目前报业遵循的仍然是传统的寻找选题、挖掘内容的方法,最新的数字技术并没有完全运用到工作中,如何利用大数据、云计算和自然语言处理技术的最新成就整合新闻资源、推动传统媒体和新兴媒体融合发展成为难题。

近年来国内外不少新闻媒体单位都对大数据在新闻行业的应用做了有意义尝试,但基本只是将数据作为辅助分析工具为新闻提供数据支撑,或者是对新闻进行分类推荐及舆情分析。目前,综合新闻事件的发展脉络等信息,为不同阶段的新闻报道提供适合的报道内容还没有成熟完善的产品,使得新闻报道机构对特定新闻选题的报道内容较为单一和片面。

发明内容

有鉴于此,本发明实施例提供了一种新闻选题方法及系统,以实现运用大数据,综合新闻事件发展脉络与对新闻事件的评估确定新闻选题的内容,辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

第一方面,本发明实施例提供了一种新闻选题分析方法,包括:

根据用户输入的新闻选题获取互联网关联数据;

根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;

根据所述实体信息和/或所述类别标签信息获取新闻事件线索;

根据所述互联网关联数据的语义内容提取反馈数据;

根据所述反馈数据获取新闻事件评估结果;

根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。

进一步地,所述根据用户输入的新闻选题获取互联网关联数据包括:

基于模式识别算法与配置策略根据所述用户输入的新闻选题获取互联网关联数据。

进一步地,所述根据所述实体信息和/或所述类别标签信息获取新闻事件线索包括:

根据所述实体信息和/获所述类别标签信息进行聚类分析获得新闻事件模型;

根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。

进一步地,所述根据所述反馈数据获取新闻事件评估结果包括:

通过对所述反馈数据进行指标统计,获取新闻事件评估结果。

进一步地,在所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容之后,还包括:

对所述新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的所述新闻选题内容确定为待报道新闻选题内容。

进一步地,在所述根据用户输入的新闻选题获取互联网关联数据之后,还包括:

根据关键标签和/或关键字确定热点新闻事件;

所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容包括:根据所述热点新闻事件、所述新闻事件线索和所述新闻事件评估结果确定所述新闻选题内容。

第二方面,本发明实施例还提供了一种新闻选题分析装置,包括:

数据获取模块,用于根据用户输入的新闻选题获取互联网关联数据;

信息提取模块,用于根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;

线索获取模块,用于根据所述实体信息和/或所述类别标签信息获取新闻事件线索;

反馈提取模块,用于根据所述互联网关联数据的语义内容提取反馈数据;

评估获取模块,用于根据所述反馈数据获取新闻事件评估结果;

内容确定模块,用于根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。

进一步地,所述数据获取模块具体用于:

基于模式识别算法与配置策略根据所述用户输入的新闻选题获取互联网关联数据。

进一步地,所述线索获取模块包括:

模型分析单元,用于根据所述实体信息和/或所述类别标签信息进行聚类分析获得新闻事件模型;

线索获取单元,用于根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。

进一步地,所述评估获取模块具体用于:

通过对所述反馈数据进行指标统计,获取新闻事件评估结果。

进一步地,所述新闻选题分析装置还包括:

内容匹配模块,用于对所述新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的所述新闻选题内容确定为待报道新闻选题内容。

进一步地,热点结合模块,用于根据关键标签和/或关键字确定热点新闻事件;

所述内容确定模块具体用于根据所述热点新闻事件、所述新闻事件线索和所述新闻事件评估结果确定所述新闻选题内容。

本发明实施例提供了一种新闻选题分析方法及装置,通过根据用户输入的选题获取互联网关联数据,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息以获取新闻事件线索,同时根据互联网关联数据的语义内容提取反馈数据以获取新闻事件评估结果,综合新闻事件线索和新闻事件评估结果,确定新闻选题内容。解决了对新闻事件的报道较为单一和片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题的内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

附图说明

图1是本发明实施例一提供的一种新闻选题分析方法的流程示意图。

图2是本发明实施例二提供的一种新闻选题分析方法的流程示意图。

图3本发明实施例三提供的一种新闻选题分析装置的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的一种新闻选题分析方法的流程示意图,本实施例的技术方案可以应用在需要对新闻选题进行分析的场景,可以由本发明实施例提供的新闻选题分析装置来执行,该系统可以采用软件和/或硬件的方式来实现。该方法包括:

S110,根据用户输入的新闻选题获取互联网关联数据。

用户可以输入报道内容待确认的新闻选题,根据用户输入的新闻选题对互联网关联数据进行采集。互联网关联数据可以是与用户输入的新闻选题相互关联的互联网数据,例如用户输入的某一新闻选题,可以根据用户输入的新闻选题在门户网站、论坛或微博等尽可能多的网页中采集与用户输入的新闻选题相关联的互联网数据,最大限度地获取针对用户输入的新闻选题的互联网关联数据。

可选的,可以基于模式识别算法与配置策略根据用户输入的新闻选题获取互联网关联数据。模式识别算法可以从海量的互联网数据中抽取相互关联的数据,例如可以基于一定的模式在各个网页中采集关于娱乐类或体育类的互联网数据。互联网关联数据的采集可以通过爬虫的爬取实现,配置策略可以是在进行爬虫的智能爬取以获得所需互联网关联数据时,对爬取的网站、爬虫爬取的模板以及爬虫的调度策略等进行配置。采用模式识别算法与配置策略进行互联关联数据的采集可以有效地过滤与用户输入的新闻选题不相关的无效数据,提高互联网关联数据的采集效率。

S120,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息。

实体信息可以通过分析互联网关联数据提取得到的诸如时间、人物、地点、行为等的实体信息,通过分析采集的互联网关联数据具体的语义内容,得到采集的互联网关联数据中包含哪些实体信息。例如,在一则报道人工智能新闻的网页中采集互联网关联数据,可以通过对互联网关联数据的语义进行分析得到围棋选手与围棋等实体信息。类别标签信息可以是采集的互联网关联数据中包含的类别标签,例如在报道春运期间火车票售票情况的网页中采集互联网关联数据,通过对互联网关联数据的语义内容进行分析,可以得到春节和车票等类别标签信息。

S130,根据实体信息和/或类别标签信息获取新闻事件线索。

可以根据实体信息获取新闻事件线索,也可以根据类别标签信息获取新闻事件线索,也可以同时根据实体信息和类别标签信息获取新闻事件线索。可选的,可以根据实体信息和/或类别标签信息进行聚类分析获得新闻事件模型。以奥运会选题为例,通过对互联网关联数据分析提取得到的实体信息或类别标签信息包括大量奥运会参会人员,对所有的奥运会参会人员进行聚类分析,则可以建立起诸如报道运动员的新闻事件模型或报道裁判员的新闻事件模型。同时,可以对实体之间的关系进行分析,根据聚类分析得到的新闻事件模型与实体关系得到新闻事件线索。根据互联网关联数据的语义内容得到的实体之间可能存在某种关联,根据得到的新闻事件模型,同时结合实体之间的关系,例如人物关系或时间先后关系等等,可以得到以时间为轴的新闻事件的发展图,例如针对春运选题,可以形成以时间为轴的买票、春运运力和春运返程发展趋势图,也就确定了与经过聚类分析得到的春运新闻事件模型的新闻事件线索。

S140,根据互联网关联数据的语义内容提取反馈数据。

根据互联网关联数据的语义内容提取的反馈数据例如可以是网页中获取的媒体或用户对某些新闻事件或网页内容的评论或转发等反馈性数据。

S150,根据反馈数据获取新闻事件评估结果。

可选的,可以通过对反馈数据进行指标统计,获取新闻事件评估结果。具体的,可以对根据互联网关联数据语义内容提取的反馈数据进行特定指标的统计,例如对反馈数据进行诸如点击量或转载量等指标的统计,以获取诸如新闻曝光度评价、用户感情值评价、用户质量评价、新闻影响力等新闻事件的评估结果。同时还可以对不同网页中获取的新闻事件评估结果进行对比,以得到不同网页中获取的新闻事件诸如报道全面性或用户评价值等的对比结果,这样能够有效为最终新闻选题内容的确定提供更为全面的数据支撑。

S160,根据新闻事件线索和新闻事件评估结果,确定新闻选题内容。

基于相关新闻事件模型以及实体关系分析得到的新闻事件线索可以为最终新闻选题内容的确定提供新闻事件以时间为轴的新闻事件的发展动态趋势,同时结合对获取的反馈数据进行点击量或转载量等的指标统计得到的新闻事件评估结果,可以为最终新闻选题内容的确定提供较全面的新闻报道角度与切入点。

示例性的,通过对互联网中与春运问题相关的互联网关联数据进行采集,以及对互联网关联数据中包含的实体信息以及类别标签信息进行聚类等的分析,得到的新闻事件线索可以是关于春运选题的以时间为轴的买票、春运运力和春运返程的发展趋势。同时,结合获取的用户或相关媒体对春运涉及的买票等问题的评价或转载量等的评估结果,最终确定的新闻选题内容,例如可以是对用户评价较高、转载量较多的从买票到春运运力和再到春运返程等相关新闻内容进行报道。

可选的,可以对新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的新闻选题内容确定为待报道新闻选题内容。初步确认新闻选题内容后,可以将确定的新闻选题内容与待编辑稿件库中的新闻内容进行匹配,当确定的新闻选题内容与待编辑稿件库中新闻内容不同时,则可以将确定的新闻选题内容作为待报道的新闻选题内容。这样能够有效避免最终确定的新闻选题内容与待编辑稿件库中的新闻内容重叠,能够保证确定的新闻选题内容的新颖性。

本发明实施例通过根据用户输入的选题获取互联网关联数据,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息以获取新闻事件线索,同时根据互联网关联数据的语义内容提取反馈数据以获取新闻事件评估结果,综合新闻事件线索和新闻事件评估结果,确定新闻选题内容。解决了对新闻事件的报道较为单一和片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题的内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

实施例二

图2是本发明实施例二提供的一种新闻选题分析方法的流程示意图,该方法以前述实施例为基础,增加了根据关键标签和/或关键字确定热点新闻事件这一步骤。

相应的,本发明实施例的方法包括:

S210,根据用户输入的新闻选题获取互联网关联数据。

S220,根据关键标签和/或关键字确定热点新闻事件。

根据采集的互联网关联数据中的关键标签和/或关键字,例如可以统计采集的互联网关联数据中关键标签和/或关键字出现的频率,与出现频率较高的关键标签和/或关键字关联的新闻事件则可以确定为热点新闻事件。

S230,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息。

S240,根据实体信息和/或类别标签信息获取新闻事件线索。

S250,根据互联网关联数据的语义内容提取反馈数据。

S260,根据反馈数据获取新闻事件评估结果。

S270,根据热点新闻事件、新闻事件线索和新闻事件评估结果确定新闻选题内容。

确认最终新闻选题内容时,在结合获取的新闻事件线索以及新闻事件评估结果的基础上,还可以结合根据关键标签和/或关键字确定的热点新闻事件。示例性的,就春运选题确定新闻选题内容时,根据关键标签和/或关键字确定春运期间学生购票问题为热点新闻事件,则最终新闻选题内容的确定,除了以获取的新闻事件线索以及新闻事件评估结果为依据,还可以结合春运期间学生的购票问题进行全面性的报道。

本发明实施例通过在根据用户输入的新闻选题获取互联网关联数据之后,根据关键标签和/或关键字确定热点新闻事件,实现了在最终新闻选题内容的确定时,结合根据关键标签和/或关键字确定的热点新闻事件,及时有效地获取关于用户输入新闻选题的热点报道内容,同时也是用户关注的报道内容,在最终针对用户输入的新闻选题确定新闻选题内容时,能够为新闻报道机构推荐热点新闻事件,结合热点新闻事件可以对新闻进行更为全面的报道。

实施例三

图3是本发明实施例三提供的一种新闻选题分析装置的结构示意图,该装置包括:

数据获取模块310,用于根据用户输入的新闻选题获取互联网关联数据;

信息提取模块320,用于根据互联网关联数据的语义内容提取实体信息和/或类别标签信息;

线索获取模块330,用于根据实体信息和/或类别标签信息获取新闻事件线索;

反馈提取模块340,用于根据互联网关联数据的语义内容提取反馈数据;

评估获取模块350,用于根据反馈数据获取新闻事件评估结果;

内容确定模块360,用于根据新闻事件线索和新闻事件评估结果,确定新闻选题内容。

可选的,数据获取模块310具体可以用于基于模式识别算法与配置策略根据用户输入的新闻选题获取互联网关联数据。

可选的,线索获取模块330可以包括模型分析单元和线索获取单元,其中,模型分析单元可以用于根据所述实体信息和/或所述类别标签信息进行聚类分析获得新闻事件模型,线索获取单元可以用于根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。

可选的,评估获取模块350具体可以用于通过对反馈数据进行指标统计,获取新闻事件评估结果。

可选的,新闻选题分析装置还可以包括内容匹配模块,用于对新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的新闻选题内容确定为待报道新闻选题内容。

可选的,新闻选题分析装置还可以包括热点结合模块,用于根据关键标签和/或关键字确定热点新闻事件,相应的,内容确定模块具体可以用于根据热点新闻事件、新闻事件线索和新闻事件评估结果确定新闻选题内容。

本发明实施例通过根据用户输入的选题获取互联网关联数据,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息以获取新闻事件线索,同时根据互联网关联数据的语义内容提取反馈数据以获取新闻事件评估结果,综合新闻事件线索和新闻事件评估结果,确定新闻选题内容。解决了对新闻事件的报道较为单一和片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题的内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号