公开/公告号CN112685564A
专利类型发明专利
公开/公告日2021-04-20
原文格式PDF
申请/专利权人 广州博士信息技术研究院有限公司;
申请/专利号CN202011583399.2
申请日2020-12-28
分类号G06F16/35(20190101);G06F16/951(20190101);G06F16/9535(20190101);G06F40/284(20200101);G06F40/30(20200101);G06N20/00(20190101);
代理机构44663 广州博士科创知识产权代理有限公司;
代理人李永锋
地址 510000 广东省广州市高新技术产业开发区科学城科珠路203号1201D
入库时间 2023-06-19 10:41:48
技术领域
本发明涉及政策分类系统技术领域,尤其是一种智能科技政策分类、推送方法、以及系统。
背景技术
政策信息网站通常保存有大量的文件、公文、通告等文档类数据,由于数量庞大,需要花费大量的时间和精力分类,并存在着查找信息不便、信息搜索不准确、信息分类不合理、分类不细致、信息录入板块不准确等各类问题,不利于提供有效的信息服务。
国家政策是企业发展规划和发展的指向标,对企业未来的业务、服务方向、营销策划方式、广告策划等众多方面都会产生一定的营销。快速获得自己想要的目标信息成为了企业追求的目标。因此面对海量的文本信息,实现智能政策文档分类并能够精准推送用户感兴趣的文档成为了目前互联网应用的研究热点。
目前关于这方面公开的发明技术方案并不多,跟本专利技术方案最接近的是专利申请号为CN 109359235 A的发明专利“一种政策资讯智能标注方法及智能匹配方法”。
现有技术中对于政策分类,推送存在的技术问题是,它主要是通过设置的文字标签对收集的数据进行智能化判断标注,将数据按设定的标签进行归类,系统根据用户的相关信息与政策资讯标注的标签进行智能匹配,系统自动列出跟用户相关的政策资讯。未能实现通过中文分词分析用户点击推送信息的历史记录,以过滤他们认为哪些内容不那么重要。所以当前这种方法仍然需要用户在推送的大量政策数据中查找真正实际需要的政策信息。
发明内容
针对现有技术的不足,本发明提供一种智能科技政策分类、推送方法、以及系统,所述的系统借助于智能分词技术和自然语言理解技术,快速对海量的政策信息数据进行关键词、句法、语义分析,为每一篇政策信息打上对应的准确的标签,精确地将其划分到合适的类别;
利用自然语言处理(NLP)、大数据技术和机器学习(ML)来理解和组织用户行为数据信息为用户智能推送用户感兴趣的政策资讯。
本发明的技术方案为:一种智能科技政策分类、推送系统,所述的系统包括:
政策数据入库模块
利用爬虫技术采集国家,省、市、区各政府网站的政策数据及其他与科技政策有关的网页数据,并对数据进行汇聚整合;
政策分类模块
利用于人工智能分词技术和自然语言理解技术对网络爬虫爬取的数据进行计算处理,对海量的政策信息数据进行关键词、句法和语义分析,为每一篇政策信息打上准确的标签,精确地将其划分到合适的类别;
用户行为分析模块
用于根据采集的用户数据,根据用户基本信息、请求类别和请求动作对用户进行和政策分类一样的标签化处理,得到用户行为分析;
智能推送模块
用于通过人工智能网络,利用海量用户行为数据,结合对政策信息收集和标签分类的数据积累,进行基于用户行为的相似度较高的政策信息推荐。
进一步的,所述的政策分类模块的分词类别为:高新技术企业、高新技术、高企认定、高新、高企、高新认定、高企培育、高企入库、省高企培育等关键信息会被分类到高新技术企业认定政策类。
进一步的,将收集并分类好的政策数据建立政策专用信息库。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户基本信息采集,形成用户基本标签。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户在各大政策网站以及本服务平台上的浏览记录、收藏记录。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户在各大政策网站以及本服务平台上订阅信息,采集用户订阅地区、项目类型、政策类型等信息。
进一步的,所述的用户基本信息采集包括:
利用爬虫获得相关企业和个人的信息,建立企业和个人信息库,或注册用户登录,政策服务平台可以自动识别用户的身份,获得用户的权限、业务领域、企业名称、注册时间、注册地址、企业从事行业等基本信息和知识产权、财务、人员、研发情况等其他信息或者个人研究成果、发表论文、申请专利、承担项目等基本信息
进一步的,所述的智能推送模块在用户登录系统后,系统可自动推送出跟用户相关的政策资讯,提醒用户积极用好相关政策。
进一步的,所述系统的推送界面使用多个分类标签再次筛选数据,以便快速查找到所需要的信息。
本发明还提供一种智能科技政策分类、推送方法,所述的方法包括以下步骤:
S1)、政策数据入库
利用爬虫技术采集国家,省、市、区各政府网站的政策数据及其他与科技政策有关的网页数据,并对数据进行汇聚整合;
S2)、政策分类
利用于人工智能分词技术和自然语言理解技术对网络爬虫爬取的数据进行计算处理,对海量的政策信息数据进行关键词、句法和语义分析,为每一篇政策信息打上准确的标签,精确地将其划分到合适的类别;
S3)、用户行为分析
根据采集的用户数据,根据用户基本信息、请求类别和请求动作对用户进行和政策分类一样的标签化处理,得到用户行为分析;
S4)、智能推送
用于通过人工智能网络,利用海量用户行为数据,结合对政策信息收集和标签分类的数据积累,进行基于用户行为的相似度较高的政策信息推荐。
进一步的,步骤S2)中,分词类别为:高新技术企业、高新技术、高企认定、高新、高企、高新认定、高企培育、高企入库、省高企培育等关键信息会被分类到高新技术企业认定政策类,并将收集并分类好的政策数据建立政策专用信息库。
进一步的,步骤S3)中,所述的用户行为分析模块所用采集的用户数据来源为:用户基本信息采集,形成用户基本标签。
进一步的,步骤S3)中,所述的用户行为分析模块所用采集的用户数据来源还可以为:用户在各大政策网站以及本服务平台上的浏览记录、收藏记录。
进一步的,步骤S3)中,所述的用户行为分析模块所用采集的用户数据来源为:用户在各大政策网站以及本服务平台上订阅信息,采集用户订阅地区、项目类型、政策类型等信息。
进一步的,所述的用户基本信息采集包括:
利用爬虫获得相关企业和个人的信息,建立企业和个人信息库,或注册用户登录,政策服务平台可以自动识别用户的身份,获得用户的权限、业务领域、企业名称、注册时间、注册地址、企业从事行业等基本信息和知识产权、财务、人员、研发情况等其他信息或者个人研究成果、发表论文、申请专利、承担项目等基本信息
进一步的,步骤S4)中,所述的智能推送模块在用户登录系统后,系统可自动推送出跟用户相关的政策资讯,提醒用户积极用好相关政策,其推送界面使用多个分类标签再次筛选数据,以便快速查找到所需要的信息。
本发明的有益效果为:
1、本发明借助于人工智能分词技术和自然语言理解技术,不仅对关键词进行标记,同时对句法、语义进行智能标记,可以理解符号化,概念化的信息,结合上下文识别生词、自动消除歧义;
2、本发明供智能分类技术,减少人工分类的时间精力,更为精准的分类到合适的分类栏,以便信息搜索的准确性、信息录入板块的准确性等,可以更好的提供高效的服务;
3、本发明采集的用户行为数据标签化和政策分类一样的标签化,保证用户行为数据与后台政策数据库中的标签一致,便于快速的推送出最适合的政策信息;
4、本发明用户登录系统,自动推送界面可以使用多个分类标签再次筛选数据以便快速查找到所需要的信息,一定程度上减少了搜索的步骤,不用可以更加便捷得到感兴趣的政策;
4、本发明通过三种路径收集用户行为信息,得到更为精准的信息推送给用户,尽可能用最快的时间、最低的成本查询最适合最合理的政策。
附图说明
图1为发明方法的流程示意图;
图2为本发明系统的框架结构图;
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
实施例1
如图1所示,本实施例提供一种智能科技政策分类、推送方法,本实施例通过借助于智能分词技术和自然语言理解技术,快速对海量的政策信息数据进行关键词、句法、语义分析,为每一篇政策信息打上对应的准确的标签,精确地将其划分到合适的类别。
利用自然语言处理(NLP)、大数据技术和机器学习(ML)来理解和组织用户行为数据信息为用户智能推送用户感兴趣的政策资讯。
所述的方法包括以下步骤:
S1)、政策数据入库
利用爬虫技术采集国家,省、市、区各政府网站的政策数据及其他与科技政策有关的网页数据,并对数据进行汇聚整合;
S2)、政策分类
利用于人工智能分词技术和自然语言理解技术对网络爬虫爬取的数据进行计算处理,对海量的政策信息数据进行关键词、句法和语义分析,为每一篇政策信息打上准确的标签,精确地将其划分到合适的类别;本实施例中,所述的分词类别为:高新技术企业、高新技术、高企认定、高新、高企、高新认定、高企培育、高企入库、省高企培育等关键信息会被分类到高新技术企业认定政策类,并将收集并分类好的政策数据建立政策专用信息库。
S3)、用户行为分析
根据采集的用户数据,根据用户基本信息、请求类别和请求动作对用户进行和政策分类一样的标签化处理,得到用户行为分析;
本实施例中,所述的用户行为分析模块所用采集的用户数据来源为:
1、用户基本信息采集,形成用户基本标签;其中,可利用爬虫获得相关企业和个人的信息,建立企业和个人信息库,或注册用户登录,政策服务平台可以自动识别用户的身份,获得用户的权限、业务领域、企业名称、注册时间、注册地址、企业从事行业等基本信息和知识产权、财务、人员、研发情况等其他信息或者个人研究成果、发表论文、申请专利、承担项目等基本信息。
2、所述的用户行为分析模块所用采集的用户数据来源还可以为:用户在各大政策网站以及本服务平台上的浏览记录、收藏记录;
3、用户在各大政策网站以及本服务平台上订阅信息,采集用户订阅地区、项目类型、政策类型等信息。
S4)、智能推送
用于通过人工智能网络,利用海量用户行为数据,结合对政策信息收集和标签分类的数据积累,进行基于用户行为的相似度较高的政策信息推荐。
所述的智能推送模块在用户登录系统后,系统可自动推送出跟用户相关的政策资讯,提醒用户积极用好相关政策,其推送界面使用多个分类标签再次筛选数据,以便快速查找到所需要的信息。
实施例2
如图2所示,本实施例提供一种智能科技政策分类、推送系统,所述的系统包括:
政策数据入库模块
利用爬虫技术采集国家,省、市、区各政府网站的政策数据及其他与科技政策有关的网页数据,并对数据进行汇聚整合;
政策分类模块
利用于人工智能分词技术和自然语言理解技术对网络爬虫爬取的数据进行计算处理,对海量的政策信息数据进行关键词、句法和语义分析,为每一篇政策信息打上准确的标签,精确地将其划分到合适的类别。
本实施例中,所述的政策分类模块的分词类别为:高新技术企业、高新技术、高企认定、高新、高企、高新认定、高企培育、高企入库、省高企培育等关键信息会被分类到高新技术企业认定政策类。并将收集并分类好的政策数据建立政策专用信息库。
用户行为分析模块
用于根据采集的用户数据,根据用户基本信息、请求类别和请求动作对用户进行和政策分类一样的标签化处理,得到用户行为分析;
智能推送模块
用于通过人工智能网络,利用海量用户行为数据,结合对政策信息收集和标签分类的数据积累,进行基于用户行为的相似度较高的政策信息推荐。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户基本信息采集,形成用户基本标签。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户在各大政策网站以及本服务平台上的浏览记录、收藏记录。
进一步的,所述的用户行为分析模块所用采集的用户数据来源为:用户在各大政策网站以及本服务平台上订阅信息,采集用户订阅地区、项目类型、政策类型等信息。
进一步的,所述的用户基本信息采集包括:
利用爬虫获得相关企业和个人的信息,建立企业和个人信息库,或注册用户登录,政策服务平台可以自动识别用户的身份,获得用户的权限、业务领域、企业名称、注册时间、注册地址、企业从事行业等基本信息和知识产权、财务、人员、研发情况等其他信息或者个人研究成果、发表论文、申请专利、承担项目等基本信息
进一步的,所述的智能推送模块在用户登录系统后,系统可自动推送出跟用户相关的政策资讯,提醒用户积极用好相关政策。
进一步的,所述系统的推送界面使用多个分类标签再次筛选数据,以便快速查找到所需要的信息。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
机译: 事件信息系统使用机器学习分类模型对消息进行分类并将所选消息推送给用户
机译: 事件信息系统使用机器学习分类模型对消息进行分类并将所选消息推送给用户
机译: 一种对车辆座椅进行分类的方法和一种用于对车辆座椅进行分类的分类系统