首页> 中国专利> 基于机器学习的自适应动态网页爬虫系统的实现方法

基于机器学习的自适应动态网页爬虫系统的实现方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开一种基于机器学习的自适应动态网页爬虫系统的实现方法，包括：动态网页路径选择模块根据输入信息获取所有联通的交互路径集合；动态网页路径自适应训练模块对动态网页路径选择模块输出的交互路径集合中的进行实时排序，形成交互路径列表；动态网页数据抓取模块对交互路径列表中的n条最优路径进行动态页面抓取，并将结果反馈给动态网页路径自适应训练模块，更新交互路径列表；其中，输入信息包括下列中的一个或多个：入口网页地址、目标网页地址、交互过程使用的初始输入数据、目标信息数据结构、和抓取网页范围列表。

著录项

公开/公告号CN106775611B

专利类型发明专利
公开/公告日2020-02-18

原文格式PDF
申请/专利权人中国人民财产保险股份有限公司;
展开▼

申请/专利号CN201610802662.X
发明设计人刘序文;王鹏;王和;邵利铎;刘苍牧;孙杰平;刘晗;李宏宇;
展开▼

申请日2016-09-05
分类号G06F8/20(20180101);G06N20/00(20190101);
代理机构11570 北京众达德权知识产权代理有限公司;
代理人刘杰
地址 100000 北京市朝阳区建国门外大街2号院2号楼
入库时间 2022-08-23 10:51:04

法律信息

法律状态公告日

法律状态信息

法律状态
2020-02-18

授权

授权
2017-06-23

实质审查的生效 IPC(主分类):G06F9/44 申请日:20160905

实质审查的生效
2017-06-23

实质审查的生效 IPC(主分类):G06F 9/44 申请日:20160905

实质审查的生效
2017-05-31

公开

公开
2017-05-31

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于机器学习的自适应动态网页爬虫系统的实现方法 [P] . 中国专利： CN106775611B . 2020.02.18
2. 基于机器学习的自适应动态网页爬虫系统的实现方法 [P] . 中国专利： CN106775611A . 2017-05-31
3. COMPUTER-BASED SYSTEMS, COMPUTING COMPONENTS AND COMPUTING OBJECTS CONFIGURED TO IMPLEMENT DYNAMIC OUTLIER BIAS REDUCTION IN MACHINE LEARNING MODELS [P] . US2021110313A1 . 2021-04-15

机译：基于计算机的系统，计算组件和计算对象配置为在机器学习模型中实现动态异常偏差
4. COMPUTER-BASED SYSTEMS, COMPUTING COMPONENTS AND COMPUTING OBJECTS CONFIGURED TO IMPLEMENT DYNAMIC OUTLIER BIAS REDUCTION IN MACHINE LEARNING MODELS [P] . WO2021055847A1 . 2021-03-25

机译：基于计算机的系统，计算组件和计算对象配置为在机器学习模型中实现动态异常偏差
5. MIMO-OFDM Adaptive transmission scheme determination apparatus based on MIMO-OFDM System using machine learning model and adaptive transmission method the same [P] . 韩国专利： KR101979394B1 . 2019-05-16

机译：基于使用机器学习模型的MIMO-OFDM系统的MIMO-OFDM自适应传输方案确定装置及其自适应传输方法