数据抓取
数据抓取的相关文献在2007年到2022年内共计261篇,主要集中在自动化技术、计算机技术、法律、信息与知识传播
等领域,其中期刊论文86篇、会议论文5篇、专利文献562609篇;相关期刊79种,包括电子知识产权、当代经济、产业与科技论坛等;
相关会议5种,包括2014年科技强检电子信息系统研发与示范项目成果研讨会、2010年云南电力技术论坛、第十二届国际广播电视技术讨论会(ISBT 2007)等;数据抓取的相关文献由501位作者贡献,包括杨松、梁威、王庭宇等。
数据抓取—发文量
专利文献>
论文:562609篇
占比:99.98%
总计:562700篇
数据抓取
-研究学者
- 杨松
- 梁威
- 王庭宇
- 贾锦辉
- 郭旗
- 龚海澎
- 严斌峰
- 叶阳
- 吴卫平
- 安岗
- 廖军
- 陈茜
- 韩孟岗
- 刘庆
- 孙丽璐
- 徐弘
- 潘仕江
- 邹启蒙
- 陈卿
- 丁卓
- 丁彬
- 丁文勇
- 任敏
- 何钧雷
- 倪敏杰
- 冯庆磊
- 刘其峰
- 刘宝国
- 刘浪
- 初光磊
- 叶伟荣
- 叶颖
- 向平
- 向非能
- 吕大鹏
- 周双
- 周开拓
- 夏运
- 姜世举
- 孔德勇
- 孙赛赛
- 安红章
- 宋志朋
- 宋玉彬
- 崔达
- 张天瑜
- 张开翔
- 张心瑜
- 张淼
- 张美德
-
-
王月
-
-
摘要:
数据抓取是数据产业发展的重要一环,为了更好规制数据抓取行为,对该行为的法律性质进行学术层面的阐述,支持“不正当竞争行为说”。通过分析数据抓取行为的构成并结合司法实践发现,在认定过程中,裁判者过分强调竞争关系的认定起点位置,泛化使用商业道德标准,并且实质利益损害标准尚未明确,进而提出要转变整体的认定理念,弱化竞争关系认定起点的地位,规范适用商业道德标准,明确利益损害界定标准。
-
-
苏志甫
-
-
摘要:
进入数据要素时代,数据的生产、获取、利用等对各个行业的重要性日益凸显,商业数据的价值和潜力被不断激发,多方主体对数据资源的争夺导致商业数据纠纷案件不断涌现。随之而来的是对如何选择商业数据保护路径的诘问,在赋权路径尚无法实现的当下,《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)提供的行为规制路径是现行法律框架下满足大数据时代下商业数据保护需求的最具可行性的选择。结合实践中的典型案例及相关裁判规则,对《反不正当竞争法》路径下商业数据保护规则的构建进行了分析讨论,并提出了若干建议。
-
-
肖艳;
胡明乾;
周晓倩;
刘南希
-
-
摘要:
本项目对大数据时代背景下房地产估价机构信息数据的服务现状、问题及对策开展调查研究,有非常重要的理论和实践意义。课题组在对国外发展经验进行借鉴的基础上,结合国内发展现状,通过互联网平台对房地产估价机构及从业人员关于大数据在房地产估价机构的应用现状及问题展开调查,并基于调查结果,分别对房地产估价机构、房地产估价人员、房地产估价行业协会、数据化平台的构建及有关政府部门提出了有利于提高行业信息化进程的对策,为估价行业抓住机遇、加大改革提出了有针对性的建议。
-
-
郑璇玉;
豪日娃
-
-
摘要:
传统案件在判断不正当竞争时,会从竞争关系、竞争利益和竞争损害三方面进行考虑,数据抓取案件在这三个方面呈现出需要额外考虑的因素,值得进一步分析和优化。数据抓取不正当竞争行为的认定应当确立一个合理的边界,同时避免原告对数据的绝对垄断,为数据产品的后续发展提供创新创造的空间。在判断数据抓取是否构成不正当竞争行为时,应当以顺位优先的方式认定直接竞争关系与间接竞争关系,考虑原告收集和使用数据的正当性以及被告在抓取数据后使用数据行为的正当性。
-
-
王宇
-
-
摘要:
互联网的快速发展促进了数字经济的进步,数据已经成为现代经济竞争的核心要素。在这一背景下,企业间的数据抓取行为层出不穷。随着对互联网数据抓取行为的深入认识,司法机关逐步改变了传统的规制方式,开始依照《反不正当竞争法》的相关规则进行规制。然而实践中适用《反不正当竞争法》的相关条款规制网络不正当竞争行为存在诸多问题。为遏制互联网经济竞争中的不正当竞争行为,营造良好的网络竞争环境,有必要对相关法律条款中暴露的问题进行分析,并提出针对性的改进措施。
-
-
蔡耀轩;
郭子寒
-
-
摘要:
当前司法实践中对数据抓取及其限制行为正当性的认定存在两方面缺陷,即行为认定“泛道德化”和对经营者利益考量“单向化”,导致数据控制方不当处于“道德高地”,并呈现出“权利化”保护倾向,忽视了数据抓取方的数据利益。对数据抓取不正当竞争纠纷的司法裁判,不仅要应坚持保护竞争而非竞争者的竞争法价值取向,秉持谦抑适度的司法干预态度,还应构建以多元利益平衡为核心、以比例原则为分析框架的行为正当性认定机制,将数据抓取及其限制行为是否满足妥当性、必要性和相称性要求,是否造成了足以破坏市场竞争秩序的利益失衡结果作为正当性认定依据。
-
-
熊传玉;
徐尤华
-
-
摘要:
在线文档以轻便灵活的方式,极大地方便了用户实时收集数据。对于数据量较大的文档,通常会拆分成多个小的文档来操作,在线文档很少有直接合并下载的功能,给后期数据汇总分析带来不便。结合目前主流技术,利用Spring boot、Mybatis plus、jsoup、easyexcel等框架,快速实现多文档合并下载及数据汇总功能,为大量数据在线收集、汇总提供了解决办法。
-
-
徐可
-
-
摘要:
随着全球大数据战略布局的不断深化,数据成为日益重要的竞争资源和关键生产要素。爬虫协议和反爬虫技术体现了数据竞争权益与共享权益之间的冲突。判定是否构成不正当竞争行为的核心是行为的正当性认定,我国对数据抓取型不正当竞争行为的规制主要是基于兜底条款的规定,存在立法的模糊性、公认的商业道德的不确定性以及不满足商业秘密构成要件等判定难题。需要以比例原则为分析路径,厘清兜底条款的使用顺序,鉴别技术中立原则抗辩事由的合理性,明确数据抓取行为的正当性界限,以维护市场主体的合法权益,实现社会公共利益最大化。
-
-
徐宏宇
-
-
摘要:
《反不正当竞争法》第十二条被称为“互联网专条”,该条款明确规制了通过技术手段实施的几类互联网领域新型不正当竞争行为,包括恶意干扰、流量劫持等;但是随着数字经济的蓬勃发展,现实中抓取用户数据的不正当行为也将不断出现,然而却并未将这种行为纳入其中,所以当前法官在遇到这种新型问题的时候,仍以第二条,即“一般条款”作为对此类行为裁判的依据。近几年来,抓取用户数据构成不正当竞争的案件与争议越发频繁,已经裁判的案件,其裁判标准的合理性在学术界颇受争议。互联网经营者为了争夺市场、抓取用户数据从而构成不正当竞的案件也将越来越多,并且现行法律对抓取用户数据的不正当行为缺乏行为认定的共性框架,所以对抓取用户数据不正当竞争行为进行法律研究确有必要。因此,本文就关于抓取用户数据不正当竞争的行为进行分析。通过查阅一些典型案例,明确这种竞争行为认定的具体框架,以及法律中对认定这种行为的规制当前存在的问题,并有针对性地提出建议。
-
-
卢代富;
张煜琦
-
-
摘要:
我国法院在适用《反不正当竞争法》一般条款认定数据抓取行为的正当性中,普遍倾向于遵循一种带有传统侵权法色彩且偏重于对平台经营者数据利益保护的裁判路径,这种裁判路径容易引发数据权属界定的失衡现象。作为一种重视实质判断的法律解释方法论,利益衡量在对数据抓取行为所涉及的多种利益进行考量的同时,亦更加注重对数据抓取行为实际竞争效果的分析,以此确定对数据抓取行为的司法态度,进而谋求裁判所涉多方利益之间的平衡。在数据抓取纠纷案审理中进行利益衡量,要求以平台经营者利益、互联网消费者利益及社会公共利益等多元利益维度展开,以狭义比例原则作为利益权衡和取舍的工具,更加全面、客观地判断数据抓取行为的实际竞争效果以及由此决定的数据抓取行为的正当性。
-
-
张克猛;
赵明;
单鹏飞
- 《2014年科技强检电子信息系统研发与示范项目成果研讨会》
| 2014年
-
摘要:
本文阐述了大规模互联网数据抓取的计算机集群设计的研究背景和目前业界主流厂商的发展状况,然后详细介绍了正义网在研究该课题的一些实践经验,先阐述整个爬虫集群的框架设计思路,进而从智能爬虫设计时需要考虑的多线程及其算法问题、动态负载调节问题、高可靠性设计问题和页面元数据抽取等方面的问题进行阐述,另外还介绍了整个系统架构中采用的一些开源组件,例如ActiveMQ、BerkeleyDB、MongoDB等,阐述了这些组件在系统集成实践中的应用体会,最后描述了系统横向扩展性的设计思想.
-
-
黄晓东;
石瀚臣
- 《2019北京数字博物馆研讨会》
| 2019年
-
摘要:
随着中国经济的不断发展,北京作为文化中心,大众的文化消费水平在不断提高.而参观博物馆是大众最为喜爱的文化消费方式之一,博物馆的客流量也在不断提高.同时,随着互联网时代的到来,互联网越来越成为大众生活中不可或缺的事物.微博作为当下最为热门的互联网社交软件之一,有大量用户通过发表微博,记录对生活的感受,微博文本数量庞大.本文将通过python进行数据抓取,抓取不同类型的博物馆相关微博文本,并以此为基础进行情感分析,计算出大众对于博物馆的情感倾向,同时将评价数值予以分类,并从博物馆、季节和区县的角度,对情感分析的结果进行分析.
-
-
王茜
- 《第四届上海交通大学——ICA国际新媒体论坛》
| 2017年
-
摘要:
在"互联网+"时代,大数据正在成为重要的社会资源.在新闻传播与社会科学的研究中,大数据与算法技术手段的出现给传播学研究者带来新的研究方法,但同时也给传统的内容分析法带来新的挑战.计算型数据分析法迎合了大数据时代,快速便捷且分析量大,然而会丢失很多媒介语境中深层的含义,也无法挖掘语言和文字中的丰富性、复杂性以及内涵的微妙之处,网络内容研究如果仅依赖大数据计算分析可能会产生偏差,因此大数据时代依然需要计算机自动分析与传统人工的内容分析法相结合的研究方法.本文以大数据为背景,分析两者的优劣,以媒介内容分析为例,讨论如何根据研究需要,利用数据抓取技术与计算机编程辅助人工混合交叉进行数据与内容分析,以充分发挥这两种不同分析法的优势.
-
-
李晓东;
刘知一
- 《第十二届国际广播电视技术讨论会(ISBT 2007)》
| 2007年
-
摘要:
随着新技术的不断涌现,尤其是网络带宽的高速增长,带动了互联网上视听节目业务快速发展,在繁荣文化的同时也带来了很多社会问题,各国都在积极探索行之有效的管理技术手段。本文在分析现有数据抓取技术的基础上,从系统架构、系统组成、关键技术几个方面,简要介绍了我国互联网视听节目监管技术系统的思路和方向。
-
-
陈霍兴;
张志生;
高尚飞
- 《2010年云南电力技术论坛》
| 2010年
-
摘要:
针对当前发布的气象信息来源较多、信息分类复杂。输电线路气象信息管理平台主要任务为在丰富的气象信息中获取到影响输电线路的关键气象信息,并建立气象因素与输电线路设备相关的分析。平台以云南输电线路为研究对象,收集关于云南省所有气象信息。本文重点突出首次利用信息管理、信息关联技术建立了气象信息与云南输电线路运行情况,进行软件平台的基础设计与建设情况。
-
-
陈霍兴;
张志生;
高尚飞
- 《2010年云南电力技术论坛》
| 2010年
-
摘要:
针对当前发布的气象信息来源较多、信息分类复杂。输电线路气象信息管理平台主要任务为在丰富的气象信息中获取到影响输电线路的关键气象信息,并建立气象因素与输电线路设备相关的分析。平台以云南输电线路为研究对象,收集关于云南省所有气象信息。本文重点突出首次利用信息管理、信息关联技术建立了气象信息与云南输电线路运行情况,进行软件平台的基础设计与建设情况。
-
-
陈霍兴;
张志生;
高尚飞
- 《2010年云南电力技术论坛》
| 2010年
-
摘要:
针对当前发布的气象信息来源较多、信息分类复杂。输电线路气象信息管理平台主要任务为在丰富的气象信息中获取到影响输电线路的关键气象信息,并建立气象因素与输电线路设备相关的分析。平台以云南输电线路为研究对象,收集关于云南省所有气象信息。本文重点突出首次利用信息管理、信息关联技术建立了气象信息与云南输电线路运行情况,进行软件平台的基础设计与建设情况。
-
-
陈霍兴;
张志生;
高尚飞
- 《2010年云南电力技术论坛》
| 2010年
-
摘要:
针对当前发布的气象信息来源较多、信息分类复杂。输电线路气象信息管理平台主要任务为在丰富的气象信息中获取到影响输电线路的关键气象信息,并建立气象因素与输电线路设备相关的分析。平台以云南输电线路为研究对象,收集关于云南省所有气象信息。本文重点突出首次利用信息管理、信息关联技术建立了气象信息与云南输电线路运行情况,进行软件平台的基础设计与建设情况。
-
-
陈霍兴;
张志生;
高尚飞
- 《2010年云南电力技术论坛》
| 2010年
-
摘要:
针对当前发布的气象信息来源较多、信息分类复杂。输电线路气象信息管理平台主要任务为在丰富的气象信息中获取到影响输电线路的关键气象信息,并建立气象因素与输电线路设备相关的分析。平台以云南输电线路为研究对象,收集关于云南省所有气象信息。本文重点突出首次利用信息管理、信息关联技术建立了气象信息与云南输电线路运行情况,进行软件平台的基础设计与建设情况。