首页> 外国专利> Method for identifying product description texts on web pages in websites, involves analyzing visitors visible text and/or lists and/or tables to determine meaningful texts and saving meaningful texts

Method for identifying product description texts on web pages in websites, involves analyzing visitors visible text and/or lists and/or tables to determine meaningful texts and saving meaningful texts

机译:用于识别网站上的网页上的产品描述文本的方法,涉及分析访问者可见的文本和/或列表和/或表格以确定有意义的文本并保存有意义的文本

摘要

The method involves storing source code of product pages by crawlers, reading the source partially from a database. The visitors visible texts are extracted from the source code of the product pages and the visitor visible texts are divided into individual sections of text and/or lists and/or tables. The visitors visible text and/or lists and/or tables are analyzed to determine the meaningful texts and are saved. The visitor text is searched from positive lists that contain terms for identifying products or services.
机译:该方法涉及由爬虫存储产品页面的源代码,部分地从数据库读取源。访客可见文本是从产品页面的源代码中提取的,并且访客可见文本被分为文本和/或列表和/或表格的各个部分。分析访问者可见的文本和/或列表和/或表,以确定有意义的文本并保存。从包含用于标识产品或服务的术语的肯定列表中搜索访问者文本。

著录项

  • 公开/公告号DE102013000620A1

    专利类型

  • 公开/公告日2014-07-17

    原文格式PDF

  • 申请/专利权人 I-MARKET GMBH;

    申请/专利号DE20131000620

  • 发明设计人 JÄGER DIETRICH JAKOB;

    申请日2013-01-16

  • 分类号G06F17/27;G06F17/30;G06F17/21;G06Q30;

  • 国家 DE

  • 入库时间 2022-08-21 15:37:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号