首页> 外文期刊>人工知能学会志 >ITの進展と法制度の非想定領域ー著作権法一部改正,47-6,47-7による検索エンジンの合法化についてー
【24h】

ITの進展と法制度の非想定領域ー著作権法一部改正,47-6,47-7による検索エンジンの合法化についてー

机译:IT进展和法律制度是非假定的区域 - 版权法版权法版权法修订,47-6,47-7搜索引擎的合法化

获取原文
获取原文并翻译 | 示例
           

摘要

著者の一人である喜連川はデータべースの研究を過去から一貫して行ってきた.データべースの価値は一言でいうならば大きなデータをしっかりと管理できるということであるが,大学の研究者が利用でき,しかも意味のある巨大なデータを見つけることは実際には容易ではなかった.企業は当然のことながら大規模な製品データや顧客データなどを有しているものの,一般に公開することはなく,大学のデータべース研究者は,利用可能な大きなデータを常に探し続けている状況であった.そこに生まれたのがWebである.Webは著者本人の意思で情報を開示し,それを万人が見ることのできるデータであり,検索エンジンという従来にない新しいサービスが生まれてきたが,その過程で,Web上のデータ量が指数的に増え続けてきたことは大変魅力的であった.日本でも早稲田大学による千里眼なるプロジェクト[田村95]で先駆的に分散ページクローリングの研究などがなされたが,データべース研究者的な意識での蓄積は特段なされなかった.商用検索エンジンにおいても当初は索引をつくった後はページを保存しておく理由もないため,同時にストレージのコストも高いため,破棄されていた.喜連川,豊田らは,1999年頃より,クローリング技術の研究というよりも,むしろ巨大データべース形成への魅力を原点として研究を始めた.もちろh,データを集めるためにはクロールは避けて通れないが,当時,ネットワークの帯域はかなり低く,東大の研究室で大規模クロールをしていると大学の計算機センタから,こhなにネットワークを利用して一体何をしているのかとお叱りを受けるような状態であった.後述するように,現在まで継続的に日本語で記載されているWebページを対象として巨大なWebアーカイブを構築するとともに(図1),その解析技術の研究を進めてきた[b連川08a,喜連川08b].その規模は米国のインターネットアーカイブ(IA)[IA 96]に次ぐものであり,アジア最大の規模となっている。
机译:作者之一是atsushi河一直在进行始终如一的研究。数据库的价值是,如果一个单词是一个单词,可以坚定地管理大数据,但大学研究人员可以使用,找到一个有意义的巨大数据实际上是不可容易的。理所当然,虽然它具有大规模的产品数据和客户数据,但它不公开披露,而大学的剂量基础研究员始终继续寻找大量数据,这是一种情况。它是在那里出生的网络。该网上揭示了作者意图中的信息,并且一定是可以看到的数据,即所有称为搜索引擎的新服务已经出生,但在该过程中,Web上的数据量是索引它非常有吸引力它继续增加。在日本,通过Waseda大学在Senri-Sena的一千个项目中进行了分布式页面爬行的开创性项目,但随时展位研究员意识的积累并不是特别特殊。即使在商业搜索引擎中,在创建索引之后,也没有理由保存页面,因此存储的成本也被丢弃,因为存储成本很高。 MIO,TOYOTA等。从1999年左右开始,他开始研究巨大的数据库形成的吸引力,而不是爬行技术的研究。 Mochiro H,爬行无法避免收集数据,但是当时,网络的带宽相当低,如果您在东京大学的实验室中有大型计算器中心的大规模爬行,那么它处于讨论我对网络的作用的状态。如稍后所述,同时构建日语迄今为止连续描述的网页的巨大Web页面(图1),我们促进了对分析技术的研究[B River 08a,Kimi River 08b]。尺度是第二个规模美国互联网档案(IA)[IA 96],是亚洲最大的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号