...
首页> 外文期刊>東芝レビュー >XMLデータベースの全文検索技術
【24h】

XMLデータベースの全文検索技術

机译:XML数据库的全文搜索技术

获取原文
获取原文并翻译 | 示例
           

摘要

東芝は,XML (Extensible Markup Language)データをそのまま格納でき,かつ大容量データに対しても高速に検索できるXMLデータベースを研究·開発している。 XMLデータベースをコンテンツ管理システムに適用する場合,非定型データを検索対象とするために,より高度な全文検索機能が要求される。 このような背景から,XMLデータベースの全文検索技術の開発を行い,構造化文書に対応したスコアリング(スコア付け)や同義語検索などの機能を実現した。 また,全文検索用の索引としてNグラム索引に加えて形態素索引を利用できるようにし,索引のサイズを抑えながら高速な全文検索を実現した。
机译:东芝研究XML数据库,可以存储XML(可扩展标记语言)数据,以及高速搜索大容量数据。 当XML数据库应用于内容管理系统时,需要更高级的完整文本搜索功能来获取非稳定数据。 从这样的背景中,我们开发了XML数据库的全文搜索技术,并实现了与结构化文档的评分(得分)和同义词搜索等功能。 此外,形态指标可用于N-GRAM指数作为用于全文搜索的索引,并且在抑制索引的大小时实现了高速全文搜索。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号