全文索引
全文索引的相关文献在1999年到2022年内共计99篇,主要集中在自动化技术、计算机技术、信息与知识传播、无线电电子学、电信技术
等领域,其中期刊论文68篇、会议论文5篇、专利文献7774篇;相关期刊51种,包括计算机工程、计算机应用研究、计算机应用与软件等;
相关会议5种,包括数字图书馆高层论坛2010年年会、第九届全国计算语言学学术会议、2007信息通信网技术业务发展研讨会等;全文索引的相关文献由174位作者贡献,包括聂文琪、胡运发、臧勇真等。
全文索引
-研究学者
- 聂文琪
- 胡运发
- 臧勇真
- 于伟
- 刘燕兵
- 王春露
- 路炜
- E·C·比歇
- P·普列沙奇科夫
- S·权
- S·黄
- 乔晓东
- 于玉
- 任辰
- 余斌
- 卢正鼎
- 史大义
- 吕兆龙
- 吴炜
- 吴裔
- 周慧
- 周美孜
- 夏冬
- 宋赛
- 左翠华
- 张学伟
- 张宇
- 张莹
- 张蕾
- 张运良
- 徐硕
- 文坤梅
- 朱礼军
- 李瑞轩
- 李雨前
- 燕昆
- 王奎
- 王斌
- 田英杰
- 辜希武
- 邓宪丽
- 郭乃网
- 陈勃胜
- 陈岭
- 陈琳
- 陶晓鹏
- 雷小强
- 鲁伟明
- 黄华炜
- 严雄伟
-
-
杜炜凝;
耿智;
孙海翔;
刘昶;
马骏毅
-
-
摘要:
为了整合企业内网中各业务系统模块的检索入口,消除数据孤岛,该系统基于一套爬取业务数据源的方法,使用分布式任务调度中心定时或手动执行爬取任务,建立缓存和全文索引库,并提供简洁且功能强大的数据库检索入口,直观、高效地将有价值的企业信息整合展示给企业用户,帮助用户快速完成对企业内各异构业务数据库的信息检索,并可以从搜索结果访问到相应的业务模块,有效提高了企业用户访问不同业务系统信息的效率和能力。
-
-
李柳青
-
-
摘要:
本文为了解决用倒排表索引XML节点而导致的查询效率低下,以及现有结构连接算法对值约束考虑不够的问题,本文给出运用原生XML数据库索引框架的结构索引合并PC子路径,运用XML值索引及全文索引处理比较运算符,产生查询优化树。实验表明,本文提出的算法极大的减少了查询树节点的个数,缩短了CPU时间开销和磁盘I/O开销。
-
-
-
洪华军;
吴建波
-
-
摘要:
系统数据量的增加,使得系统响应时间和系统吞吐率达不到要求,直接关系到系统性能和用户体验,因此对查询进行优化显得至关重要.以标准化服务平台系统应用开发为例,详细阐述了针对特定业务需求背景下的三种Oracle查询优化策略:基于Oracle全文索引,提高题录查询速度;基于Oracle快速刷新物化视图技术,提高年检查询速度;基于Oracle的Job定时任务,自动修改标准状态.
-
-
周慧;
张蕾;
吕兆龙
-
-
摘要:
在社会快速的发展过程,所产生的数据信息量越来越大,由于信息基数的数量较大,使得人们在数据检索应用中难度较大,需要花费大量的时间,才能完成查找。桌面搜索引擎的应用,能够保证用户在较短的时间内从大量的数据中获取自己所需要的数据信息;在桌面搜索引擎应用中,其主要采用的是全文检索的方式,因此,所需要索引数据也较多,能够节省储存空间,提高运行效率。倒排索引压缩的应用,能够有效提高索引效率,文章主要针对倒排索引压缩在桌面搜索引擎中的应用进行研究分析,明确了各项内容,希望可以促进倒排索引压缩技术的应用。
-
-
周慧;
张蕾;
吕兆龙
-
-
摘要:
在社会快速的发展过程,所产生的数据信息量越来越大,由于信息基数的数量较大,使得人们在数据检索应用中难度较大,需要花费大量的时间,才能完成查找.桌面搜索引擎的应用,能够保证用尸在较短的时间内从大量的数据中获取自己所需要的数据信息;在桌面搜索引擎应用中,其主要采用的是全文检索的方式,因此,所需要索引数据也较多,能够节省储存空间,提高运行效率.倒排索引压缩的应用,能够有效提高索引效率,文章主要针对倒排索引压缩在桌面搜索引擎中的应用进行研究分析,明确了各项内容,希望可以促进倒排索引压缩技术的应用.
-
-
王佳英;
王斌;
李晓华;
杨晓春
-
-
摘要:
针对P-BWT精确匹配算法存在只支持短串查询并且只能工作在单处理器上的问题,提出了一个多核并行的支持任意查询长度的精确查询算法.改进了P-BWT索引上的查询过程,当一个查询串跨越了多个数据分片时,首先在其匹配的最后一个分片上查询,然后依次在前面分片上进行验证.进一步提出了一个多核并行查询算法来减少搜索和验证过程的迭代次数.实验结果表明,所述算法可以高效并行地完成子串匹配任务.
-
-
卢喜利;
周月鹏
-
-
摘要:
超市的货架摆放、商品陈列,在一定程度上影响了商品的销售.通过对销售数据的分析,挖掘出商品之间的关联程度,进而确定商品在货架上的摆放位置,便于购物者就近选择,有利于提高超市的销售额.虽然,在分析数据过程中可以通过精确查询得到某两种或几种商品之间的关系,但同类型商品和某种其它商品之间的关系就不能通过精确查询得到.全文索引技术是目前搜索引擎的关键技术,由于商品种类繁多,在分析过程中使用全文索引技术可以减少系统开销,提高检索效率和精准度.
-
-
-
谢文阁;
佟玉军;
贾丹;
梅红岩
-
-
摘要:
介绍了数据清洗中的SNM算法和全文索引技术,通过引入全文索引技术对SNM算法进行了改进,以此提高了重复记录查找的速度和准确率,从而较好地提升了SNM算法的性能.%Data cleaning algorithm SNM and full-text indexing technology are introduced,the enhanced SNM algorithm are proposed by the introduction of full-text indexing technology.In order to improve the duplicate records to compare several degrees and accuracy,so improve SNM algorithm performance.
-
-
郭瑞杰;
程学旗;
许洪波;
张刚;
王斌
- 《第九届全国计算语言学学术会议》
| 2007年
-
摘要:
FinteX是一个功能强大、高性能、灵活的全文索引和检索平台。FinteX的主要目标是作为一个开放式的实验平台研究信息检索的各种数据结构、算法和模型,并可快速搭建实验系统。高性能和灵活的架构也使FinteX可以应甩在各种垂直搜索以及大规模搜索引擎等领域中。本文详细描述了FinteX的系统架构、相关算法、索引结构和系统实现。在426GB的GOV2数据集和271GB的搜狗互联网语料上的实验表明,FinteX是一个高性能、规模可扩展的全文索引和检索平台。
-
-
-
程秀权;
赵刚
- 《2007信息通信网技术业务发展研讨会》
| 2007年
-
摘要:
本文对搜索产业中新兴的垂直搜索的情况进行了概括阐述,指出了垂直搜索的网页采集技术、网页解析技术、全文索引和联合检索技术、文本挖掘技术等技术,并对整合行业资源、集成行业产业链的搜索门户、结构化搜索和非结构化搜索有机结合的搜索引擎、具有高粘性、社区化特性的行业深度搜索引擎的特点进行了论述,还对垂直搜索的未来发展方向进行了展望。
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 山东浪潮科学研究院有限公司
- 公开公告日期:2022-05-06
-
摘要:
本发明涉及数据库存储计算技术领域,具体提供了一种库外全文索引方法,用户指定创建全文索引后,系统自动在rocksdb中创建kv索引同时将索引列得数据同步到Elasticsearch中创建数据的全文索引,Elasticsearch中只存储数据行的标识和索引列的索引数据,实际数据还存储到rocksdb的kv行中;使用全文语法Contains将全文过滤内容发送给系统,系统自动转接给Elasticsearch获取全文的命中结果标识组,得到结果后,重新拼装成实际的Key获取整行kv数据。与现有技术相比,本发明去除了数据的全量读取按行过滤的耗时方式,通过引入异构系统Elasticsearch,两套引擎库外少量交互,库内一次读取方式,方便快捷。
-
-
-