摘要:以电力企业的业务系统为背景,以设计实现一个适用于电力企业搜索引擎的分析器为目的,提出了一种基于词库实现的分词算法.该分析器基于电力专业词典完成,解决了现有分析器分词效果不尽人意的问题.同时,采用了构建词语树的方法,加载词库时,在内存中构建一棵词语树,分词时只需要遍历树即可分出相应的词语.这解决了常用最大匹配算法的必须设定一个最大词长的限制,并且在分词效率上也有了很大的提高,避免了无意义的匹配算法.最后对该分析器和Lucene两个内置的分析器进行了比较,结果证明,对于电力企业的应用系统,该分析器无论在时间还是分词效果上都优于Lucene内置的分析器.这表明该分析器已经能很好的满足构建电力企业搜索引擎的要求.