lucene学习 highLighter 高亮器 -

zdb_cn

浏览: 122410 次
性别:
来自: 上海

最近访客更多访客>>

chenzehe

centre2016

ccuizhou

mynameisbill2

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

lucene学习 highLighter 高亮器

博客分类：

lucene搜索引擎

package com.bin.lucene.highlighter;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.queryParser.MultiFieldQueryParser;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.Filter;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Fragmenter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
import org.junit.Test;

import com.bin.lucene.utils.File2DocUtils;

/**
 * 测试高亮器
 * @author Administrator
 *
 */
public class HighlighterTest {

	Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_35);
	String filePath = "D:\\workspace\\myeclipse\\LuceneDemo\\luceneDatassource\\CHANGES.txt";
	String indexPath = "D:\\workspace\\myeclipse\\LuceneDemo\\luceneIndex";
	
	@Test
	public void test1() throws Exception {
		
		//先查询
		String queryStr = "Lucene";
		QueryParser parser = new MultiFieldQueryParser(Version.LUCENE_35, new String[]{"name", "content"}, analyzer);
		Query query = parser.parse(queryStr);
		Filter filter = null;
		IndexReader indexReader = IndexReader.open(FSDirectory.open(new File(indexPath)));
		IndexSearcher searcher = new IndexSearcher(indexReader);
		TopDocs topDocs = searcher.search(query, filter, 10000);
		System.out.println("总共有【" + topDocs.totalHits + "】条匹配结果");
		
		List<Document> recordList = new ArrayList<Document>();
		Formatter formatter = new SimpleHTMLFormatter("<font color='red'>", "</font>");
		Scorer fragmentScorer = new QueryScorer(query);
		Highlighter highlighter = new Highlighter(formatter, fragmentScorer);
		Fragmenter fragmenter = new SimpleFragmenter(50);
		highlighter.setTextFragmenter(fragmenter);
		
		
		//取出当前页的数据
		int pageSize = 20;
		int pageNo = 1;
		int firstResult = (pageNo-1) * pageSize;
		int end = Math.min(pageNo * pageSize, topDocs.totalHits);
		System.out.println(firstResult + ":" + end);
		for(int i=firstResult; i<end; i++) {
			ScoreDoc scoreDoc = topDocs.scoreDocs[i];
			int docSn = scoreDoc.doc;	//文档内部编号
			Document doc = searcher.doc(docSn);	//根据文档编号取出文档
			
			//高亮===================
			String docContent = doc.get("content");
			String hc = highlighter.getBestFragment(analyzer, "content", docContent);
			if(hc == null) {
				if(docContent.length()>=50) {
					hc = docContent.substring(0, 50);
				} else {
					hc = docContent;
				}
			}
			doc.getField("content").setValue(hc);
			//高亮===================
			
			recordList.add(doc);
		}

		//显示
		for(Document doc : recordList) {
			File2DocUtils.printDocumentInfo(doc);
		}
	}
	
}

分享到：

javascript设计模式第一章 | Lucene 分词 TokenStream 取 Token

2012-04-01 11:32
浏览 2540
评论(2)
分类:开源软件
查看更多

2 楼 zqb666kkk 2014-06-24

代码能否给全还有jar包

1 楼 zqb666kkk 2014-06-24

lucene 那个版本

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene学习 highLighter 高亮器

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

lucene学习 highLighter 高亮器

评论

发表评论

相关推荐

Lucene 分词 TokenStream 取 Token

lucene学习 IKAnalyzer分词器

最近访客更多访客>>