中文分词(IKAnalyzer)

package com.leixinhui.test;

import java.io.IOException;
import java.io.Reader;
import java.io.StringReader;

import org.wltea.analyzer.IKSegmentation;
import org.wltea.analyzer.Lexeme;

public class Test {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		Reader reader = null;
		IKSegmentation segmentation = null;
		Lexeme lexeme = null;
		reader = new StringReader("我不做C语言程序已经有一段时间了。三聚氰胺、量规等词汇都是专业术语。");
		segmentation = new IKSegmentation(reader, true);
		try {
			while(null != (lexeme=segmentation.next())){
				System.out.println(lexeme.getLexemeText());
			}
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if(null != reader) reader.close();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
	}

}

备注:使用IKAnalyzer3.2.8


你可能感兴趣的:(中文分词)