本文实例讲述了Java实现将汉字转化为汉语拼音的方法。分享给大家供大家参考,具体如下:
网上乱转,偶然看到一个很有意思的小工具,名字叫pinyin4j,可以把汉字转换为汉语拼音,利用他的话再配合上lucene、中文分词就可以做出类似google那种输入汉语拼音进行全文检索的功能了。实现的代码如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
|
package pinyin4j; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class pinyin4jTest { public static void main(String argsp[]) { try { String output = pinyin4jTest.CNToPinyin( "你和你好" , null ); System.out.println(output); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } } /** * @parm inputCN 输入的中文字符串 * @parm seg 输出汉语拼音时的分隔符 * * HanyuPinyinOutputFormat提供了几种输出模式 * HanyuPinyinCaseType:设定输入的结果是大写英文还是小写英文 LOWERCASE :小写 UPPERCASE :大写 * HanyuPinyinToneType:输出是否表明音调和重音 WITH_TONE_NUMBER:标明音调 如YE1 1-4表示 1-4声 * WITHOUT_TONE:不显示音调符 HanyuPinyinVCharType :输出要用何种的拼音编码 */ public static String CNToPinyin(String inputCN, String seg) throws BadHanyuPinyinOutputFormatCombination { char [] inputArray = inputCN.toCharArray(); if (seg == null ) seg = " " ; HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); format.setCaseType(HanyuPinyinCaseType.LOWERCASE); format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); format.setVCharType(HanyuPinyinVCharType.WITH_V); String output = "" ; String[] temp = new String[ 10 ]; for ( int i = 0 ; i < inputArray.length; i++) { temp = PinyinHelper.toHanyuPinyinStringArray(inputArray[i], format); //若输入的汉字为多音字则会将不同的读音依次放入temp[]中,若不是多音字则只有temp[0]中有值 for ( int j = 0 ; j < temp.length; j++) { output += temp[j] + seg; } } return output; } } |
希望本文所述对大家Java程序设计有所帮助。