在做项目中经常会遇到有项目需求是需要判断字符为中文的一些问题,所以搜集了判断中文字符的代码片段,特此分享供大家参考。
直接贴出代码了,里面有详细的注释。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
|
package com.coder4j.main; import java.util.regex.Pattern; /** * Java 判断中文字符 * * @author Chinaxiang * @date 2015-08-11 * */ public class CheckChinese { public static void main(String[] args) { // 纯英文 String s1 = "Hello,Tom.!@#$%^&*()_+-={}|[];':\"?" ; // 纯中文(不含中文标点) String s2 = "你好中国" ; // 纯中文(含中文标点) String s3 = "你好,中国。《》:“”‘';()【】!¥、" ; // 韩文 String s4 = "한국어난" ; // 日文 String s5 = "ぎじゅつ" ; // 特殊字符 String s6 = "��" ; String s7 = "╃" ; String s8 = "╂" ; // 繁体中文 String s9 = "蒼老師" ; // 1 使用字符范围判断 System.out.println( "s1是否包含中文:" + hasChineseByRange(s1)); // false System.out.println( "s2是否包含中文:" + hasChineseByRange(s2)); // true System.out.println( "s3是否包含中文:" + hasChineseByRange(s3)); // true System.out.println( "s4是否包含中文:" + hasChineseByRange(s4)); // false System.out.println( "s5是否包含中文:" + hasChineseByRange(s5)); // false System.out.println( "s6是否包含中文:" + hasChineseByRange(s6)); // false System.out.println( "s7是否包含中文:" + hasChineseByRange(s7)); // false System.out.println( "s8是否包含中文:" + hasChineseByRange(s8)); // false System.out.println( "s9是否包含中文:" + hasChineseByRange(s9)); // true System.out.println( "-------分割线-------" ); System.out.println( "s1是否全是中文:" + isChineseByRange(s1)); // false System.out.println( "s2是否全是中文:" + isChineseByRange(s2)); // true System.out.println( "s3是否全是中文:" + isChineseByRange(s3)); // false 中文标点不在范围内 System.out.println( "s4是否全是中文:" + isChineseByRange(s4)); // false System.out.println( "s5是否全是中文:" + isChineseByRange(s5)); // false System.out.println( "s6是否全是中文:" + isChineseByRange(s6)); // false System.out.println( "s7是否全是中文:" + isChineseByRange(s7)); // false System.out.println( "s8是否全是中文:" + isChineseByRange(s8)); // false System.out.println( "s9是否全是中文:" + isChineseByRange(s9)); // true System.out.println( "-------分割线-------" ); // 2 使用字符范围正则判断(结果同1) System.out.println( "s1是否包含中文:" + hasChineseByReg(s1)); // false System.out.println( "s2是否包含中文:" + hasChineseByReg(s2)); // true System.out.println( "s3是否包含中文:" + hasChineseByReg(s3)); // true System.out.println( "s4是否包含中文:" + hasChineseByReg(s4)); // false System.out.println( "s5是否包含中文:" + hasChineseByReg(s5)); // false System.out.println( "s6是否包含中文:" + hasChineseByReg(s6)); // false System.out.println( "s7是否包含中文:" + hasChineseByReg(s7)); // false System.out.println( "s8是否包含中文:" + hasChineseByReg(s8)); // false System.out.println( "s9是否包含中文:" + hasChineseByReg(s9)); // true System.out.println( "-------分割线-------" ); System.out.println( "s1是否全是中文:" + isChineseByReg(s1)); // false System.out.println( "s2是否全是中文:" + isChineseByReg(s2)); // true System.out.println( "s3是否全是中文:" + isChineseByReg(s3)); // false 中文标点不在范围内 System.out.println( "s4是否全是中文:" + isChineseByReg(s4)); // false System.out.println( "s5是否全是中文:" + isChineseByReg(s5)); // false System.out.println( "s6是否全是中文:" + isChineseByReg(s6)); // false System.out.println( "s7是否全是中文:" + isChineseByReg(s7)); // false System.out.println( "s8是否全是中文:" + isChineseByReg(s8)); // false System.out.println( "s9是否全是中文:" + isChineseByReg(s9)); // true System.out.println( "-------分割线-------" ); // 3 使用CJK字符集判断 System.out.println( "s1是否包含中文:" + hasChinese(s1)); // false System.out.println( "s2是否包含中文:" + hasChinese(s2)); // true System.out.println( "s3是否包含中文:" + hasChinese(s3)); // true System.out.println( "s4是否包含中文:" + hasChinese(s4)); // false System.out.println( "s5是否包含中文:" + hasChinese(s5)); // false System.out.println( "s6是否包含中文:" + hasChinese(s6)); // false System.out.println( "s7是否包含中文:" + hasChinese(s7)); // false System.out.println( "s8是否包含中文:" + hasChinese(s8)); // false System.out.println( "s9是否包含中文:" + hasChinese(s9)); // true System.out.println( "-------分割线-------" ); System.out.println( "s1是否全是中文:" + isChinese(s1)); // false System.out.println( "s2是否全是中文:" + isChinese(s2)); // true System.out.println( "s3是否全是中文:" + isChinese(s3)); // true 中文标点也被包含进来 System.out.println( "s4是否全是中文:" + isChinese(s4)); // false System.out.println( "s5是否全是中文:" + isChinese(s5)); // false System.out.println( "s6是否全是中文:" + isChinese(s6)); // false System.out.println( "s7是否全是中文:" + isChinese(s7)); // false System.out.println( "s8是否全是中文:" + isChinese(s8)); // false System.out.println( "s9是否全是中文:" + isChinese(s9)); // true } /** * 是否包含中文字符<br> * 包含中文标点符号<br> * * @param str * @return */ public static boolean hasChinese(String str) { if (str == null ) { return false ; } char [] ch = str.toCharArray(); for ( char c : ch) { if (isChinese(c)) { return true ; } } return false ; } /** * 是否全是中文字符<br> * 包含中文标点符号<br> * * @param str * @return */ public static boolean isChinese(String str) { if (str == null ) { return false ; } char [] ch = str.toCharArray(); for ( char c : ch) { if (!isChinese(c)) { return false ; } } return true ; } /** * 是否是中文字符<br> * 包含中文标点符号<br> * * @param c * @return */ private static boolean isChinese( char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) { return true ; } else if (ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS) { return true ; } else if (ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) { return true ; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A) { return true ; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B) { return true ; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_C) { return true ; } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_D) { return true ; } else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) { return true ; } else if (ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) { return true ; } return false ; } /** * 是否包含汉字<br> * 根据汉字编码范围进行判断<br> * CJK统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean hasChineseByReg(String str) { if (str == null ) { return false ; } Pattern pattern = Pattern.compile( "[\\u4E00-\\u9FBF]+" ); return pattern.matcher(str).find(); } /** * 是否全是汉字<br> * 根据汉字编码范围进行判断<br> * CJK统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean isChineseByReg(String str) { if (str == null ) { return false ; } Pattern pattern = Pattern.compile( "[\\u4E00-\\u9FBF]+" ); return pattern.matcher(str).matches(); } /** * 是否包含汉字<br> * 根据汉字编码范围进行判断<br> * CJK统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean hasChineseByRange(String str) { if (str == null ) { return false ; } char [] ch = str.toCharArray(); for ( char c : ch) { if (c >= 0x4E00 && c <= 0x9FBF ) { return true ; } } return false ; } /** * 是否全是汉字<br> * 根据汉字编码范围进行判断<br> * CJK统一汉字(不包含中文的,。《》()“‘'”、!¥等符号)<br> * * @param str * @return */ public static boolean isChineseByRange(String str) { if (str == null ) { return false ; } char [] ch = str.toCharArray(); for ( char c : ch) { if (c < 0x4E00 || c > 0x9FBF ) { return false ; } } return true ; } } |
如果仅仅去判断是否是中文,不需判断中文标点的话,推荐使用正则去匹配,可能更高效点。
以上代码内容给大家介绍了Java 判断字符为中文实例代码(超管用),希望对大家有所帮助。