最近做项目经常会遇到Java中的乱码问题,于是就抽时间整理下出现乱码问题的情况和如何处理,这里做了一个整理,
分析
编码与解码
编码就是将字符转为字节,解码就是就是将字节转换为字符。
字节流与字符流
对文件的读写操作都是通过字节流来实现的,即使JAVA中有字符流,但是其底层仍然使用的字节流。
乱码问题出现
java中使用最频繁的是字符,当我们将文件读入内存并在控制台显示时(字节流--->字符流),就需要用到解码。如果文件是UTF-8编码,而我们解码时错用成GBK(如果不指定编码,JAVA会采取系统默认编码)来解码,那么只能显示乱码。而我们写文件时,最好指定编码(UTF-8)。
解决方案
示例1
将字节流转换为字符流时,我们指定编码格式。这是我们文件也应该是gb2312编码
1
2
3
4
5
6
7
8
9
10
11
12
|
public static String read(String filename) throws Exception { InputStream is = new FileInputStream(filename); BufferedReader in = new BufferedReader( new InputStreamReader(is, "gb2312" )); //指定编码格式 String s; StringBuilder sb = new StringBuilder(); while ((s = in.readLine()) != null ) { sb.append(s + "\n" ); } in.close(); return sb.toString(); } |
示例2
直接通过字节流读入,使用String转换为字符时,指定编码。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
package com.dy.xidian; import java.io.FileInputStream; import java.io.InputStream; class BufferedInputFile { public static String read(String filename) throws Exception { @SuppressWarnings ( "resource" ) InputStream is = new FileInputStream(filename); byte [] b = new byte [ 1024 ]; is.read(b); return new String(b, "gb2312" ); } } public class MemoryInput { public static void main(String[] args) throws Exception { String filename = "E:/html/gb2312.php" ; String s = BufferedInputFile.read(filename); System.out.println(s); } } |
陷阱
I/O操作中有个FileReader类,这个类隐藏了字节流转为字符流的细节,我们可以这样使用。 BufferedReader in = new BufferedReader(new FileReader(filename)); 这样,我们直接得到就是字符流了。但我们发现,我们并没有去设置编码,这是因为FileReader中采用了默认编码方式。这就变得很危险了,如果其默认的编码格式和我们文件的编码不同,那么读出来的数据一定是乱码。所以我们最好采用示例中的方式来进行流的转换。
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!