关于I/O读写文件的问题,一直是一头雾水啊
,今天早上起来就是找关于I/O方面操作和字符集、
编码、解码问题的讨论帖。
题外话:各种的转载、
ctrl+c ctrl+v 。。。。 你们懂的
代码编写、运行环境:eclipse 3.7 ,JDK 6UP23, win7 旗舰版。 editor encoding:utf8
文件 txt格式,保存格式为默认ansi。有中文有英文引用
中文测试
英文测试
hello world work;
static void IoRead_Write(String inputFile, String outputFile) {
try {
BufferedReader bufferedReader = new BufferedReader(new FileReader(new File(inputFile)));
BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter(new File(outputFile)));
String line = bufferedReader.readLine();
while (null != line || "".equals(line)) {
bufferedWriter.write(line+"\r\n");
System.out.println(line);
line = bufferedReader.readLine();
}
bufferedReader.close();
bufferedWriter.close();
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
当使用 eclipse 使用UTF-8作为workspace的字符集时,
system.out.print时候是乱码,输出的文件也是乱码,而文件的格式是UTF-8,而使用gbk作为eclipse的workspace字符集时,控制台输出的是正常文字(无乱码)。查看文件编码是默认字符集(ASNI).
试了几次之后,俺这个小白认为,在读取文件(中文)时,以字节流读入
内存中,在控制台打印时是使用IDE(editor)的encoding来进行转码,而在写文件也是使用ide的encoding来处理的,创建文件时也是使用当前IDE的encoding来做文件的字符集。而在双击打开时,系统使用ASNI来解码,所以造成了乱码。
小弟愚见,有什么不对的地方请各位拍砖指教。