练习_文件复制与使用字节流读取中文的问题

2022/7/9 23:22:29

编程Tag： 文件读取中文字节构造方法 LEN

本文主要是介绍练习_文件复制与使用字节流读取中文的问题，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

练习_文件复制

图片复制复制原理图解

　　
原理:从已有文件中读取字节,将该字节写出到另一个文件中

明确：
数据源：c:\a.jpg
数据目的地：d:\a.jpg

文件复制的步骤：

1.创建一个字节输入流对象，构造方法中绑定要读取的数据源
2.创建一个字节输出流对象，构造方法中绑定要写入的目的地
3.使用字节输入流对象中的方法read读取文件
4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中
5.释放资源

package DemoOutputStream;

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;

/*
   文件复制练习：一都一写

   明确：
        数据源：c.txt
        数据目的地：a.txt
   文件复制的步骤：
        1.创建一个字节输入流对象，构造方法中绑定要读取的数据源
        2.创建一个字节输出流对象，构造方法中绑定要写入的目的地
        3.使用字节输入流对象中的方法read读取文件
        4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中
        5.释放资源
            */
public class Demo01File {
       public static void main(String[] args) throws IOException {
           long s = System.currentTimeMillis();
         //  1.创建一个字节输入流对象，构造方法中绑定要读取的数据源
           FileInputStream fis = new FileInputStream("c.txt");
         //  2.创建一个字节输出流对象，构造方法中绑定要写入的目的地
           FileOutputStream fos = new FileOutputStream("a.txt");
           //一次读取一个字节写入一个字节的方式
         //  3.使用字节输入流对象中的方法read读取文件
         /*  int len = 0;
           while ((len=fis.read())!=-1 ){
            // 4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中
               fos.write(len);
           }*/

          //使用数组缓冲读取多个字节，写入多个字节
           byte[] bytes = new  byte[1024];
           //3.使用字节输入流对象中的方法read读取文件
           int len = 0;//每次读取的有效字节个数
           while ((len=fis.read(bytes))!=-1){
           // 4.使用字节输出流中的方法write,把读取到的字节写入到目的地的文件中
             fos.write(bytes,0,len);
           }
           //  5.释放资源(先关闭写的，后关闭读的；如果写完了，肯定读取完毕了）
           fos.close();
           fis.close();
           long e = System.currentTimeMillis();
           System.out.println("复制文件共耗时："+(e-s)+"毫秒");
       }
}

使用字节流读取中文的问题

多初学者在学到字节输入流时都有一个疑惑，当使用字节输入流（FileInputStream）读取数字字母时会正常读取，而读取中文数据时会出现中文乱码的情况，是不是读取中文数据非得使用字符输入流来读取呢？其实字节输入流一样是可以读取中文数据的。

看你使用的是什么开发工具，idea的话是默认使用utf-8编码的，使用eclipse的小伙伴需要手动改成utf-8，具体怎么改这里不介绍了。
首先应该明确两点：utf-8编码1个中文占3个字节，gbk编码1个中文占2个字节
所以当我们读取中文数据采用的是一次读取一个字节的方式，始终会报错，假如你的开发工具改的是gbk编码，那么每次读取到该中文字符的1/2个字节，utf-8的话每次读取到的是1/3个字节，所以读取中文数据不能采用该方式读取。只能使用每次读取一个字节数组的方式来读取
当我们使用记事本中存储汉字时默认是ANSI编码，其实就是GBK编码。如果开发工具已经改为了utf-8，读取中文数据要想不乱码，可以使用String类的一个构造方法
String(byte[] bytes, int offset, int length, Charset charset)
将charset改为gbk即可，下面看具体代码

package DemoOutputStream;

import java.io.FileInputStream;
import java.io.IOException;

public class FileInputStreamDemo06 {
    
    public static void main(String[] args) throws IOException {
        FileInputStream fis = new FileInputStream("G:\\XQ1.01\\网站原型\\WPS Office\\11.1.0.11365\\office6\\addons\\cef\\locales\\c.txt");
        int len;
        byte[] bytes = new byte[1024];
        while ((len = fis.read(bytes)) != -1) {
            System.out.print(new String(bytes, 0, len, "GBK"));
        }
        fis.close();
    }

}

因为gbk编码一个中文字符占用两个字节，所以这里定义一个长度为2的字节数组，当然也可以是2的整数倍