Java字节流和字符流及IO流的总结

从接收输入值说起

在日常的开发应用中,有时候需要直接接收外部设备如键盘等的输入值,而对于这种数据的接收方式,我们一般有三种方法:字节流读取,字符流读取,Scanner 工具类读取。

字节流读取

直接看一个例子:

public class Demo01SystemIn {
    public static void main(String[] args) throws IOException {
        int a = System.in.read();
        System.out.println(a);
        char c = 'a';
        System.out.println((int) c);
    }
}

运行程序之后,会被 read 方法阻塞,这时候在控制台输入一个字符 a,那么上面的程序两句话都会输出 97,这个没问题,因为小写字母 a 对应的就是 97,那么假如我们输入一个中文会出现什么结果呢?

把上面示例中的 a 修改为 中,然后运行程序,在控制台同样输入 中,则会得到 228 和 20013,这就说明我们控制台输入的 中 并没有全部读取,原因就是 read 只能读取 1 个字节,为了进一步验证结论,我们将上面的例子进行改写:

public class Demo01SystemIn {
    public static void main(String[] args) throws IOException {
        char a = (char) System.in.read();//读取一个字节
        System.out.println(a);
        char c = '中';
        System.out.println(c);
    }
}

运行之后得到如下结果:

可以看到,第一个输出乱码了,因为 System.in.read() 一次只能读取一个字节,而中文在 utf-8 编码下占用了 3 个字节。正因为 read 方法一次只能读取一个字节,所以其范围只能在 -1~255 之间,-1 表示已经读取到了结尾。

那么如果想要完整的读取中文应该怎么办呢?

字符流读取

我们先看下面一个例子:

public class Demo01SystemIn {
    public static void main(String[] args) throws IOException {
        InputStreamReader inputStreamReader1 = new InputStreamReader(System.in);
        int b = inputStreamReader1.read();//只能读一个字符
        System.out.println(b);

        InputStreamReader inputStreamReader2 = new InputStreamReader(System.in);
        char[] chars = new char[2];
        int c = inputStreamReader2.read(chars);//读入到指定char数组,返回当前读取到的字符数
        System.out.println("读取的字符数为:" + c);
        System.out.println(chars[0]);
        System.out.println(chars[1]);
    }
}

运行之后,输出结果如下所示:

这个时候我们已经能完成的读取到一个字符了,当然,有时候为了优化,我们需要使用 BufferedReader 进行进一步的包装:

BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(System.in));

这种方式虽然解决了读取中文会乱码问题,但是使用起来也不是很方便,所以一般读取键盘输入信息我们都会采用 Scnner 来读取。

Scanner 读取

Scanner 实际上还是对 System.in 进行了封装,并提供了一系列方法来读取不同的字符类型,比如 nextInt,nextFloat,以及 next 等。

public class Demo02Scnner {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
        while (scanner.hasNextInt()){
            System.out.println(scanner.nextInt());
        }
    }
}

什么是 IO 流

流是一种抽象概念,它代表了数据的无结构化传输(摘自百度百科)。IO 流对应的就是 InPut 和 Output,也就是输入和输出。输入和输出这个概念是针对于应用程序而言,比如当前程序中需要读取文件中的内容,那么这就是输入,而如果需要将应用程序本身的数据发送到其他应用,就对应了输出。

字节流和字符流

根据流的处理方式又可以将流可以分为两种类型:字节流和字符流。

字节流

字节流读取的基本单位为字节,采用的是 ASCII 编码,通常用来处理二进制数据,其顶层抽象类为 InputStream 和 OutputStream,比如上面示例中的 System.in 实际上就是获取到了一个 InputStream 类。

Java 中的流家族非常庞大,提供了非常多的具有不同功能的流,在实际应用中我们可以选择不同的组合达到目的。

字节输入流

下图为字节输入流家族关系示意图:

从上图可以看出这些结构非常清晰,首先是一个最顶层的接口,其次就是一些不同功能的基础流,比如我们最常用的 FileInputStream 就是用来读取文件的,这其中有一个 FilterInputStream 流,这个流主要是用来扩展基础流功能,其本身只是简单的覆盖了父类 InputStream 中的所有方法,并没有做什么特殊处理,真正的功能扩展需要依赖于其众多的子类,比如最常用的 BufferedInputStream 提供了数据的缓冲,从而提升读取流的效率,而 DataInputStream 是可以用来处理二进制数据等等。

通过这些众多不同功能的流来组合,可以灵活的读取我们需要的数据。比如当我们需要读取一个二进制文件,那么就需要使用 DataInputStream,而 DataInputStream 本身不具备直接读取文件内容的功能,所以需要结合 FileInputStream:

FileInputStream fin = new FileInputStream("E:\\test.txt");
DataInputStream din = new DataInputStream(fin);
System.out.println(din.readInt());

同时,如果我们想要使用缓冲机制,又可以进一步组装 BufferedInputStream:

FileInputStream fin = new FileInputStream("E:\\test.txt");
DataInputStream din = new DataInputStream(new BufferedInputStream(fin));
System.out.println(din.readInt());

还有一种流比较有意思,那就是 PushbackInputStream,这个流可以将读出来的数据重新推回到流中:

public class Demo03 {
    public static void main(String[] args) throws IOException {
        FileInputStream fin = new FileInputStream("E:\\test.txt");//文档内存储 abcd
        PushbackInputStream pin = new PushbackInputStream(new BufferedInputStream(fin));

        int a = pin.read();//读取到a
        System.out.println(a);
        if (a != 'b'){
            pin.unread(a);//将 a 推回流中
        }
        System.out.println(pin.read());//再次读取到 a
        System.out.println(pin.read());//读取到 b
        System.out.println(pin.read());// 读取到 c
    }
}

字节输出流

下图为字节输出流家族关系示意图:

这个结构和输入流的结构基本类似,同样的我们也可以通过组合来实现不同的输出。

比如普通的输出文件,可以使用 FileOutputStream 流:

FileOutputStream fout = new FileOutputStream("E:\\test2.txt");
fout.write(1);
fout.write(2);

如果想要输出二进制格式,那么就可以组合 DataOutputStream 流:

FileOutputStream fout = new FileOutputStream("E:\\test2.txt");
DataOutputStream dout = new DataOutputStream(fout);
dout.write(9);
dout.write(10);

缓冲流的原理

IO 操作是一个比较耗时的操作,而字节流的 read 方法一次只能返回一个字节,那么当我们需要读取多个字节时就会出现每次读取都要进行一次 IO 操作,而缓冲流内部定义了一个大小为 8192 的 byte 数组,当我们使用了缓冲流时,读取数据的时候则会一次性最多读取 8192 个字节放到内存,然后一个个依次返回,这样就大大减少了 IO 次数;同样的,写数据时,缓冲流会将数据先写到内存,当我们写完需要写的数据时再一次性刷新到指定位置,如磁盘等。

字符流

字符流读取的基本单位为字符,采用的是 Unicode 编码,其 read 方法返回的是一个 Unicode 码元(0~65535)。

字符流通常用来处理文本数据,其顶层抽象类为 Reader 和 Write,比如文中最开始的示例中的 InputStreamReader 就是继承自 Reader 类。

字符输入流

下图为字符输入流家族关系示意图:

上图可以看出,除顶层 Reader 类之外,字符流也提供了一些基本的字符流来处理文本数据,比如我们需要从文本读取内容:

public class Demo05Reader {
    public static void main(String[] args) throws Exception {
        //字节流
        FileInputStream fin = new FileInputStream("E:\\test.txt");//文本内容为“双子孤狼”
        System.out.println(fin.read());//372
        //字符流
        InputStreamReader ir = new InputStreamReader(new FileInputStream("E:\\test.txt"));//文本内容为“双子孤狼”
        System.out.println(ir.read());//21452
        char s = '双';
        System.out.println((int)s);//21452
    }
}

输出之后可以很明显看出区别,字节流一次读入一个字节,而字符流一次读入一个字符。

当然,我们也可以采用自由组合的方式来更灵活的进行字符读取,比如我们结合 BufferedReader 来读取一整行数据:

public class Demo05Reader {
    public static void main(String[] args) throws Exception {
        InputStreamReader ir = new InputStreamReader(new FileInputStream("E:\\test.txt"));//文本内容为“双子孤狼”
        BufferedReader br = new BufferedReader(ir);
        String s;
        while (null != (s = br.readLine())){
            System.out.println(s);//输出双子孤狼
        }
    }
}

字符输出流

下图为字符输出流家族关系示意图:

文本输出,我们用的最多的就是 PrintWriter,这个类我想绝大部分朋友都使用过:

public class Demo06Writer {
    public static void main(String[] args) throws Exception{
        PrintWriter printWriter = new PrintWriter("E:\\test3.txt");
        printWriter.write("双子孤狼");
        printWriter.flush();
    }
}

这里和字节流的区别就是写完之后需要手动调用 flush 方法,否则数据就会丢失,并不会写到文件中。

为什么字符流需要 flush,而字节流不需要

字节流不需要 flush 操作是因为字节流直接操作的是字节,中途不需要做任何转换,所以直接就可以操作文件,而字符流,说到底,其底层还是字节流,但是字符流帮我们将字节转换成了字符,这个转换需要依赖字符表,所以就需要在字符和字节完成转换之后通过 flush 操作刷到磁盘中。

需要注意的是,字节输出流最顶层类 OutputStream 中也提供了 flush 方法,但是它是一个空的方法,如果有子类有需要,也可以实现 flush 方法。

RandomAccessFile

RandomAccessFile 是一个随机访问文件类,其可以在文件中的任意位置查找或者写入数据。

public class Demo07RandomAccessFile {
    public static void main(String[] args) throws Exception {
        //文档内容为 lonely wolf
        RandomAccessFile inOut = new RandomAccessFile(new File("E:\\test.txt"),"rw");
        System.out.println("当前指针在:" + inOut.getFilePointer());//默认在0
        System.out.println((char) inOut.read());//读到 l
        System.out.println("当前指针在:" + inOut.getFilePointer());
        inOut.seek(7L);//指针跳转到7的位置
        System.out.println((char) inOut.read());//读到 w
        inOut.seek(7);//跳回到 7
        inOut.write(new byte[]{'c','h','i','n','a'});//写入 china,此时 wolf被覆盖
        inOut.seek(7);//继续跳回到 7
        System.out.println((char) inOut.read());//此时因为 wolf 被 china覆盖,所以读到 c
    }
}

根据上面的示例中的输出结果,可以看到 RandomAccessFile 类可以随机指定指针,并随机进行读写,功能非常强大。

另外需要说明的是,构造 RandomAccessFile 时需要传入一个模式,模式主要有 4 种:

  • r:只读模式。此时调用任何 write 相关方法,会抛出 IOException。
  • rw:读写模式。支持读写,如果文件不存在,则会创建。
  • rws:读写模式。每当进行写操作,会将内容或者元数据同步刷新到磁盘。
  • rwd:读写模式。每当进行写操作时,会将变动的内容用同步刷新到磁盘。

以上就是Java字节流和字符流及IO流的总结的详细内容,更多关于Java字节流和字符流的资料请关注我们其它相关文章!

(0)

相关推荐

  • 25行Java代码将普通图片转换为字符画图片和文本的实现

    本文主要介绍了25行Java代码将普通图片转换为字符画图片和文本的实现,分享给大家,具体如下: 原图 生成字符画文本(像素转换字符显示后,打开字符画显示相当于原图的好几倍大,不要用记事本打开,建议用notepad++等软件打开) 生成字符画图片(背景颜色和画笔颜色代码里可设置调节) 新建普通java 项目,Java单类实现代码,复制到java项目中,用idea编辑器 主方法运行.(引入的Class 都是JDK中自有的) import javax.imageio.ImageIO; import j

  • Java 生成带Logo和文字的二维码

    ZXing 是一个开放源码的,用Java实现的多种格式的1D/2D条码图像处理库,它包含了联系到其他语言的端口.Zxing 可以实现使用手机的内置的摄像头完成条形码的扫描及解码.本章讲解用 ZXing 生成和扫码二维码. 依赖 在Java项目中pom.xml加入: <dependency> <groupId>com.google.zxing</groupId> <artifactId>core</artifactId> <version&g

  • java实现简单注册选择所在城市

    本文实例为大家分享了java实现简单注册选择所在城市的全部代码,供大家参考,具体内容如下 1.activity_main.xml <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:tools="http://schemas.androi

  • java实战之猜字小游戏

    一.题目描述 二.思路 语法基础:StringBuilder 类似列表,可以更改元素. package Practice; public class tt { public static void main(String[] args) { String str = "banana"; System.out.println(str.indexOf('z')); // -1 System.out.println(str.indexOf('a', 2)); // 3 StringBuild

  • 详解java中String值为空字符串与null的判断方法

    Java空字符串与null的区别 1.类型 null表示的是一个对象的值,而不是一个字符串.例如声明一个对象的引用,String a=null. ""表示的是一个空字符串,也就是说它的长度为0.例如声明一个字符串String s="". 2.内存分配 String a=null:表示声明一个字符串对象的引用,但指向为null,也就是说还没有指向任何的内存空间. String s="":表示声明一个字符串类型的引用,其值为""空

  • Java人民币小写转大写字符串的实现

    写了一个人民币小写转大写的方法,Java版本,思路很简单,没有测出什么Bug,有bug欢迎反馈 public class RMBChange { private static String[] nums = {"零", "壹", "贰", "叁", "肆", "伍", "陆", "柒", "捌", "玖"};

  • Java利用Request请求如何获取IP地址对应的省份、城市详解

    前言 最近的一个项目中需要将不同省份的用户,展示不同内容,所以需要通过Request请求获取IP地址, 然后通过IP获取IP对应省份. 这里的操作步骤一共有步: 1. 通过Request获取IP 2. 通过IP获取对应省份.城市 3. 通过设置的省份和IP对应省份进行比对,展示内容 通过Request获取IP 可以参考我的另外一篇文章[Java 通过Request请求获取IP地址]下面是代码: public class IpAdrressUtil { /** * 获取Ip地址 * @param

  • Java使用Tesseract-Ocr识别数字

    前言 Tesseract-Ocr是我在编写爬虫项目中,用来识别图片(不是验证码)的本地解决方案(因为客户不想使用API识别,太贵),识别率目前达到了100%,可以说是相当了得,当然了,这取决于使用的traineddata. 简介 Tesseract最初是在1985年至1994年间在Hewlett-Packard Laboratories Bristol和Greeley Colorado的Hewlett-Packard Co开发的,1996年进行了一些更改,移植到Windows,并且随着C++在1

  • Java实战之城市多音字处理

    一.需求 对城市名称转化为拼音的时候,当遇到多音字城市的时候,转化拼音就不是我们想要的了. 使用  pinyin4j 无法直接解决这个问题. .网上有很多维护多音字信息的,觉得麻烦. 如: 长沙 ====>"zhangsha" 厦门===>"shamen" 重庆===>"zhongqing" 二.导入 jpinyin 版本自选 <!-- https://mvnrepository.com/artifact/com.gith

  • java实现遗传算法实例分享(打印城市信息)

    复制代码 代码如下: import java.util.*;public class Tsp {      private String cityName[]={"北京","上海","天津","重庆","哈尔滨","长春","沈阳","呼和浩特","石家庄","太原","济南","

随机推荐