okio分析

okio分析Okio是一个对原有的java.io和java.nio进行改进的IO库,使IO操作更加高效和方便。Okio的高效主要体现在三个方面:一它对数据进行了分块处理,这样在大数据IO的时候可以以块为单位进行IO,这可以提高IO的吞吐率。二它对这些数据块使用链表进行管理,这可以仅通过移动“指针”就进行数据的管理,而不用真正去处理数据,而且对扩容来说也十分方便。三对闲置的块进行管理,通过一个块池(Se

大家好,又见面了,我是你们的朋友全栈君。

Okio是一个对原有的java.iojava.nio进行改进的IO库,使IO操作更加高效和方便。Okio的高效主要体现在三个方面:

  • 一它对数据进行了分块处理,这样在大数据IO的时候可以以块为单位进行IO,这可以提高IO的吞吐率。
  • 二它对这些数据块使用链表进行管理,这可以仅通过移动“指针”就进行数据的管理,而不用真正去处理数据,而且对扩容来说也十分方便。
  • 三对闲置的块进行管理,通过一个块池(SegmentPool)的管理,避免系统GC和申请byte时的zero-fill。
    其他的还有一些小细节上的优化,比如如果你把一个UTF-8的String转为ByteString,ByteString会保留一份对原来String的引用,这样当你下次
    需要decode这个String时,程序通过保留的引用直接返回对应的String,从而避免了转码过程。

Okio的方便主要体现在,它对数据的读取写入进行了封装,调用者可以十分方便的进行各种值(string,short,int,hex,utf-8,base64等等)的转化,还有一点就是它为所有的Source和Sink提供了超时操作,这在Java原生的IO里是没有的。

Okio几个基础的类和接口:

  • 类Segment
    一个Segment相当于一个数据块(由一个byte数组构成),一般存在于一个双向循环队列(也就是buffer)或单链表(也就是SegmentPool)中,通过pop()和push(Segment segment)方法可以Segment进行入队和出队操作。Segment部分重要字段如下:
     
     
     
1
2
3
4
5
     
     
     
int SIZE:Segment大小, 2kb
int pos:指向下一个可读的 byte
int limit:指向下一个可写的 byte
Segment next:相当于链表的指针,指向下一个Segment
Segment prev:相当于链表的指针,指向上一个Segment
  • 类SegmentPool
    一个Segment池,由一个单向链表构成。该池负责Segment的回收和闲置Segment的管理,一般Segment都是从该池获取的。该池是线程安全的。
  • 接口Sink,BufferedSink
    Sink和java.io中的OutputStream类似,BufferedSink是一个对Sink进行扩展的接口。使用OutputStream时,在传输不同的数据是需要对OutputStream进行不同的包装,比如用DataOutputStream进行原始数据的IO,用BufferedOutputStream进行带缓存的数据IO,用OutputStreamWriter进行字符编码。对于Sink来说,只需要使用BufferedSink就可以实现以上所有的情况。
  • 接口Source和BufferedSource
    Source和java.io中的InputStream类似,BufferedSource是一个对Source进行扩展的接口。使用InputStream时,在传输不同的数据是需要对InputStream进行不同的包装,比如用DataInputStream进行原始数据的IO,用BufferedInputStream进行带缓存的数据IO,用OutputStreamReader进行字符编码。对于Source来说,只需要使用BufferedSource就可以实现以上所有的情况。

    java.io是由于使用了装饰者模式,才导致了不同的Stream操作需要一层包一层,而Okio没有在这里没有使用装饰者模式,也就不会出现一大堆类的情况。

  • 类Buffer
    Buffer是一个不固定大小的byte序列(由一个节点为Segment的双向循环队列链表构成),它充当Sink、Source、InputStream和OutputStream间的高效缓存区,由于Buffer实现了BufferedSource和BufferedSink这两个接口,所以可以很方便的对其进行IO操作。Buffer在多线程编程里很有用,比如一个负责网络的线程可以通过这种方式和工作线程进行数据交换,但是又不发生数据的复制。
  • 类ByteString
    ByteString是一个固定大小的byte序列(由一个byte数组构成)。String是Java经常使用到的一个基本类型,ByteString对String进行了封装,为byte和String间的转换和String不同值间的转换(UTF-8编解码,Hex编解码,Base64编解码,ASCIll编解码)提供了十分方便的操作。
  • 类AsyncTimeout
    AsyncTimeout为所有的Source和Sink提供了超时功能,Java原生的IO并没有超时功能,而AsyncTimeout填补了这点。AsyncTimeout的实现原理是:AsyncTimeout相当于一个节点,每个节点都带有tiemout信息,程序维护一条由AsyncTimeout节点组成优先队列链表(剩余超时时间越小的排越前),然后通过后台的一个守护线程,不断的去轮询这条链表,如果对应节点超时就调用Interrupted进行中断,否则调用wait进行等待。

Okio高效在哪里

  1. 前面说过Okio之所以高效是因为在底层的数据结构上,它维护了一个由Segment构成的链表循环队列,一个Segment相当于一个数据块。这样的好处很明显。因为在一块数据块的进行IO的过程中是没有中断的,相比于每次只读一个byte,单位时间内IO的数据量当然更高。那是不是Segment越大越好?当然不是。因为Segment内数据的IO还是以byte为单位的,如果Segment过大的话,数据就不能很好的进行分块。想象下把数据只分为一个大的Segment,那每次IO不就是以byte为单位了吗?那一个Segment的大小为多少比较合适,在我看来,最好和计算机中的一个页面大小一致。
  2. 另一方面,由于使用了链表,这使得数据的管理十分高效,因为只要移动指针就可以进行数据的移动。SegmentPool是Segment组成的单向链表,负责Segment的回收和闲置Segment的维护。
    我们可以看看SegmentPool是如何维护闲置Segment的,SegmentPool提供了两个方法,take()用于获取一个闲置Segment,recycle(Segment segment)用于回收一个Segment。
     
     
     
1
2
3
4
5
6
7
8
9
10
11
12
13
     
     
     
Segment take() {
synchronized ( this) {
if (next != null) {
Segment result = next;
next = result.next;
result.next = null;
byteCount -= Segment.SIZE;
return result;
}
}
return new Segment(); // Pool is empty. Don't zero-fill while holding a lock.
}

由于SegmentPool的next指向Pool中闲置的Segment,所以直接返回next指向的Segment就可以了,当没有闲置的Segment是就新建一个返回。

     
     
     
1
2
3
4
5
6
7
8
9
10
     
     
     
void recycle(Segment segment) {
if (segment.next != null || segment.prev != null) throw new IllegalArgumentException();
synchronized ( this) {
if (byteCount + Segment.SIZE > MAX_SIZE) return; // Pool is full.
byteCount += Segment.SIZE;
segment.next = next;
segment.pos = segment.limit = 0;
next = segment;
}
}

在Pool不满的情况下,recycle只要将对应的segment插入到单向链表的头部(也就是next指向segment的前面)就相当于回收了该segment。

okio的高效主要体现在Buffer中,所以我们可以看看Buffer的实现。由于每个Segment里都有pos和limit两个下标,这和Java NIO里的Buffer有点像,只要通过对pos和limit进行操作,我们就可以判断当前Segment是否写满(limit==SIZE)、是否读完(pos==limit),这就提高了IO的效率了。再看看readFrom()writeTo()方法都是尽量以块大小进行IO的。而且为了进行减少调用系统申请内存产生的消耗,Buffer使用了SegmentPool进行Segment的回收和申请。

Okio方便在哪里

  1. Okio之所以方便主要体现在它对许多常用的操作进行了封装,主要体现在BufferedSink和BufferedSource接口为调用者提供了丰富的方法,想基本数据(short,int,long,string)的IO还有Sink和Source之间的转换等,它都提供了相应的方法;另一方面,Okio创建了一个新的数据类型ByteString,ByteString对String进行了封装,为byte和String间的转换和String不同值间的转换(UTF-8编解码,Hex编解码,Base64编解码,ASCIll编解码,大小端转换)提供了十分方便的操作,具体可以查看其相应的方法。
  2. Okio通过AsyncTimeout所有的Source和Sink提供了超时操作。
    Timeout是AsyncTimeout的基类,想看看Timeout实现了什么?Timeout对原本的概念进行可扩展,它有两个属性,Timeouts和Deadlines。
    • Timeouts:代表一个时间段,表示等待一个操作执行完毕的最长时间。Timeouts一般用来检测类似网络中断等问题。
    • Deadlines:代表一个时间点,表示一个job(包含多个操作)最长执行到某个时间点。Deadlines可以为一个job设定它的执行时间上限,比如一个对电池电量敏感的APP为了节省电池消耗,也许会在APP content的预加载上设置Deadlines。
      AsyncTimeout的主要字段有:
     
     
     
1
2
3
     
     
     
private static AsyncTimeout head:私有静态变量head,用来当单链表的头
private AsyncTimeout next:指向下一个AsyncTiemout的节点
private long timeoutAt:根据timeout计算出的timeout时间点

要实现对应Source和Sink的Timeout管理只需要管理这条AsyncTimeout优先队列链表就可以了。添加Timeout对应入队(scheduleTimeout方法),取消超时对应出队(cancelScheduledTimeout方法)。守护线程Watchdog,会不断的去轮询这条链表,如果对应节点超时就调用Interrupted进行中断,否则调用wait进行等待。

Okio中的其他类:

  • RealBufferedSinkRealBufferedSource,不带缓存的Sink和Source,实现方式是在每次write或read之后都调用emitCompleteSegments()方法(emitCompleteSegments()方法会将Buffer中的数据flush掉)。
  • ForwardingSinkForwardingSource,将调用委托给其他Sink或Source的抽象类,在子类化的时候有用。比如当需要实现一个匿名Sink或Source时,就可以用这个。
  • GzipSinkGzipSource,实现了Gzip的Sink和Source。
  • DeflaterSinkInflaterSource,实现了ZLIB压缩和解压的Sink和Source,在DeflaterSink这个类中,由于每次调用flush()程序都会对整个Buffer进行同步压缩,所以官方建议只在程序有必要时才主动去调用flush(),否则频繁的调用flush()会引起性能上的问题。
  • 从上面这些类看出,我们完全可以对Sink和Source进行扩展,以实现一些针对不同compression或encryption的Sink和Source,比如可以编写针对H264的H264EnCodeSink和H264DeCodeSource。
转载:http://www.baitouwei.com/2015/01/08/okio/

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136803.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • whl文件下载「建议收藏」

    whl文件下载「建议收藏」到哪找.whl文件?http://www.lfd.uci.edu/~gohlke/pythonlibs/转载于:https://www.cnblogs.com/lhuser/p/8084734.html

    2022年5月7日
    93
  • android swiperefreshlayout 自定义,SwipeRefreshLayout 的使用详解

    android swiperefreshlayout 自定义,SwipeRefreshLayout 的使用详解SwipeRefreshLayout作为谷歌官方推荐的下拉刷新控件,同时简单而又不失优雅的风格,让许多app都使用了这一控件,今天记录下SwipeRefreshLayout在项目中的实际运用。首先,我们在布局文件中使用:android:id=”@+id/swipeRefreshLayout”android:layout_width=”match_parent”android:layout_heig…

    2022年6月25日
    24
  • H5+个推实现消息推送服务

    H5+个推实现消息推送服务网上看了几篇教程都是比较老的版本了,根据前人的智慧,然后自己摸索了下,简单几步实现了在手机上推送自定义的消息。首先,在个注册个账号,开发阶段使用个人注册即可,个推注册地址注册完进入配置页面,对应用进行配置,框中的几个地方要特别注意注册时会要求填一个包名,这个就是H5中对应的包名,一定要对应起来,否则收不到推送消息。或者查看应用的标识一定要和下面的标识对应起来,这样才能接收到信息。…

    2022年5月29日
    51
  • centos7.4安装docker_docker打包python应用

    centos7.4安装docker_docker打包python应用前言当我们在一台电脑上搭建了python3.6的环境,下次换台电脑,又得重新搭建一次,设置环境变量等操作。好不容易安装好,一会提示pip不是内部或外部命令,一会又提示pip:commandno

    2022年8月6日
    5
  • java进销存ERP管理系统源码[通俗易懂]

    java进销存ERP管理系统源码[通俗易懂]java进销存ERP管理系统源码基于SpringBoot框架进销存源码+财务ERP源码+数据库技术框架核心框架:SpringBoot2.0.0持久层框架:Mybatis1.3.2日志管理:Log4j2.10.0JS框架:Jquery1.8.0UI框架:EasyUI1.3.5模板框架:AdminLTE2.4.0项目管理框架:Maven3.2.3开发环境IDE:IntelliJIDEA2017+eclipseDB:Mysql5.7.4JDK:JDK1.8

    2022年5月6日
    42
  • 第九章:java 并发容器类了解与使用「建议收藏」

    第九章:java 并发容器类了解与使用「建议收藏」第九章:java 并发容器类了解与使用

    2022年4月23日
    31

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号