关于Java下奇怪的Base64详解

下面这一段代码中会报错。

package jiangbo.java.lang;

import java.io.IOException;
import java.nio.charset.Charset;

import javax.xml.bind.DatatypeConverter;

import sun.misc.BASE64Decoder;
import sun.misc.BASE64Encoder;

public class Base64Demo {

  public static void main(String[] args) throws IOException {

    String name = "jiangbo";
    Charset utf8 = Charset.forName("UTF-8");

    BASE64Encoder base64Encoder = new sun.misc.BASE64Encoder();

    String BASE64EncoderString = base64Encoder.encode(name.getBytes(utf8));
    System.out.println(BASE64EncoderString);

    BASE64Decoder base64Decoder = new sun.misc.BASE64Decoder();
    byte[] decodeBuffer = base64Decoder.decodeBuffer(BASE64EncoderString);
    System.out.println(new String(decodeBuffer, utf8));

    String base64String = DatatypeConverter.printBase64Binary(name.getBytes(utf8));
    System.out.println(base64String);

    byte[] base64Binary = DatatypeConverter.parseBase64Binary(base64String);
    System.out.println(new String(base64Binary, utf8));
  }
}

接下来我们分别查看一些这两个代码,我们发现 BASE64Encoder().encode 在进行base64编码的时候进行了换行,换行符的ascii编码对应的是 0x0a ,所以刚好命中这个报错。

sun.misc.BASE64Decoder

代码实现如下,进行分别拆解。

public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException {
  int var4 = 0;
  PushbackInputStream var5 = new PushbackInputStream(var1);
  this.decodeBufferPrefix(var5, var2);

  while(true) {
    try {
      int var6 = this.decodeLinePrefix(var5, var2);

      int var3;
      for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {
        this.decodeAtom(var5, var2, this.bytesPerAtom());
        var4 += this.bytesPerAtom();
      }

      if (var3 + this.bytesPerAtom() == var6) {
        this.decodeAtom(var5, var2, this.bytesPerAtom());
        var4 += this.bytesPerAtom();
      } else {
        this.decodeAtom(var5, var2, var6 - var3);
        var4 += var6 - var3;
      }

      this.decodeLineSuffix(var5, var2);
    } catch (CEStreamExhausted var8) {
      this.decodeBufferSuffix(var5, var2);
      return;
    }
  }
}

首先 decodeLinePrefix 返回的是 bytesPerLine 定义的长度72。

public void decodeBuffer(InputStream var1, OutputStream var2) throws IOException {
  int var4 = 0;
  PushbackInputStream var5 = new PushbackInputStream(var1);
  this.decodeBufferPrefix(var5, var2);

  while(true) {
    try {
      int var6 = this.decodeLinePrefix(var5, var2);

protected int decodeLinePrefix(PushbackInputStream var1, OutputStream var2) throws IOException {
    return this.bytesPerLine();
  }

  protected int bytesPerLine() {
    return 72;
  }

紧接着调用 decodeAtom 进行处理,其中 bytesPerAtom 定义的数值是4。

      int var3;
      for(var3 = 0; var3 + this.bytesPerAtom() < var6; var3 += this.bytesPerAtom()) {
        this.decodeAtom(var5, var2, this.bytesPerAtom());
        var4 += this.bytesPerAtom();
      }

protected int bytesPerAtom() {
  return 4;
}

我们看看 decodeAtom 进行处理,先看看 readFully 方法。

protected void decodeAtom(PushbackInputStream var1, OutputStream var2, int var3) throws IOException {
  byte var5 = -1;
  byte var6 = -1;
  byte var7 = -1;
  byte var8 = -1;
  if (var3 < 2) {
    throw new CEFormatException("BASE64Decoder: Not enough bytes for an atom.");
  } else {
    int var4;
    do {
      var4 = var1.read();
      if (var4 == -1) {
        throw new CEStreamExhausted();
      }
    } while(var4 == 10 || var4 == 13);

    this.decode_buffer[0] = (byte)var4;
    var4 = this.readFully(var1, this.decode_buffer, 1, var3 - 1);

readFully 当中,4个字节为一个单位组合,经过处理之后,结果是 [89,87,70,104]

89,87,70,104,61

接着会继续循环,那我们知道,这玩意吗会按照4个字节为一个list去处理,前四个数据处理完之后,接下来的list是[61,,,],也就是说在readFully循环处理的过程中,返回结果是-1

当返回结果是-1的时候会进入 CEStreamExhausted 进行处理。

if (var4 == -1) {
  throw new CEStreamExhausted();

处理经过返回null,也就是说在这个异常里面是不会报错退出的。

那我们继续看看,假设我们把后面字节补齐,变成

89,87,70,104,61,61,61,61

可以看到经过处理之后变成[61,61,61,61]

0x61在ascii编码里面代表 = ,进入到case 2进行处理。

89,87,70,104,61,61,61,61

实际可以看到 decode 处理数据是[97,97,97,-1]

java.util.base64.decode

我们在看看 java.util.base64.decode 这个decode词法解析器,在这里面会进行两种base64判断。

private int decode0(byte[] src, int sp, int sl, byte[] dst) {
  int[] base64 = isURL ? fromBase64URL : fromBase64;
  int dp = 0;
  int bits = 0;
  int shiftto = 18;    // pos of first byte of 4-byte atom
  while (sp < sl) {
    int b = src[sp++] & 0xff;
    if ((b = base64[b]) < 0) {
      if (b == -2) {     // padding byte '='
        // =   shiftto==18 unnecessary padding
        // x=  shiftto==12 a dangling single x
        // x   to be handled together with non-padding case
        // xx=  shiftto==6&&sp==sl missing last =
        // xx=y shiftto==6 last is not =
        if (shiftto == 6 && (sp == sl || src[sp++] != '=') ||
          shiftto == 18) {
          throw new IllegalArgumentException(
            "Input byte array has wrong 4-byte ending unit");
        }
        break;
      }
      if (isMIME)  // skip if for rfc2045
        continue;
      else
        throw new IllegalArgumentException(
          "Illegal base64 character " +
          Integer.toString(src[sp - 1], 16));
    }

一种是判断 YWFh= 中最后的 = ,也就是说 [89,87,70,104,61] 这个list经过运算之后如果是 = ,就会进行下面判断,不符合规则就会报错 Input byte array has wrong 4-byte ending unit

而下面 isMIME 判断是来自 Decoder.RFC4648 ,默认是 false 。

public static byte[] decode(byte[] src) {
  return src.length == 0 ? src : Base64.getDecoder().decode(src);
}
public static Decoder getDecoder() {
   return Decoder.RFC4648;
}
  static final Decoder RFC4648     = new Decoder(false, false);
  static final Decoder RFC4648_URLSAFE = new Decoder(true, false);
  static final Decoder RFC2045     = new Decoder(false, true);

结语

简单做个总结,也就是说用 sun.misc.BASE64Decoder 这个方法做 base64 解码的时候,针对 base64 的兼容性更高,你在base64的字符串后面无论加多少个 = 都没关系,但是在例如 java.util.base64.decode 这类型严格按照 base64 规范的进行解码的方法下,就会出现报错。

那有啥用呢,比如在一些base64编码环境下,可能检测用的是 java.util.base64.decode 方法,实际后面业务解码用的是 sun.misc.BASE64Decoder 这样在前后不一致的情况下,会出现绕过的问题。

到此这篇关于Java下奇怪的Base64的文章就介绍到这了,更多相关Java奇怪的Base64内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • JS实现对中文字符串进行utf-8的Base64编码的方法(使其与Java编码相同)

    本文实例讲述了JS实现对中文字符串进行utf-8的Base64编码的方法.分享给大家供大家参考,具体如下: 要进行编码的字符串:"select 用户名 from 用户" 使用JAVA进行编码,Java程序: String sql = "select 用户名 from 用户"; String encodeStr = new String(Base64.encode(sql.getBytes("UTF-8"))); // 编码 System.out.

  • Java 处理图片与base64 编码的相互转换的示例

    今天项目优化了一下上传头像的功能.采用 imagecropper 插件完成裁剪图片的效果. 这个插件裁剪完的图片都是 base64 加密的字符串,上传头像也就涉及到了如何把加密的字符串转换成图片的问题. 以下是代码: /** * @Description: 将base64编码字符串转换为图片 * @Author: * @CreateTime: * @param imgStr base64编码字符串 * @param path 图片路径-具体到文件 * @return */ public stat

  • Java实现图片与Base64编码互转

    淘宝里面的html用base64转换图片,不知道为什么,不过看起来好像很美好,话不多说,直接上代码: import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream; import sun.misc.BASE64Decoder; import sun.misc.BA

  • Java JDK1.7对字符串的BASE64编码解码方法

    如下所示: package cn.itcast; import java.io.IOException; import java.io.UnsupportedEncodingException; import org.junit.Test; import sun.misc.BASE64Decoder; /* * @author soto * BASE64编码 解码 * */ public class Demo1 { @Test public void fun1() throws IOExcept

  • java使用Base64编码实例

    本文实例为大家分享了java使用Base64编码的具体代码,供大家参考,具体内容如下 Test Base64 package com.weiwen.provider.utils; import java.io.IOException; import com.alibaba.fastjson.JSON; import lombok.extern.slf4j.Slf4j; import org.junit.Test; import sun.misc.BASE64Encoder; import sun

  • Java处理图片实现base64编码转换

    前言 环境:使用这个代码前:请确保你的JDk是JAVA8及其以上 开发测试地址:http://imgbase64.duoshitong.com/ 可以查看是否执行成功 注意事项 一般插件返回的base64编码的字符串都是有一个前缀的."data:image/jpeg;base64," 解码之前这个得去掉. Code MainTest /** * 示例 * @throws UnsupportedEncodingException * @throws FileNotFoundExcepti

  • Java实现base64图片编码数据转换为本地图片的方法

    本文实例讲述了Java实现base64图片编码数据转换为本地图片的方法.分享给大家供大家参考,具体如下: 项目中用到的把base64图片数据转为本地图片的函数 /** * 替换html中的base64图片数据为实际图片 * @param html * @param fileRoot 本地路径 * @param serRoot 服务器路径 * @return */ public static String replaceBase64Image(String html,String fileRoot

  • java自定义实现base64编码转换

    1.base64编码转换 所谓base64编码,即按照规则把字符转化为"ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"这个字符集中的字符.具体规则如下: a.把每3个字节为一组,共24bit.每6bit一小组,每组前面加00,变为32bit.这样3个字节被扩展成了4个节,按照上面字符集编码. b.如果字节数不足3: 1)当字节数为2时,共16bit.每6bit一小组,最后一组即只有4bit,则不止前面加

  • Java实现BASE64编码和解码的方法

    BASE64和其他相似的编码算法通常用于转换二进制数据为文本数据,其目的是为了简化存储或传输.更具体地说,BASE64算法主要用于转换二进制数据为ASCII字符串格式.Java语言提供了一个非常好的BASE64算法的实现,.本文将简要地讲述怎样使用BASE64以及它是怎样工作的. Base64的作用:主要不是加密,它主要的用途是把一些二进制数转成普通字符用于网络传输.由于一些二进制字符在传输协议中属于控制字符,不能直接传送需要转换一下就可以了. 第一种方式: 通过反射使用java 中不对外公开的

  • Java Base64位编码与String字符串的相互转换,Base64与Bitmap的相互转换实例代码

    首先是网上大神给的类 package com.duanlian.daimengmusic.utils; public final class Base64Util { private static final int BASELENGTH = 128; private static final int LOOKUPLENGTH = 64; private static final int TWENTYFOURBITGROUP = 24; private static final int EIGH

随机推荐