JavaScript实现base64编码/解码

关于base64编码的概念,你可以查看百度百科或维基百科,也可以参照一些网络上的博文,推荐:

Base64笔记
Base64编码原理与应用
一步到位 Base64 编码


编码基本规则

在计算机的世界中,一个字节是8bit(8位),Base64编码将每3个8位字节的数据转换为4个6位字节,然后6bit再在高2位加0,补齐8位数据。如果待编码的串(字符串或二进制串)最后剩下的串长度不足3个字节长,那么就用“0”来补充,输出字符就是“=”。由于base64编码表的大小为2^6=64,所以称为base64编码。

一个案例

待编码的数据:Tony
先将字符串转换为ascii:84 111 110 121
按照前面所说的规则,取每3个8位数据转换为4个6位数据,剩余不足3个的用0补齐,转换为二进制:01010100 01101111 01101110 01111001
每6位组成一组:010101 000110 111101 101110 011110 010000
每组补齐8位:00010101 00000110 00111101 00101110 00011110 00010000
转换为十进制:21 6 61 46 30 16
查表:V G 9 u e Q
补充后面两位的==,结果就是VG9ueQ==

JavaScript的实现

JavaScript提供了两个函数可以用于base64的编码和解码,分别是btoaatob
但是如果直接用于对中文的编码,那么就会出现错误了。btoa只能转换占一个字节宽度的字符,而汉字是被编码为占两个或以上字节的,所以它无法对中文进行编码。

为了解决这个问题,我们可以先将Unicode字符串转换为utf8编码:

function utf8tobase64(str) {
	return window.btoa(unescape(encodeURIComponent(str)));
}
function base64toutf8(str) {
	return decodeURIComponent(escape(window.atob(str)));
}

当然,也有其他的一些实现方式,比如github上的插件:base64-js

JavaScript: 详解Base64编码和解码
其中这里有一段很好的代码片段:

/**
*
*  Base64 encode / decode
*  http://www.webtoolkit.info/
*
**/
var Base64 = {

// private property
_keyStr : "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/=",

// public method for encoding
encode : function (input) {
    var output = "";
    var chr1, chr2, chr3, enc1, enc2, enc3, enc4;
    var i = 0;

    input = Base64._utf8_encode(input);

    while (i < input.length) {

        chr1 = input.charCodeAt(i++);
        chr2 = input.charCodeAt(i++);
        chr3 = input.charCodeAt(i++);

        enc1 = chr1 >> 2;
        enc2 = ((chr1 & 3) << 4) | (chr2 >> 4);
        enc3 = ((chr2 & 15) << 2) | (chr3 >> 6);
        enc4 = chr3 & 63;

        if (isNaN(chr2)) {
            enc3 = enc4 = 64;
        } else if (isNaN(chr3)) {
            enc4 = 64;
        }

        output = output +
        this._keyStr.charAt(enc1) + this._keyStr.charAt(enc2) +
        this._keyStr.charAt(enc3) + this._keyStr.charAt(enc4);

    }

    return output;
},

// public method for decoding
decode : function (input) {
    var output = "";
    var chr1, chr2, chr3;
    var enc1, enc2, enc3, enc4;
    var i = 0;

    input = input.replace(/[^A-Za-z0-9\+\/\=]/g, "");

    while (i < input.length) {

        enc1 = this._keyStr.indexOf(input.charAt(i++));
        enc2 = this._keyStr.indexOf(input.charAt(i++));
        enc3 = this._keyStr.indexOf(input.charAt(i++));
        enc4 = this._keyStr.indexOf(input.charAt(i++));

        chr1 = (enc1 << 2) | (enc2 >> 4);
        chr2 = ((enc2 & 15) << 4) | (enc3 >> 2);
        chr3 = ((enc3 & 3) << 6) | enc4;

        output = output + String.fromCharCode(chr1);

        if (enc3 != 64) {
            output = output + String.fromCharCode(chr2);
        }
        if (enc4 != 64) {
            output = output + String.fromCharCode(chr3);
        }

    }

    output = Base64._utf8_decode(output);

    return output;

},

// private method for UTF-8 encoding
_utf8_encode : function (string) {
    string = string.replace(/\r\n/g,"\n");
    var utftext = "";

    for (var n = 0; n < string.length; n++) {

        var c = string.charCodeAt(n);

        if (c < 128) {
            utftext += String.fromCharCode(c);
        }
        else if((c > 127) && (c < 2048)) {
            utftext += String.fromCharCode((c >> 6) | 192);
            utftext += String.fromCharCode((c & 63) | 128);
        }
        else {
            utftext += String.fromCharCode((c >> 12) | 224);
            utftext += String.fromCharCode(((c >> 6) & 63) | 128);
            utftext += String.fromCharCode((c & 63) | 128);
        }

    }

    return utftext;
},

// private method for UTF-8 decoding
_utf8_decode : function (utftext) {
    var string = "";
    var i = 0;
    var c = c1 = c2 = 0;

    while ( i < utftext.length ) {

        c = utftext.charCodeAt(i);

        if (c < 128) {
            string += String.fromCharCode(c);
            i++;
        }
        else if((c > 191) && (c < 224)) {
            c2 = utftext.charCodeAt(i+1);
            string += String.fromCharCode(((c & 31) << 6) | (c2 & 63));
            i += 2;
        }
        else {
            c2 = utftext.charCodeAt(i+1);
            c3 = utftext.charCodeAt(i+2);
            string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63));
            i += 3;
        }

    }

    return string;
}

}

stackoverflow上也有很多base64的干货:How can you encode a string to Base64 in JavaScript?




其他参考:
MDN - Base64的编码与解码