encoding - 为什么 Go 在 base64 编码中使用位操作?

标签 encoding go base64

Code 2是Go的base64.Encode。 此代码多次使用位运算。

例如,

val := uint(src[si+0])<<16 | uint(src[si+1])<<8 | uint(src[si+2])

还有,

val := uint(src[si+0])>>18&0x3F]

我不知道为什么这些位操作需要编码成base64。 这些位操作是什么意思?

代码:

func (enc *Encoding) Encode(dst, src []byte) {
    if len(src) == 0 {
        return
    }

    di, si := 0, 0
    n := (len(src) / 3) * 3
    for si < n {
        // Convert 3x 8bit source bytes into 4 bytes
        val := uint(src[si+0])<<16 | uint(src[si+1])<<8 | uint(src[si+2])

        dst[di+0] = enc.encode[val>>18&0x3F]
        dst[di+1] = enc.encode[val>>12&0x3F]
        dst[di+2] = enc.encode[val>>6&0x3F]
        dst[di+3] = enc.encode[val&0x3F]

        si += 3
        di += 4
    }

    remain := len(src) - si
    if remain == 0 {
        return
    }
    // Add the remaining small block
    val := uint(src[si+0]) << 16
    if remain == 2 {
        val |= uint(src[si+1]) << 8
    }

    dst[di+0] = enc.encode[val>>18&0x3F]
    dst[di+1] = enc.encode[val>>12&0x3F]

    switch remain {
    case 2:
        dst[di+2] = enc.encode[val>>6&0x3F]
        if enc.padChar != NoPadding {
            dst[di+3] = byte(enc.padChar)
        }
    case 1:
        if enc.padChar != NoPadding {
            dst[di+2] = byte(enc.padChar)
            dst[di+3] = byte(enc.padChar)
        }
    }
}

最佳答案

这是相同算法的注释 Javascript 实现:https://en.wikibooks.org/wiki/Algorithm_Implementation/Miscellaneous/Base64#Javascript

它告诉你这个循环:

  • 采用三个 ASCII 字符(8 位):src[si+0] , src[si+1]src[si+2]

  • 将它们合并为一个 24 位数字(即 val := uint(src[si+0])<<16 | uint(src[si+1])<<8 | uint(src[si+2]) )

  • 将此数字重新分成四个索引(6 位)以用于 base64 字符列表。 (val>>18&0x3F取前面计算的数字的第18位到第24位等)

您还可以阅读:https://en.wikipedia.org/wiki/Base64#Examples

关于encoding - 为什么 Go 在 base64 编码中使用位操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33592065/

相关文章:

sql - 像 python 风格一样获取行

interface - 内存布局意味着 []T 不能转换为 Go 中的 []interface?

java - 如何从图像转换为短字符串?

oracle - Oracle中base64binary的输入

HTML5 Canvas 图像如何保存为 SVG 或 base 64 格式?

c++ - 在 C++ 中编码希伯来语数据

通过编辑pom在Maven项目中编码Java文件

perl - 为什么 perl 不能显示所有类型的 UTF8 字符

go - 了解go复合文字

mysql - 如何更改 mysql 设置,以便它是所有内容的默认 UTF-8?