极米投影仪
149.20M · 2026-03-22
这篇只讲本工具的核心 JavaScript:把“文本/文件”统一转换成字节序列,计算 MD5,再按用户选择的格式输出。
工具的主流程可以概括成四步:
Uint8Arrayhex / hex-space / base64 输出,并可选大写核心原因是:无论输入来自文本还是文件,最终都要落到“字节”这个中间态,才能保证行为一致。
parseInput(text, format)输入格式支持 text / base64 / hex / hex-space,解析函数的目标是:返回一个“要参与 MD5 的字节数组”。
TextEncoder 直接转 UTF-8 字节case 'text':
return new TextEncoder().encode(text)
这里把字符串编码为 UTF-8 字节,确保中文、Emoji 等多字节字符也能稳定计算。
atob 还原字节case 'base64': {
const binaryString = atob(text.replace(/s/g, ''))
const bytes = new Uint8Array(binaryString.length)
for (let i = 0; i < binaryString.length; i++) {
bytes[i] = binaryString.charCodeAt(i)
}
return bytes
}
关键点:Base64 输入会先清理空白字符,兼容多行粘贴;atob 的结果是“单字节字符串”,需要逐字节转为 Uint8Array。
case 'hex': {
const hex = text.replace(/s/g, '')
if (!/^[0-9a-fA-F]*$/.test(hex)) {
throw new Error('invalid hex')
}
const bytes = new Uint8Array(hex.length / 2)
for (let i = 0; i < hex.length; i += 2) {
bytes[i / 2] = parseInt(hex.substr(i, 2), 16)
}
return bytes
}
这段实现把十六进制视为“连续的字节流”,中间允许插入空格/换行;只要字符集不在 [0-9a-fA-F] 就直接判错。
case 'hex-space': {
const parts = text.trim().split(/s+/)
const bytesArray = new Uint8Array(parts.length)
for (let i = 0; i < parts.length; i++) {
if (!/^[0-9a-fA-F]{1,2}$/.test(parts[i])) {
throw new Error('invalid hex token')
}
bytesArray[i] = parseInt(parts[i], 16)
}
return bytesArray
}
这种格式适合处理“每个字节之间用空格分隔”的数据(例如抓包或调试输出)。每个 token 允许 1~2 位十六进制。
SparkMD5.ArrayBuffer工具用 spark-md5 做 MD5 计算。它的 ArrayBuffer 版本支持“追加数据”计算,既能处理文本输入,也能用于文件分片。
Uint8Array 直接参与计算const calculateMD5 = (bytes) => {
const spark = new SparkMD5.ArrayBuffer()
spark.append(bytes)
const hashHex = spark.end()
return hexToBytes(hashHex)
}
实现里会把最终的 hashHex 再转回字节数组,目的是把“输出格式化”统一为对字节数组操作(hex、base64 都能复用同一套逻辑)。
hexToBytesconst hexToBytes = (hex) => {
const bytes = new Uint8Array(hex.length / 2)
for (let i = 0; i < hex.length; i += 2) {
bytes[i / 2] = parseInt(hex.substr(i, 2), 16)
}
return bytes
}
MD5 的摘要是 16 字节(32 个十六进制字符),转换后就是固定长度的 Uint8Array(16)。
formatOutput(bytes, format)输出支持:
hex:连续 32 位十六进制hex-space:每个字节用空格分隔base64:对 16 字节摘要做 Base64const hexString = Array.from(bytes)
.map(b => b.toString(16).padStart(2, '0'))
.join('')
有了 hexString,hex 与 hex-space 都只是在展示层做不同分割。
hex 与大写开关case 'hex':
return uppercase.value ? hexString.toUpperCase() : hexString
hex-space:每两位插空格case 'hex-space': {
const hex = uppercase.value ? hexString.toUpperCase() : hexString
return hex.match(/.{2}/g).join(' ')
}
base64:字节转“单字节字符串”再 btoacase 'base64': {
const binaryString = String.fromCharCode.apply(null, bytes)
return btoa(binaryString)
}
这里的 Base64 输出是“对 MD5 摘要(16 字节)”编码后的结果。
文件模式的核心是:用 FileReader.readAsArrayBuffer 读取文件切片,并把每一片追加到同一个 SparkMD5.ArrayBuffer() 实例中。
const processFile = (file) => {
fileProgress.value = 0
const reader = new FileReader()
const chunkSize = 2 * 1024 * 1024
let offset = 0
const spark = new SparkMD5.ArrayBuffer()
const readNextChunk = () => {
const slice = file.slice(offset, offset + chunkSize)
reader.readAsArrayBuffer(slice)
}
reader.onload = (e) => {
const arrayBuffer = e.target.result
spark.append(arrayBuffer)
offset += arrayBuffer.byteLength
fileProgress.value = Math.round((offset / file.size) * 100)
if (offset < file.size) {
readNextChunk()
} else {
const hashHex = spark.end()
const hashBytes = hexToBytes(hashHex)
hashResult.value = formatOutput(hashBytes, outputFormat.value)
fileProgress.value = 0
}
}
reader.onerror = () => {
fileProgress.value = 0
}
readNextChunk()
}
这段逻辑只做三件事:
ArrayBuffersparkformatOutput 输出进度条的百分比来自 offset / file.size 的比例计算。
generateHash() 把两种模式收口工具的“生成”按钮只需要根据当前 tab 分流:
const generateHash = () => {
if (activeTab.value === 'file') {
if (!selectedFile) return
processFile(selectedFile)
return
}
if (!inputText.value) return
const bytes = parseInput(inputText.value, inputFormat.value)
const hashBytes = calculateMD5(bytes)
hashResult.value = formatOutput(hashBytes, outputFormat.value)
}
到这里,文本与文件的差异只剩下“如何拿到输入字节”,后续的 MD5 计算与输出格式化完全复用同一套函数。