ตัวเข้ารหัส/ถอดรหัส Base64
แปลงข้อความเป็นและจากการเข้ารหัส Base64
Base64 Encoder and Decoder
Introduction
Base64 เป็นโค้ดดิ้งแบบไบนารีเป็นข้อความที่แสดงข้อมูลไบนารีในรูปแบบสตริง ASCII ออกแบบมาเพื่อส่งข้อมูลที่เก็บในรูปแบบไบนารีผ่านช่องทางที่รองรับเนื้อหาข้อความได้อย่างเชื่อถือได้เท่านั้น การเข้ารหัส Base64 จะแปลงข้อมูลไบนารีให้เป็นชุดของ 64 ตัวอักษร (จึงเป็นชื่อ) ที่สามารถส่งผ่านโปรโตคอลที่เป็นข้อความได้อย่างปลอดภัยโดยไม่เกิดการเสียหายของข้อมูล
ชุดอักษร Base64 ประกอบด้วย:
- ตัวอักษรพิมพ์ใหญ่ A-Z (26 ตัวอักษร)
- ตัวอักษรพิมพ์เล็ก a-z (26 ตัวอักษร)
- หลัก 0-9 (10 ตัวอักษร)
- ตัวอักษรเพิ่มเติมอีกสองตัว ซึ่งมักจะเป็น "+" และ "/" (2 ตัวอักษร)
เครื่องมือนี้ช่วยให้คุณสามารถเข้ารหัสข้อความเป็นรูปแบบ Base64 หรือถอดรหัสสตริง Base64 กลับไปยังข้อความต้นฉบับได้อย่างง่ายดาย โดยเฉพาะอย่างยิ่งสำหรับนักพัฒนา มืออาชีพด้าน IT และผู้ที่ทำงานกับข้อมูลที่ต้องการส่งผ่านช่องทางที่เป็นข้อความอย่างปลอดภัย
วิธีการทำงานของการเข้ารหัส Base64
กระบวนการเข้ารหัส
การเข้ารหัส Base64 ทำงานโดยการแปลงกลุ่มของไบต์สามตัว (24 บิต) ของข้อมูลไบนารีเป็นสี่ตัวอักษร Base64 ขั้นตอนการทำงานมีดังนี้:
- แปลงข้อความที่ป้อนเป็นการแทนค่าไบนารี (ใช้การเข้ารหัส ASCII หรือ UTF-8)
- จัดกลุ่มข้อมูลไบนารีเป็นชิ้นส่วนขนาด 24 บิต (3 ไบต์)
- แยกแต่ละชิ้นส่วนขนาด 24 บิตออกเป็นสี่กลุ่มขนาด 6 บิต
- แปลงแต่ละกลุ่มขนาด 6 บิตเป็นตัวอักษร Base64 ที่สอดคล้องกัน
เมื่อความยาวของข้อมูลนำเข้าไม่สามารถหารด้วย 3 ได้ จะมีการเพิ่มการเติมด้วยตัวอักษร "=" เพื่อรักษาสัดส่วน 4:3 ของความยาวเอาต์พุตต่อความยาวนำเข้า
การแทนค่าทางคณิตศาสตร์
สำหรับลำดับของไบต์ ตัวอักษร Base64 ที่สอดคล้องกัน จะถูกคำนวณดังนี้:
โดยที่ แทนตัวอักษรที่ ในอักษร Base64
กระบวนการถอดรหัส
การถอดรหัส Base64 จะกลับกระบวนการเข้ารหัส:
- แปลงแต่ละตัวอักษร Base64 เป็นค่าขนาด 6 บิต
- เชื่อมต่อค่าขนาด 6 บิตเหล่านี้
- จัดกลุ่มบิตเป็นชิ้นส่วนขนาด 8 บิต (ไบต์)
- แปลงแต่ละไบต์เป็นตัวอักษรที่สอดคล้องกัน
การเติม
เมื่อจำนวนไบต์ที่ต้องการเข้ารหัสไม่สามารถหารด้วย 3 ได้ จะมีการเติมดังนี้:
- หากเหลือไบต์หนึ่ง จะถูกแปลงเป็นตัวอักษร Base64 สองตัวตามด้วย "=="
- หากเหลือไบต์สอง จะถูกแปลงเป็นตัวอักษร Base64 สามตัวตามด้วย "="
ตัวอย่าง
มาลองเข้ารหัสข้อความ "Hello" เป็น Base64 กัน:
- การแทนค่า ASCII ของ "Hello": 72 101 108 108 111
- การแทนค่าไบนารี: 01001000 01100101 01101100 01101100 01101111
- การจัดกลุ่มเป็นชิ้นส่วนขนาด 6 บิต: 010010 000110 010101 101100 011011 000110 1111
- ชิ้นส่วนสุดท้ายมีเพียง 4 บิต จึงเติมด้วยศูนย์: 010010 000110 010101 101100 011011 000110 111100
- การแปลงเป็นเลขฐานสิบ: 18, 6, 21, 44, 27, 6, 60
- การค้นหาในอักษร Base64: S, G, V, s, b, G, 8
- ผลลัพธ์คือ "SGVsbG8="
สังเกตการเติม "=" ที่ท้ายเพราะความยาวของข้อมูลนำเข้า (5 ไบต์) ไม่สามารถหารด้วย 3 ได้
สูตร
สูตรทั่วไปสำหรับการคำนวณความยาวของสตริงที่เข้ารหัส Base64 คือ:
โดยที่ แทนฟังก์ชันเพดาน (การปัดขึ้นไปยังจำนวนเต็มที่ใกล้ที่สุด)
กรณีการใช้งาน
การเข้ารหัส Base64 ใช้กันอย่างแพร่หลายในแอปพลิเคชันต่างๆ:
-
ไฟล์แนบในอีเมล: MIME (Multipurpose Internet Mail Extensions) ใช้ Base64 เพื่อเข้ารหัสไฟล์แนบไบนารีในอีเมล
-
Data URLs: ฝังภาพเล็กๆ ฟอนต์ หรือทรัพยากรอื่นๆ โดยตรงใน HTML, CSS หรือ JavaScript โดยใช้สคีม่า
data:
-
การสื่อสาร API: ส่งข้อมูลไบนารีอย่างปลอดภัยใน JSON payloads หรือรูปแบบ API ที่เป็นข้อความอื่นๆ
-
การจัดเก็บข้อมูลไบนารีในรูปแบบข้อความ: เมื่อข้อมูลไบนารีต้องการจัดเก็บใน XML, JSON หรือรูปแบบข้อความอื่นๆ
-
ระบบการตรวจสอบสิทธิ์: การตรวจสอบสิทธิ์พื้นฐานใน HTTP ใช้การเข้ารหัส Base64 (แม้ว่าไม่ใช่เพื่อความปลอดภัย แต่เพื่อการเข้ารหัส)
-
การเข้ารหัส: เป็นส่วนหนึ่งของโปรโตคอลและระบบการเข้ารหัสต่างๆ โดยมักใช้สำหรับการเข้ารหัสคีย์หรือใบรับรอง
-
ค่าในคุกกี้: การเข้ารหัสโครงสร้างข้อมูลที่ซับซ้อนเพื่อจัดเก็บในคุกกี้
ทางเลือก
แม้ว่า Base64 จะใช้กันอย่างแพร่หลาย แต่ก็มีทางเลือกอื่นๆ ที่อาจเหมาะสมกว่าในบางสถานการณ์:
-
URL-safe Base64: ตัวแปรที่ใช้ "-" และ "_" แทน "+" และ "/" เพื่อหลีกเลี่ยงปัญหาการเข้ารหัส URL เหมาะสำหรับข้อมูลที่จะรวมอยู่ใน URL
-
Base32: ใช้ชุดอักษร 32 ตัว ส่งผลให้เอาต์พุตยาวขึ้นแต่มีความอ่านง่ายและไม่ไวต่อการใช้ตัวพิมพ์ใหญ่พิมพ์เล็ก
-
การเข้ารหัส Hex: การแปลงเป็นเลขฐานสิบหกอย่างง่าย ซึ่งมีประสิทธิภาพน้อยกว่า (ทำให้ขนาดเพิ่มขึ้นเป็นสองเท่า) แต่เรียบง่ายและรองรับอย่างกว้างขวาง
-
การส่งข้อมูลไบนารี: สำหรับไฟล์ขนาดใหญ่หรือเมื่อประสิทธิภาพมีความสำคัญ การส่งข้อมูลไบนารีโดยตรงผ่านโปรโตคอลเช่น HTTP โดยมี header Content-Type ที่เหมาะสมจะดีกว่า
-
การบีบอัด + Base64: สำหรับข้อมูลข้อความขนาดใหญ่ การบีบอัดก่อนการเข้ารหัสสามารถลดการเพิ่มขนาดได้
-
การจัดรูปแบบ JSON/XML: สำหรับข้อมูลที่มีโครงสร้าง การใช้การจัดรูปแบบ JSON หรือ XML แบบเนทีฟอาจเหมาะสมกว่าการเข้ารหัส Base64
ประวัติ
การเข้ารหัส Base64 มีรากฐานมาจากการคอมพิวเตอร์และระบบการสื่อสารในช่วงแรกที่ข้อมูลไบนารีต้องถูกส่งผ่านช่องทางที่ออกแบบมาสำหรับข้อความ
การระบุอย่างเป็นทางการของ Base64 ถูกเผยแพร่ครั้งแรกในปี 1987 ใน RFC 989 ซึ่งกำหนด Privacy Enhanced Mail (PEM) ซึ่งต่อมาได้รับการปรับปรุงใน RFC 1421 (1993) และ RFC 2045 (1996, เป็นส่วนหนึ่งของ MIME)
คำว่า "Base64" มาจากการที่การเข้ารหัสใช้ตัวอักษร ASCII 64 ตัวเพื่อแทนข้อมูลไบนารี การเลือกใช้ 64 ตัวอักษรนี้เป็นการตั้งใจ เนื่องจาก 64 เป็นเลขยกกำลังของ 2 (2^6) ซึ่งทำให้การแปลงระหว่างไบนารีและ Base64 มีประสิทธิภาพ
ตลอดระยะเวลาหลายปี มีตัวแปรหลายตัวของ Base64 เกิดขึ้น:
- Standard Base64: ตามที่กำหนดใน RFC 4648 โดยใช้ A-Z, a-z, 0-9, +, / และ = สำหรับการเติม
- URL-safe Base64: ใช้ - และ _ แทน + และ / เพื่อหลีกเลี่ยงปัญหาการเข้ารหัส URL
- Filename-safe Base64: คล้ายกับ URL-safe ออกแบบมาเพื่อใช้ในชื่อไฟล์
- Modified Base64 สำหรับ IMAP: ใช้ในโปรโตคอล IMAP โดยมีชุดอักษรพิเศษที่แตกต่างกัน
แม้ว่าจะมีอายุมากกว่า 30 ปี แต่ Base64 ยังคงเป็นเครื่องมือพื้นฐานในคอมพิวเตอร์สมัยใหม่ โดยเฉพาะอย่างยิ่งกับการเพิ่มขึ้นของแอปพลิเคชันเว็บและ API ที่พึ่งพาฟอร์แมตข้อมูลที่เป็นข้อความอย่างหนัก เช่น JSON
ตัวอย่างโค้ด
นี่คือตัวอย่างการเข้ารหัสและถอดรหัส Base64 ในภาษาการเขียนโปรแกรมต่างๆ:
// JavaScript Base64 Encoding/Decoding
function encodeToBase64(text) {
return btoa(text);
}
function decodeFromBase64(base64String) {
try {
return atob(base64String);
} catch (e) {
throw new Error("Invalid Base64 string");
}
}
// Example usage
const originalText = "Hello, World!";
const encoded = encodeToBase64(originalText);
console.log("Encoded:", encoded); // SGVsbG8sIFdvcmxkIQ==
try {
const decoded = decodeFromBase64(encoded);
console.log("Decoded:", decoded); // Hello, World!
} catch (error) {
console.error(error.message);
}
กรณีขอบและข้อพิจารณา
เมื่อทำงานกับการเข้ารหัสและถอดรหัส Base64 ให้ระวังข้อพิจารณาที่สำคัญเหล่านี้:
-
อักขระ Unicode และ Non-ASCII: เมื่อเข้ารหัสข้อความที่มีอักขระที่ไม่ใช่ ASCII ให้แน่ใจว่ามีการเข้ารหัสตัวอักษรที่ถูกต้อง (โดยปกติคือ UTF-8) ก่อนการเข้ารหัส Base64
-
การเติม: Base64 มาตรฐานใช้การเติมด้วยตัวอักษร "=" เพื่อให้แน่ใจว่าความยาวเอาต์พุตเป็นหลายของ 4 บางการใช้งานอนุญาตให้ละเว้นการเติมซึ่งอาจทำให้เกิดปัญหาความเข้ากันได้
-
การตัดบรรทัด: การใช้งาน Base64 แบบดั้งเดิมจะใส่การตัดบรรทัด (โดยปกติทุกๆ 76 ตัวอักษร) เพื่อความอ่านง่าย แต่แอปพลิเคชันสมัยใหม่มักจะละเว้นสิ่งเหล่านี้
-
Base64 ที่ปลอดภัยสำหรับ URL: Base64 มาตรฐานใช้ตัวอักษร "+" และ "/" ซึ่งมีความหมายพิเศษใน URL สำหรับบริบทของ URL ให้ใช้ Base64 ที่ปลอดภัยสำหรับ URL ซึ่งจะเปลี่ยนเป็น "-" และ "_"
-
ช่องว่าง: เมื่อถอดรหัส บางการใช้งานจะอนุญาตให้ละเลยช่องว่าง ขณะที่บางการใช้งานต้องการข้อมูลที่ถูกต้อง
-
การเพิ่มขนาด: การเข้ารหัส Base64 จะเพิ่มขนาดข้อมูลประมาณ 33% (4 ไบต์เอาต์พุตสำหรับทุก 3 ไบต์นำเข้า)
-
ประสิทธิภาพ: การเข้ารหัส/ถอดรหัส Base64 อาจใช้ทรัพยากรมากสำหรับข้อมูลขนาดใหญ่ พิจารณาใช้วิธีการสตรีมสำหรับไฟล์ขนาดใหญ่