เพื่อรักษาข้อมูล คุณต้องทำให้เอาต์พุตมีขนาดใหญ่ขึ้น
จำนวนข้อมูลสูงสุดที่เราสามารถเก็บรักษาไว้ได้ทั้งหมด
สามารถทำได้โดย: เช่น ฟังก์ชันระบุตัวตน $h(m)=m$
เห็นได้ชัดว่าไม่มีการบีบอัดเลย
ทฤษฎีสารสนเทศสอนเราว่าเราไม่สามารถบีบอัดข้อมูลทั่วไปได้ ข้อมูลบางอย่างสามารถบีบอัดได้ด้วยฟังก์ชันบางอย่าง แต่ไม่มีฟังก์ชันใดที่สามารถบีบอัดข้อมูลทั้งหมดได้
หากคุณกำลังมองหาการบีบอัดแบบสูญเสียข้อมูล คุณต้องตัดสินใจว่าข้อมูลใดมีความสำคัญน้อยกว่า ซึ่งเป็นที่เข้าใจกันดีในภาพวิดีโอและเสียง แต่ไม่ใช่สำหรับข้อมูลทั่วไป
สำหรับข้อมูลทั่วไป หากคุณไม่สนใจว่าคุณจะสูญเสียอะไรไป คุณสามารถตัดทอนข้อความและเก็บรักษาข้อมูลบางส่วนได้ คุณจะไม่ได้อะไรดีไปกว่านี้จากเหตุผลทางทฤษฎีสารสนเทศ เอาต์พุตแฮช n บิตสามารถมีข้อมูลได้ไม่เกิน n บิต
หากคุณต้องการเก็บข้อมูลจำนวนมากเกี่ยวกับข้อความที่ไม่สุ่มของโครงสร้างที่ไม่รู้จัก ฟังก์ชันแฮชการเข้ารหัสนั้นดีมาก ใช้เช่น SHA3-256 กับข้อความบีบอัดโดยพลการและคุณมีแนวโน้มที่จะได้รับข้อมูลเกือบ 256 บิต
น่าเศร้า (โชคดี) ที่พบชุดข้อความที่เป็นไปได้ซึ่งสร้างแฮชหรือพูดอะไรที่น่าสนใจเกี่ยวกับพวกเขาอยู่นอกเหนือเรา