अभिलेखागार ऐसे प्रोग्राम हैं जो फाइलों में जानकारी को संपीड़ित कर सकते हैं। आधुनिक अभिलेखागार आपको कई फाइलों को एक संग्रह में संयोजित करने और ऐसे अभिलेखागार की सामग्री को देखने की अनुमति देते हैं। उनकी मदद से बनाए गए संग्रह का आकार मूल फ़ाइल के आकार से बहुत छोटा हो जाता है।
अनुदेश
चरण 1
अधिकांश अभिलेखागार के संचालन का सामान्य सिद्धांत एक एल्गोरिथ्म पर आधारित है जिसे पिछली शताब्दी के 80 के दशक में शोधकर्ताओं ए। लैम्पेल और जे। जिव द्वारा विकसित किया गया था। ज़िव और लैम्पेल द्वारा बनाया गया एल्गोरिदम आपको फ़ाइल में डुप्लिकेट कोड की गणना करने की अनुमति देता है और इस प्रकार इसका आकार कम करता है। इसके लिए डेटा अनुक्रमों से एक शब्दकोश संकलित किया जाता है। उदाहरण के लिए, फ़ाइल के बाइनरी कोड में निम्नलिखित संयोजन होता है: 10111011101110110011। यह देखना आसान है कि कोड 1011 इसमें कई बार दोहराया गया है। संग्रहकर्ता ऐसे कोड का पता लगाता है और इसे केवल एक बार संग्रह में लिखता है, और इसे अनज़िप करते समय, यह फ़ाइल में आवश्यक स्थानों में कोड को फिर से बदल देता है।
चरण दो
संग्रहकर्ता फ़ाइल को कितनी अच्छी तरह से संपीड़ित करेगा यह स्रोत शब्दकोश के आकार पर निर्भर करता है। यदि शब्दकोश बहुत बड़ा है, तो यह संग्रह के आकार को प्रभावित करेगा। यदि शब्दकोश का आकार बहुत छोटा है, तो बनाए गए संग्रह में त्रुटियाँ हो सकती हैं। आप एन्ट्रापी कोडिंग (तथाकथित हफ़मैन विधि) का उपयोग करके किसी फ़ाइल के संपीड़न अनुपात को बढ़ा सकते हैं। एन्ट्रापी कोडिंग के साथ, एक शोर्ट का उपयोग करके दोहराए जाने वाले बाइनरी भाग लिखे जाते हैं। आधुनिक अभिलेखागार में, एन्ट्रापी कोडिंग का उपयोग अतिरिक्त कोडिंग विधि के रूप में किया जाता है।
चरण 3
यूनिक्स सिस्टम पर, gzip सबसे लोकप्रिय संग्रहकर्ता है। यह संग्रहकर्ता डेटा को दोषरहित रूप से संपीड़ित करता है और डिफ्लेट एल्गोरिथम पर आधारित है। यहां फाइलों का संपीड़न दो दृष्टिकोणों में होता है - पहला, कोड के डुप्लिकेट टुकड़े बदल दिए जाते हैं, और फिर उनमें वर्णों को हफ़मैन पद्धति का उपयोग करके नए वर्णों से बदल दिया जाता है। यूनिक्स प्रणालियों के लिए अभिलेखागार के कई नुकसान हैं। वे मुख्य रूप से कई फाइलों से युक्त अभिलेखागार के उद्देश्य से हैं, इसलिए एक फ़ाइल को खोलना मुश्किल है। ऐसा इसलिए है क्योंकि यूनिक्स संग्रहकर्ता एक संग्रह को उसमें पैक की गई सभी फाइलों की एक सतत सरणी के रूप में देखते हैं। संग्रह प्रत्येक फ़ाइल में निहित जानकारी के आधार पर बनता है।
चरण 4
विंडोज सिस्टम पर, WinZip, 7-zip और WinRAR जैसे आर्काइव आम हैं। यूनिक्स प्रणालियों के विपरीत, ये अभिलेखागार व्यक्तिगत फाइलों के साथ और कई फाइलों से युक्त निरंतर अभिलेखागार के साथ काम करने पर केंद्रित हैं। अधिकांश आधुनिक विंडोज संग्रहकर्ता कई संग्रह प्रारूपों को "समझते हैं", एन्क्रिप्शन का समर्थन करते हैं और बहुत बड़ी फ़ाइलों को संपीड़ित करने में सक्षम हैं (उदाहरण के लिए, WinRAR संग्रहकर्ता के लिए अधिकतम फ़ाइल आकार आठ अरब गीगाबाइट से अधिक है)।