Fulltext

Text Files Compression using Combination of two Dictionary methods (Specific dictionary for specific language and LZ77 Approach)

ضغط ملفات النص بدمج طريقتين من طرق القاموس ( قاموس خاص للغة محددة مع LZ77)

أحمد حسين عليوي

Engineering and Technology Journal مجلة الهندسة والتكنولوجيا
ISSN: 16816900 24120758 Year: 2011 Volume: 29 Issue: 16 Pages: 664-671
Publisher: University of Technology الجامعة التكنولوجية

Abstract

In this paper we suggest combination between two dictionary methods. Specific dictionary (for specific language) and LZ77. The dictionary is used for replacing any word in it by its two Bytes index. A words not exists in the dictionary is written without changing preceded by four bits for length of this word. A modification was made on this approach for reducing the file to minimum size. Because of each wordwas replaced by two bytes (which are substituted in any appearance for this word in text), LZ77 can be used efficiently. Before this, the file is arranged specially in order to use LZ77 optimally for minimizing the data. This approach is tested on real text files and verifies it’s successful.

في هذا البحث اقتراح لدمج طريقتين من طرق القاموس وهما طريقة القاموس المتكامل للغة يستخدم القاموس للتعويض عن كل كلمة موجودة (معرفة) في القاموس العام للغة . LZ محددة و 77 والكلمات الغير موجودة في القاموس تبقى على حالها مع كتابة عدد (Two Bytes) معينة ببايتين من البتات قبلها للاشارة إلى طولها. قمنا بعدة تعديلات على هذه الطريقة للحصول على اقل حجمممكن للملف. كل كلمة يعوض عنها ببايتين وسوف يعوضان عن تلك الكلمة في أي مكان ترد فيه الكلمات عن الناحية العملية بقت على ) LZ هذه الكلمة ٠ فلذلك تم استخدام الطريقة الثانية 77 ترتيبها). قبل ذلك قمنا بترتيب الملف بطريقة خاصة استخدمناها بحيث نستطيع الاستفادة من طريقة لتقليل البيانات الى آفل حد ممكن. هذه الطريقة جريت على ملفات نصوص حقيقية وأثبتت (LZ77)نجاحها