@Article{, title={Web Pages Retrieval by Using Proposed Focused Crawler}, author={Dunia Hamid Hameed and Soukaena Hassan Hashem}, journal={Al-Nahrain Journal of Science مجلة النهرين للعلوم}, volume={19}, number={2}, pages={154-164}, year={2016}, abstract={“Focused Crawler” is designed to visit a part of the web to collect documents that are related to only a particular topic. The objective of focused crawler is to identify good links that lead to target required documents, and to avoid branches that don't lead to the required topic. There is a number of motivations for designing focused crawler such as: fetching relevant data from the web with simplified data indexing, personalizing the human-computer interaction, making the system adaptive with each user, needing for a tool to change the searching strategy, keeping the freshness of the web pages and filtering the links to keep track focusing on the user’s preference. In this paper, we will explain two methods to retrieve web pages by using traditional crawler and proposed focused crawler. We make several experiments and it shows that proposed focused crawler is more efficient than traditional crawler in retrieving the desired web pages.

الزاحف المركز مصمم لاسترجاع جزء من الويب لجمع مستندات في موضوع واحد فقط و يهدف الى تعريف الروابط الجيدة التي تقود الى المستندات الهادفة و تجنب التفرعات التي لا تقود للموضوع المطلوب. يوجد عدة دوافع لتصميم الزاحف المركز مثل جلب البيانات ذات العلاقة من الويب وتبسيط فهرسة البيانات, جعل تفاعل المستخدم مع الحاسوب شخصيا و جعل النظام متكيف مع كل مستخدم و كذلك الحاجة الى اداة تغير ستراتيجية البحث لانه ينقح الروابط التي سيتم استرجاعها والحفاظ على حداثة صفحات الويب بالتكيف المستمر و ترشيح الروابط لاهمال الروابط غير المرغوب بها و الحفاظ على تركيز الزاحف بالاعتماد على تفضيل المستخدم. في هذا البحث سوف نشرح طرق لاسترجاع صفحات الويب باستخدام الزاحف التقليدي و الزاحف المركز المقترح. اجرينا العديد من التجارب و اوضحت ان الزاحف المركز المقترح اكثر كفاءة من الزاحف التقليدي في الاسترجاع.} }