TY - JOUR ID - TI - Increasing search engine's accuracy using links clustering زيادة دقة محركات البحث بعنقدة روابط الانترنيت AU - Ahmed bahaa-al deen abdul-wahab احمد بهاء الدين عبد الوهاب عباس PY - 2010 VL - IS - 14(2) SP - 51 EP - 69 JO - AL-MANSOUR JOURNAL مجلة المنصور SN - 18196489 AB - This study is devoted for searching free e-books problem because of itsimportance with spreading the e-libraries. When the web client asking for a freee-books the search engine returns selling e-books sites, this produce aconclusion of inaccuracy about this search engine. According to this case thisstudy suggest the philosophy of clustering a sample of web sites on thenumber of links which lead to the downloadable e-books and rank this siteshigher than the others with matching the entered keywords. Three clustershave been noticed (sites with high rank, sites with medium ranking, and lowranked sites).The proposed system (Ico.com) has been built form many components; thefirst is the web crawler which is a software Program for fetching data of webpages (like page address, subject, number of links…etc), the secondcomponent is the clustering program written using (VB6.0) language to clusterthe web pages databases according to the number of links to real existingdownloadable books, and the last component is the search engine interfacewhich is built using HTML and VB script under Active server pagestechnology. This work reached to increasing the search engine accuracy usingfactors like analyzing the number and the type of links by mining the web site’sdatabase to improve accuracy for search engines.

تخصصت الدراسة في مشكلة البحث عن الكتب الالكترونية المجانية تحديدا لما لها من اهمية مع تزايد المكتبات الالكترونية وذلك عند طلب الباحث عن الكتب المجانية تقوم محركات البحث باعادة مواقع بيع الكتب ضمن النتائج مما يعطي انطباع بعدم دقة او وثوقية محركات البحث هذه ، لذا قام العمل على فلسفة عنقدة عينة من مواقع الانترنيت المختلفة على اساس عدد الروابط الموجودة فيها فعلا و التي تقود الى كتب الكترونية و منحها رتبة اعلى من بقية المواقع مع الاخذ بنظر الاعتبار تشابه الكلمة المدخلة من مستخدم محرك البحث و على هذاالاساس تم استنتاج ثلاثة اصناف (مواقع ذات اسبقية عالية ، مواقع ذات اسبقية متوسطة ، مواقع ذات اسبقية قليلة). المنظومة المقترحة هي محرك البحث (Ico.com ) و تم بناءه من عده مكونات ،المكون الاول عنكبوت الويب (web crawler ( وهو برنامج لسحب المعلومات المتعلقة بصفحات الانترنت مثل( عنوان الصفحة ، موضوعها ، كلماتها المفتاحية و الروابط الموجودة فيها و عددها ... الخ ) و الجزء الاخر هو برنامج العنقدة لعنقدة قاعدة بيانات صفحات الانترنيت حسب اعداد الروابط و اخيرا واجهة محرك البحث بنيت بلغتيHTML و VB Script و بتقنية صفحات الخادم الفعالة (Active server pages ) . ان هذا العمل توصل الى امكانية زيادة دقة محركات البحث بالاعتماد على عناصر اخرى غير تطابق الكلمات مثل تحليل عدد ونوع الروابط بتحليل قواعد بيانات محركات البحث . ER -