TY - JOUR ID - TI - CONSTRUCTION OF AUTOMATED SYSTEM FOR INFORMATION EXTRACTION AND TEXT CATEGORIZATION AU - Abdul Kareem M. Radhi PY - 2008 VL - 11 IS - 3 SP - 156 EP - 174 JO - Al-Nahrain Journal of Science مجلة النهرين للعلوم SN - 26635453 26635461 AB - This paper presents a research on the field of AI via studying machine learning for natural language understanding. One important part of the process of understanding a text consists on apprehending its underlying interrelations of concepts [1]. Learning is to gain knowledge or understanding or skill in by study instruction or experience and modification of behavioral tendency by experience. We might say, very broadly that a machine learns when it changes its structure, or program, or data (based on its inputs or in response to external information) in such a manner that its expected future performance improves.The proposed system aims to extracts concepts from text written in English natural language text. In spite of the complexity of English language the proposed system offer intelligent user interactive interface that create structured query and complete the concepts relations before extracting the desired information from one or a lot of documents in specific domain in the form of templates consist a number of slots using inductive logic programming (ILP).

يتناول هذا البحث دراسة أحد حقول الذكاء الاصطناعي من خلال دراسة كيفية تعلم الماكينة لفهمها للغة الطبيعية. إن أهم جزء في عملية فهم أي نص يأتي من خلال أدراك المفاهيم الموجودة داخل ذلك النص وفهم العلاقات فيما بين تلك المفاهيم. إن التعلم هواكتساب المعرفة أو فهمها أو اكتساب المهارات من خلال دراسة الأيعازات و المهارات أو الخبرة وتغيير السلوك من خلال اكتساب تلك الخبرة. و بشكل عام يمكن القول بأن الماكينة قد تعلمت,عندمـا يتغير تركيب أو مسار البرامج متى ما تغيرت مدخلاتهــا أو من خلال الاستجابة لتغير البيانات الداخلة أليها من المصدر الخارجي وبحيث يمكن توقع تغير من كفاءتها مستقبلا". يهدف النظام المقترح إلى بناء نموذجين : الأول يسعى الى استخلاص المفاهيم من نص مكتوب باللغة الإنكليزية والثاني : يهدف الى بناء مصنف لتصنيف مجموعة من الوثائق أو النصوص.وعلى الرغم من صعوبة اللغة الطبيعية الإنكليزية ER -