AL-Lisaniyyat
Volume 17, Numéro 2, Pages 18-31
2011-12-17

دور المكون الصرفي في بناء المعجم الالكتروني للغة العربية -قاعدة بيانات المصادر-

الكاتب : الحناش محمد . القاسمي رشيدة محمد .

الملخص

سيركز هذا البحث على دور الوزن والميزان الصرفيين في بناء المعجم الالكتروني للغة العربية، وكيف ان إغفال هذا المكون أو سوء تطبيقه أدى إلى ضعف الكثير من البرمجيات العربية، خاصة في بناء المحلل والمولد الصرفيين، وذلك على الرغم من الجهود الكبيرة التي أنفقت في حوسبت اللغة العربية. لهذا السبب لا نجد اليوم برامج حاسوبية عربية قادرة على إنجاز مهمة الترجمة الآلية بنسبة معقولة، أو قريبة من المعقولة، كما لا نجد برامج القراءة البصرية للمحارف العربية التي تفي بالغرض بشكل مريح، وغير هذه البرامج كثير، وما ذلك – في نظرنا – إلا لتقليل هذه البرمجيات من دور المكون الصرفي للغة الضاد. كما سيركز على الطبيعة الانصهارية للغة العربية، خلاف للغات الأوروبية التي توصف بكونها لغات إلصاقية، وسترصد انتظام هذا المكون في تشكل الكلمة توليدا وتحليلا، وقدرته على توزيع المرفيمات الصرفية داخل بنية الجذور العربية لتجعل منها مداخل معجمية تصبح قابلة للتصنيف الدلالي، والتأليف التركيبي، وتنوع التداولي. كما سنقوم بتعريف مفصل لمفهوم المعجم الالكتروني وتطبيقاته في اللغات الطبيعية، مع التركيز على الخصائص الصرفية (الخوارزمية) للغة العربية من وجهة نظر الهندسة اللسانية، وإبراز أهمية هذا المكون وضرورته لبناء المحلل التركيبي الآلي للغة العربية، إذ تبين لنا أنه يصعب تقدم في بناء باقي المحللات الآلية للغة العربية قبل الانتهاء من توصيف المكون الصرفي توصيفا هندسيا لسانيا. سنقترح نموذجا لسانيا حاسوبيا نطبقه على قاعدة بيانات المصادر العربية ( 250.000 مدخل صرفي مشفر)، لمعالجة هذا الوضع انطلاقا من المقاربة النظرية التي تجعل من الوزن الصرفي البنية العميقة للكلمة العربية، بينما تجعل من الميزان الصرفي بنيتها السطحية. سنختم البحث بتحليل إحصائيات جميع المداخل الصرفية المولدة صرفيا في اللغة العربية، وتشمل نحو 2.500.000 مدخل معجمي مولد من مجموع الجذور العربية المستخدمة فعليا ( 12.000 جذر )، بنحو 800 صيغة صرفية، موزعة على أقسام الكلم التالية: أسماء الذوات، أفعال، مصادر، مشتقات.

الكلمات المفتاحية

الوزن - المعجم الالكتروني - الغة العربية- الميزان الصرفي