مقالات في اللسانيات الحاسوبية

تحليل النصوص الطبيعية حاسوبيا

د. عبدالعزيز بن عبدالله المهيوبي

إنَّ أوَّل ظهور لنظم تحليل النصوص الطبيعية قد بدأ في بيئة محددة من الكلمات، وقد عملت بشكل فعّال للغاية، مما قاد الباحثين إلى التفاؤل الشديد، الذي تلاشى بسرعة عندما تم تطبيق أدوات التحليل على بيانات أكثر واقعية، حيث التعقيد والإبهام في اللغات التي يتداولها البشر. (العيدروس، 2007م، ص111). “ويتم التحليل بالانتقال من الكلمة العربية إلى جذرها الأصلي، أي أن الحاسوب يعالج الكلمات العربية المشكولة جزئياً أو كلّياً أو غير المشكولة، ويحدد نوعها وميزانها الصرفي، وسابقتها، ولاحقتها، وحالتها الإعرابية ودلالتها، فإذا احتوت الكلمة المراد تحليلها على حروف غير مشكولة، وضع الحاسوب الحركات الممكنة لها اعتماداً على إحصائيات تلاؤم الحركات مع الحروف تمهيداً لتحليلها، ومن المعلوم أن خلو الكلمة من الشكل يجعلها متعددة الأشكال، ومن ثمَّ المعاني، مادامت مستقلة عن سياق النص، فكلمة (ورد) -مثلاً- يمكن أن تكون لها الإمكانات التالية: ورد = فعل / ورد = حرف عطف + فعل / ورد = اسم.
إذن على الحاسوب أن يُعالج الكلمة عند تحليلها على أنها (فعل واسم وحرف) وأن يعطي جميع النتائج المحتملة لها، مع مراعاة الحالات التي تحدد نوعها، فالكلمة المنونة -مثلا- لا تكون إلا اسماً، وبعد ذلك يقوم الحاسوب باختيار الإمكانية المناسبة التي تتوافق مع سياق النص. (البوّاب والطيّان، 1996م)
تحليل الأفعال:
“يفترض الحاسوب أن الكلمة المدخلة إليه فعل، فيقوم بتحديد كل من سابقته، ولاحقته، ووزنه، وبنائه للمعلوم أو المجهول، وتجرده أو زيادته، وأصله المشتق منه، وحالته الإعرابية، والضمير المسند إليه، ودلالته. أي أنه يعطي وصفاً كاملاً عن حالة الفعل الصرفية والنحوية والدلالية مستقلة عن سياق النص.
تحليل الأسماء:
يفترض الحاسوب أن الكلمة المدخلة إليه هي اسم، فيحدد سابقته، ولاحقته، ووزنه، وأصله المشتق منه، وحالته الإعرابية، ونوعه من حيث الاشتقاق، والتذكير، والتأنيث، والإفراد، والتثنية، والجمع، والنسبة، والتصغير”. (البوّاب والطيّان، 1996م، ص123)
المعالجة الحاسوبية للصرف العربي:
تتبوأ المعالجة الآلية للصرف العربي مكانة متميزة في ميادين التعامل مع اللغة العربية على وفق منظور معلوماتي، وتُعد مدخلاً أساساً، وقاسماً مشتركاً لإدارة معظم نظمها الآلية التي تُعنى بإنشاء نظم المعلومات والمعارف. ويُقصد بالمعالجة الآلية للصرف العربي اعتماد نظم حوسبة متقدمة تستند إلى خوارزميات برمجية تستثمر المنطق الصرفي العربي في معالجة المفردة العربية، عن طريق استخلاص العناصر الأولية لبنية الكلمة، ومباشرة تحديد سماتها الصرفية، والصرف نحوية، والصرف دلالية، والقابلة للاستنباط من هذه البنية. وقد أفرزت جهود العلماء والباحثين في هذا المضمار ظهور مجموعة من النماذج المقترحة لمعالجة الصرف آلياً (مظفر، 2008م). وتنقسم المعالجة الحاسوبية للكلمة العربية إلى قسمين أساسيين هما:
1- التوليد: وهو الانتقال من الجذر إلى جميع الكلمات المشتقة منه؛ أي أنَّ الحاسوب يقوم بتوليد الأفعال، والأسماء المشتقة انطلاقاً من الجذر المدخل إليه، ويعتمد نظام توليد الكلمة على معجم حاسوبي ضمن قاعدة معطيات، وعلى القوانين الصرفية والنحوية لقواعد التوليد.
2- التحليل: يعتمد نظام التحليل الصرفي الآلي للكلمة على معجم حاسوبي ضمن قواعد معطيات، وعلى قوانين صرفية ونحوية، حيث يحتوى المعجم الحاسوبي على جذور الكلمات العربية الثلاثية والرباعية والخماسية، كما يحتوي على جميع الأفعال الثلاثية والرباعية المجردة والمزيدة، وجميع هذه الأفعال المخزنة في المعجم الحاسوبي سماعية. كما يشتمل المعجم الحاسوبي على المعارف المعجمية السماعية التي لا يطّرد فيها قياس، نحو أبواب تصريف الأفعال، وحروف التعدية، ومصادر الأفعال الثلاثية، والأسماء الجامدة، والصفات المشبهة …إلخ. أمّا ما يطّرد فيه القياس كالأسماء المشتقة، ومصادر الأفعال فوق الثلاثية…، فإن المعجم الحاسوبي خلو منها، لأن الحاسوب قادر على تحليلها وفق قواعد وخوارزميات محددة، ولا حاجة لأنْ تكون مخزنة في معجمه.
أمّا القوانين الصرفية والنحوية لقواعد التحليل فتشتمل على قواعد تصريف الأفعال والأسماء، كتوليد الصيغ الصرفية المختلفة للأفعال (المضارع من الماضي، والأمر من المضارع، والمجهول من المعلوم …إلخ) وإسناد الفعل إلى جميع الضمائر، كما تشتمل هذه القوانين على قواعد الإعلال والإبدال والإدغام ورسم الهمزة” (البوّاب والطيّان، 1996م، ص26)
علينا بذل الجهود الكبيرة في معالجة اللغة العربية آلياً لمواجهة التفجر المعلوماتي، لما تلعبه القوى الرمزية وعلى رأسها اللغة في صياغة شكل المجتمع الإنساني الحديث، لقد باتت اللغة في أمس الحاجة إلى منظور جديد يعيد النظر في جميع جوانب المنظومة اللغوية و”أصبحت الثقافة محور تكنولوجيا المعلومات، وبخاصة أن اللغة هي المنهل الطبيعي الذي تسقي منه هذه التكنولوجيا أسس ذكائها الاصطناعي والأفكار المحورية بلغات البرمجة. (القاسمي، 2005م)
ولا بدَّ من التنبيه هنا إلى أنَّ نجاح البرامج الآلية المعالجة للغة الطبيعية متوقف على بساطة النظرية اللسانية المتبنّاة، ومدى قدرتها على تحليل الظواهر اللسانية تحليلاً صحيحاً، وذلك من خلال الوصف الدقيق للتراكيب الواردة، والتعميم الكافي لتغطية كل الجمل السليمة أو المقبولة، وتوفير القيود والشروط الكافية لمنع تحليل الكلمات والجمل غير السليمة.
غير أنَّ جهود تطوير معالجة اللغة العربية آلياً تواجهها عدة مشكلات:
1- ضَعف الدعم المقدم للشركات، ومراكز البحث العلمي لتطوير برامج معالجة العربية حاسوبياً.
2- “بعثرة الجهود العربية، سواء على المستوى النظري أم التطبيقي؛ فكل باحث وكل منظمة تعمل بمعزل عن غيرها. إضافة على محدودية الدراسات في هذا المجال، فإنها تعاني من ضعف الانتشار، وانعدام التكامل والتعاون بينها، ولا تكاد تتجاوز الملتقيات والندوات” (الخطيب، 1998م، ص83).
3- افتقار معظم الحاسوبيين العاملين في حوسبة اللغة العربية إلى الحد الأدنى من المعرفة اللغوية؛ لذا ينبغي أن تتضافر جهود اللغويين والحاسوبيين في أي مشروع علمي يهدف إلى معالجة اللغة العربية آلياً.
4- الطابع التجاري الذي أصبح يحكم ضرورة الإنجاز الحاسوبي، وجعل من حصل اللسانيات الحاسوبية حقلاً تجارياً يخضع لسوق العرض والطلب.
فلا بدَّ أنْ تتضافر الأعمال في مجال اللسانيات الحاسوبية العربية، وتتآزر بين اللغويين والحاسوبيين في أي مشروع علمي يهدف إلى برمجة الأنظمة اللغوية للعربية، وتحليلها، ومعالجتها آلياً.
التحليل الصرفي الآلي للكلمة:
هو “عملية تعيين الخصائص الصرفية للكلمة؛ كجذر الكلمة، أو جذعها ووزنها، وتحديد الخصائص اللغوية لها؛ كنوع الكلمة (اسم أو فعل أو حرف) والتقسيمات الأخرى التي تندرج تحت هذه الأنواع الثلاثة، وتحديد العدد للكلمة (المفرد أو المثنى أو الجمع) والحالة الإعرابية (مرفوع أو منصوب أو مجرور أو مجزوم) وغيرها من الخصائص. كما يحدد المحلل الصرفي التركيب الداخلي للكلمة (الزوائد والسوابق واللواحق والجذر أو الجذع)” (صوالحة وإيرك، 2009م، ص2).
و”في عام 1985م أمكن تطوير أول معالج صرفي قادر على التعامل مع الأطوار المختلفة لمنظومة الكتابة العربية (المشكولة كلّيّاً أو جزئياً أو غير المشكولة) وبدأت بذلك مرحلة جادة لمعالجة اللغة العربية باستخدام الحاسب الآلي” (نبيل، 1988م، ص 181).

0 Reviews

Write a Review

مقالات ذات صلة

زر الذهاب إلى الأعلى