إشكاليات حوسبة النظام الصرفي في العربية
د. عبدالعزيز بن عبدالله المهيوبي
1- اقتصار كتب الصرف على الوصف دون التوصيف:
فكُتب الصرف العربي تقف عند الوصف فحسب، “وتُعوِّلُ على حدس المتعلم أو فهمه، ولا تتغلغل في التوصيف إلى بيان الأدلة التي تُفَسِّر الواهم أو خطأ المتعلم”[1]، يضاف إلى ذلك أن كتب الصرف العربية تكتفي بشرح عامٍّ للقواعد مقرونة ببعض الأمثلة عن حالات الاطّراد والشذوذ”[2]، ممّا يؤدي إلى عدم توافر القواعد اللازمة، التي يستطيع الحاسوب أن يتعامل معها.
يقولُ الصرفيون -مثلاً-: يُصاغ الفعل المضارع من الماضي بزيادة حرف من حروف المضارعة في أوله، وتسكين فاء الفعل، أمّا عين الفعل فتكون مفتوحة أو مضمومة أو مكسورة حسب باب تصريفه، ويمكن أن يتصل بلام الفعل ضمير رفع أو نصب أو كلاهما. فالحاسوب لا يملك القدرة بالاعتماد على الوصف التقليدي السابق أن يقوم بصياغة الفعل المضارع.
من هنا نحن بحاجة إلى صياغة قواعد تصريف الأفعال في صورة تُمَكِّنُ الحاسوب من معالجتها؛ وذلك من خلال تصنيف جميع قواعد تصريف الأفعال المجردة، ومزيداتها إلى أصناف وأقسام، تعتمد نهجا يقوم على التصريف العملي، وبصورة أكثر تحديداً على تصريف الفعل في الأزمنة كافة، وإسناده إلى الضمائر كافة، وتصريفه بصورة كاملة في المعلوم والمجهول. كما في الجدول التالي:
الضمير | المضارع المرفوع | المضارع المنصوب | المضارع المجزوم |
أَنَا | أَفْعُلُ | أَفْعُلَ | أَفْعُلْ |
نَحْنُ | نَفْعُلُ | نَفْعُلَ | نَفْعُلْ |
أَنْتَ | تَفْعُلُ | تَفْعُلَ | تَفْعُلْ |
أَنْتِ | تَفْعُلِيْنَ | تَفْعُلِي | |
أَنْتُمَا | تَفْعُلانِ | تَفْعُلا | |
أَنْتُم | تَفْعُلُوْنَ | تَفْعُلُوا | |
أَنْتُنَّ | تَفْعُلْنَ |
ومن ثَمَّ يمكننا صياغة الفعل المضارع من الفعل الثلاثي (ضَرَبَ) على النحو التالي:
الفعل= مض+حض+ح1+ر1+ح2+ر2+ح3+ر3+ضر+ضن
فـ(مض) تعني حرف المضارعة (ء،ن،ي،ت). و(حض) تعني حركة حرف المضارعة، وهي الضمة للثلاثي المزيد بحرف أو الرباعي المجرد، والفتحة لما سوى ذلك. و(ح1، ح2، ح3) تشير إلى فاء الفعل وعينه ولامه على الترتيب. و(ر1) تشير إلى حركة فاء الفعل، وهي السكون. و(ر2) تشير إلى حركة عين الفعل حسب بابه التصريفي. و(ر3) تشير إلى حركة لام الفعل حسب حالته الإعرابية. و(ضر) تشير إلى ضمير الرفع المتصل -إن وُجد- وهو (ا،و،ي،ن). و(ضن) تشير إلى ضمير النصب المتصل -إن وُجد- وهو (ي، نا، ك، هـ). ينطبق هذا القانون على الأفعال الثلاثية السالمة عموماً، أما الأنواع الأخرى كالمضعف والمعتل والمهموز، فيلزم إجراء معالجة إضافية تتعلق بالإدغام، وحذف حرف العلة، ورسم الهمزة.
ولا يعني ذلك أنّ علماء اللغة القدماء لم يُدركوا الجانب المنطقيّ في اللغة، فالتراث النحْوي تأسّس على منطق خاص باللغة، فقد استنبط علماء اللغة الحقائق والقواعد،[3] إلا أنَّ هذه القواعد غير كافية للتعامل العلميّ مع الظاهرة اللغوية، فهي بحاجة إلى أن نعيد تنظيمها بدقةٍ، ونصوغها على هيئة قضايا منطقية، لتتوافق والمعالجة الآلية، آخذين في الاعتبار أنَّ مُعالجة نصوص اللغة العربية بالحاسوب لا تتحقق إلا بتضافر عدةِ مُستوياتٍ: “فهناك المعالجة الصرفيّة، والنحوية، والدلالية، والمعجمية، وغيرها، فينبغي أن تبنى هذه المُعالجة على قواعد واضحة ومحدودة، فالحاسوب لا يتعامل إلاّ مع الدقيق والمضبوط والمكتمل[4]“. وفي هذا المجال بدأت اللغة العربيّة تخطو خُطوات جيدة الهدف منها وضع اللغة في مكان مُتقدّم بين اللغات العالميّة وهذا الأمر لن يتحقّق دونَ طرق أبواب هذا العلم الحديث، فجاءت الجهود جادّة والمقاربات اللغوية الحاسوبيّة تتزايد يوماً بعدَ يوم.
2- تعدد معنى بنية الكلمة الواحدة:
حيث تحتمل بنية الكلمة الواحدة أكثر من معنى واحد، فكلمة (سائل) تأتي اسم فاعل من الفعل (سأَلَ) وكذلك اسم فاعل من الفعل (سالَ). وإزالة اللبس في هذه الحالة يحتاج إلى العديد من الأدلة الإضافية التي تساعد على التمييز بين الكلمتين السابقتين، وقد يكون أحد هذه الأدلة وضعها في السياق.
3- اللبس في أبنية الكلام:
لعل من أهم الصعوبات التي تواجهها حوسبة الصرف في اللغة العربية، غياب علامات التشكيل[5] في معظم النصوص العربية. وينتج عن هذا الغياب لبس على مسـتوى قـراءة النصوص؛ فكلمة “ضرب” -مثلاً- تحتمل أن تقرأ : ضَرَبَ وضُرِبَ وضَرْبٌ وضَرَّبَ وضَرُبَ إلخ. وبالتالي يسبب غياب علامات التشكيل في مجال المعالجة الآلية لصرف اللغة العربية معضلة كبيرة لمجموعة من البرمجيات المعاصرة، التي تهتم بمجالي التحليل والتوليد الصرفي الآلي.
4- التغييرات التي تطرأ على البنية الصرفيّة:
حيث تُؤدي تعقيدات عمليات الإعلال والإبدال، وتداخلها إلى خلق أعباء إضافية عند رد الفرع إلى أصله، وذلك في طور التحليل الآلي للكلمات. حيث يواجه الحاسوب صعوبة عند تحليل كلمة (آثَرَ) وأصلها (أَأْثَرَ) على وزن أَفْعَلَ، حيث تقول القاعدة ” إذا توالت همزتان، وسكنت الثانية، قُلبت الثانية حرف مدٍّ من جنس حركة الأولى”[6]. فإذا كانت الأولى مُحرَّكة بالفتح كان حرف المدِّ الملائم لها هو الألف. وهذه التغييرات على المستوى الصرفي تؤدي إلى العديد من الإشكاليات في أثناء المعالجة الآلية للصرف، ومن ثمَّ حوسبتها. الأمر الذي يستدعي إيجاد قواعد واضحة تضبط هذه التغيرات لإدراجها في برنامج المولد الصرفي الآلي، حتى يتمكن هذا الأخير من توليد الكلمات بشكل صحيح، بعد تعرضها للإعلال أو الإبدال.
5- طبيعة اللغة العربية:
فاللغة العربية لغة اشتقاقية (تعتمد على الجذر)، لا لغة لصقيَّة، “فأصل الكلمة فيها يتغيَّر لعدة أشكال تختلف عن الشكل الأصلي للكلمة، في حين أنَّ اللغات اللاتينية لغات لصقيّة، يظل أصل الكلمة فيها (الجذر) ثابت، ويتغير المعنى تبعاً لزيادة حروف على هذا الأصل أو نقصانها”[7]، فلو بحثنا عن كلمة (حمل) فلن يظهر في نتائج محرك البحث جميع الكلمات التي تشترك مع الكلمة السابقة في الجذر نفسه، فمثلاً لن تظهر كلمات مثل: (الأحمال، وحاملون، حاملات)، في حين ستظهر الكلمات التالية (حملت، وحملنا، وحملة، وحملات … وغيرها).
[1] الموسى، نهاد، العربية نحو توصيف جديد في ضوء اللسانيات الحاسوبية، ص203.
[2] علي، نبيل، اللغة العربية والحاسوب (دراسة بحثية)، ص299.
[3] انظر: صالح، عبد الرحمن الحاج، منطق النحو العربي والعلاج الحاسوبي للغات، السجل العلمي لندوة استخدام اللغة العربية في تقنية المعلومات، مكتبة الملك عبدالعزيز العامة، الر ياض، 1992م، ص27.
[4] البواب، مروان، والطيّان، محمد، أسلوب معالجة اللغة العربية في المعلوماتية (الكلمة – الجملة)، استخدام اللغة العربية في المعلوماتية، ص25.
[5] لذلك نشأت الحاجة الملحة لإنجاز برامج تقوم بعملية التشكيل الآلي للنصوص العربية؛ فظهرت في السنوات الأخيرة مجموعة من البرمجيات تعُنى بالتشكيل الآلي أنجزتها شركات عالمية ومراكز أبحاث.
[6] ابن هشام، أوضح المسالك إلى ألفية ابن مالك، تحقيق: محيي الدين عبد الحميد، القاهرة، الطبعة5، 4-383.
[7] يُنظر: حمادة، سلوى السيد، المحللات الصرفية للغة العربية، اجتماع خبراء المحللات الحاسوبية الصرفية للغة العربية، دمشق، 2009م