أهم نتائج دراسات طلاب الدراسات العليا في حوسبة اللغة
د. عبدالعزيز بن عبدالله المهيوبي
لقد أثبتت هذه دراسات حوسبة اللغة العربية التي تصدّى لها طلاب الدراسات العليا في الجامعات العربية -على قلتها- قدرة اللغويين بمساعدة الحاسوبيين على تطويع الحاسوب لخدمة اللغة العربية، غير أنَّ الحاسوب جهاز لا يعي، ولا يفكر، ولا يدرك الأخطاء إلا من خلال تطبيقات تقوم على مجموعة متسلسلة ومنطقية من الخطوات الرياضية أو اللغوية (الخوارزميات) ومن ثمة ينبغي أن نبرمج الحاسوب بطريقة صحيحة ليتمكن من التحليل والتوليد بشكل صحيح. كما أنه ليس مطلوبًا من هذه الدراسات والمشاريع أن تجعل من الحاسوب جهازًا نستغني به عن الإنسان، بل نهدف عند معالجة اللغة آليًا إلى بناء نظام يساعدنا، ويخفف الصعوبات التي تواجهنا في بحوثنا اللغوية والعلمية. كما أنَّ كل معالجة آلية للغة العربية تتطلب دراسة عميقة للعربية وقواعدها. ويمكننا تصنيف تلك النتائج حسب مجالات علم اللغة الحاسوبي.
1- أهم النتائج في مجال دراسات الشيوع:
استفاد الباحثون في هذا المجال من الحاسوب في إعداد قائمة بالكلمات بالترتيب الألفبائي والتواتري والموضوعي للمفردات الشائعة في بعض الكتب الدينية، ككتب فقه الجنايات، والمعاملات المالية، والبيوع، والتفسير، والحديث، والثقافة الإسلامية، والكتب اللغوية والدينية التي تُدرَّس في مدارس التعليم العام. وقد أشارت معظم الدراسات إلى أنه بالإمكان تصميم دروس في تعليم اللغة العربية للناطقين بها والناطقين بغيرها بالاعتماد على النتائج الإحصائية لشيوع المفردات والصيغ والتراكيب.
كما استفاد الباحثون من الحاسوب في حصر عدد الكلمات الموجودة في نصوص حديثة؛ فحصروا الكلمات الفريدة، وعدد تكرار كل كلمة من هذه الكلمات، والسياقات التي وردت بها كل كلمة، وترتيبها وفقًا لمرات التكرار أو وفقًا للترتيب الهجائي، وذلك من خلال قوائم تضم الكلمات ومرات تكرارها ونسبتها قياسًا لإجمالي الكلمات في النص. وقد أكدت الدراسات جميعها على فائدة قوائم الشيوع في الإسهام في تحسين إعداد المواد التعليمية، وتصميم الاختبارات، وفي عملية التقويم، وعند صناعة المعاجم بشكل عام، وأنَّ ميدان إعداد قوائم الشيوع ما زال في بدايته، ويحتاج لمزيد اهتمام.
2- أهم النتائج في مجال المعالجة الآلية لأصوات العربية:
في مجال معالجة أصوات القرآن الكريم وظَّف عدد من الباحثين الحاسوب في خدمة البنية الصوتية للقرآن الكريم؛ فحلَّلوا أصواته، ثم أحصوا ائتلاف ثنائيَّاتها على مستويي الكلمة والتركيب القرآني، باستخدام تقنيات الحاسب الآلي، كما استفادوا من تلك التقنيات في المقارنة بين قواعد الائتلاف الصوتي في القرآن الكريم، والقواعد التى نصَّ عليها العلماء الذين تحدَّثوا عن الائتلاف الصوتي في اللغة أو أشاروا إليه. وناقش فريق آخر الظواهر الصوتية المتعلقة بتجويد القرآن الكريم في ضوء ما وصلت إليه الحوسية، وأنجز آخرون قواعد بيانات صوتية تتميز بالشمولية، وتجمع كل الظواهر الصوتية القرآنية. كما أثبتوا أنَّ النبر في القرآن الكريم عند معالجة أصواته حاسوبيًا نوعان: فونيمي، له أثر في اللغة (الأصوات- الصرف- المعجم –التركيب) على القارئ أن يلتزم بموضعه، وغير فونيمي، ليس له أثر في اللغة.
وفي مجال فهم طبيعة الخصائص الصوتية للغة العربية المنطوقة، استعان الباحثون بالحاسوب وتقنياته العالية في تسجيل المادة الصوتية، وتحليلها في دراسة الخصائص الصوتية للغة العربية، والكشف عن خصائصها الأكوستيكية (الكلام الفعلي المنطوق) والفسيولوجية في سلسلة الكلام المتصل، واكتشفوا قواعد وقوانين يعتمد عليها في عملية المعالجة الصوتية الآلية للكلام المنطوق.
3- أهم النتائج في مجال معالجة كلمات اللغة العربية:
صمَّم بعض الباحثين مولدات تصريفية واشتقاقية آلية لتصريف كلمات اللغة العربية واشتقاقها، تعتمد هذه المولدات الآلية على خوارزمية حاسوبية تضبط العمليات التصريفية والاشتقاقية الفعلية الممكنة للكلمة، كما وقفوا على أهم إشكاليّات التصريف والاشتقاق، فوصَّفوا تلك الإشكاليّات، مستخدمين أساليب الذكاء الاصطناعي؛ ليتمكَّن الحاسوب من توليد الكلمات وتحليلها بصورة قريبة من تفكير الإنسان، وتتوافر الآن لغات برمجة عالية المستوى، تتسم بذكاء اصطناعي يجعل الحاسوب يستقبل، ويحلل، ويولد ما يُعطى إليه بشكل يوحي للإنسان بأنه يتعامل مع آلة لها القدرة على الفهم والإدراك.
وقد تعاملت معظم البرامج المقترحة مع الكلمات من جهتي التحليل والتوليد في طور التشكيل وفي طور غيابه، وقد أخذت بما تراه بعيدًا عن اللبس، وفيه تسهيل على المتعلم، وإغناء للغة، ومن ثمّة نحن في حاجة إلى إعادة النظر في نتائج البحث التقليدية كالشذوذ والاستثناء من القاعدة، والعدول عن الأصل، وغيرها من الصفات التي تحتاج إلى ضبط آلي علمي.
4- أهم النتائج في مجال معالجة نحو اللغة العربية:
استفاد الباحثون من الحاسوب في إدراك الخصائص النحوية للكلمات في العربية، نظرًا لما تمثله تلك الخصائص من أهمية بالغة في معالجة اللغة العربية آليًا، واقتراحوا مجموعة من قواعد إعادة الكتابة للجملة الفعلية غير المشكولة، وقدَّموا تقسيمات لها، واقترحوا مجموعة من قواعد المعرفة التي يستدل بها عند إجراء التحليل النحوي. كما وصفوا الجمل الواردة في بعض المدونات توصيفًا نحويًا في ضوء اللسانيات الحاسوبية، فصاغوا محددات الفعل الحاسوبية على شكل معادلات رياضية، يمكن تطبيقها على أشكال الفعل كافة، مؤكدين على أنه لا يمكننا الفصل بين المستويات اللغوية الأربعة (الصوتي والصرفي والنحوي والدلالي) في دراسة أي نص وتحليله، كما لا يمكننا الاستغناء عن السياق ليتعرف الحاسوب على ماهية الفعل.
طوَّر بعض الباحثين محللات نحوية للجمل الاسمية والفعلية غير المشكولة في اللغة العربية، واقترحوا تقسيمات جديدة وقواعد لإعادة الكتابة للجمل بناءً على قواعد التركيب المتحرر من السياق، كما صمَّموا تطبيقات لتكوين جمل عربية باستخدام لغات البرمجة.
5- أهم النتائج في مجال التحليل الدلالي:
أكَّدت الدراسات الحاسوبية أنَّ أغياب التشكيل عن النصِّ العربي المعاصر يؤدي – غالبًا – إلى زيادة وقوع ظاهرة التعدد الدلالي، وأنَّ دراسة ظاهرة التعدد الدلالي تُمثِّل إضافة مؤثرة إلى مجال المعالجة الآلية للغة العربية.
6- أهم النتائج في مجال فك اللبس اللغوي:
لعل من أهم النتائج التي توصَّل إليها الباحثون في مجال فك اللبس اللغوي هي بناء قاعدة بيانات لسمات الكلمات في اللغة العربية، من خلال بناء منهجية لتحديد سمات الكلمات، وتحديد متطلبات الفهم الحاسوبي للجملة العربية المكتوبة. كما اقترح بعض الباحثين خطوات لبناء نظام حاسوبي لفك الالتباس الدلالي للجملة العربية المكتوبة، واستعانوا بالحاسوب في حصر الأنواع الدلالية الأساسية لكلمات اللغة العربية، وما تفرع عنها من أنواع دلالية فرعية، ورصدوا صور تحول العلاقات الدلالية إلى نظائرها التركيبية، وناقش فريق آخر بناء معجم حاسوبي يحتوي علي العديد من المعارف اللغوية التي تمكن الحاسوب من القيام بعملية فك اللبس الدلالي.
7- أهم النتائج في مجال الترجمة الآلية من العربية وإليها:
حلَّل الباحثون الأخطاء النحوية والصرفية في أداء بعض الأنظمة المختارة للترجمة الآلية من الإنجليزية إلى العربية، وتناولوا بالدراسة بعض الظواهر الصرفية والنحوية، مثل: ترتيب النعت والمنعوت، والمبنى للمجهول، وجملة الصلة، وأداة التعريف، ومطابقة الفعل للفاعل، وترتيب ذكر الفعل والفاعل في الجملة، كما ناقشوا أسباب محدودية نجاح الترجمة الآلية المتخصصة من لغات غير اللغة الإنجليزية إلي اللغة العربية.
وقد أكَّد معظم الباحثين على أن العديد من نواحي القصور في ناتج الترجمة الآلية قد يحدث إما بسبب خطأ في تحليل الجملة المُدخلة أو بسبب خطأ في بناء الجملة الخارجة وأنَّ تحسين الترجمة الآلية يعتمد إلى حد كبير على تقنين معرفتنا باللغة، وتزويد الحاسب الآلي بالقواعد اللازمة للتعامل مع اللغة. وأكَّد الجميع أن الوصول إلى ترجمة آلية ذات دقة عالية لم يتحقق حتى الآن، وليس منظورًا أن يتحقق في المستقبل القريب، وأنَّ أمامنا الكثير الذي نستطيع أن نفعله لتحسين جودة الترجمة الآلية من العربية وإليها، والزيادة من فعاليتها وإمكانية الاستفادة منها.
8- أهم النتائج في مجال بناء قواعد البيانات:
تمكن الباحثون من بناء مجموعة من قواعد البيانات، منها:
1- قاعدة بيانات للجذور الثلاثية والرباعية، من شأن قاعدة بيانات الجذور هذه أن تيسر عمل الحاسوبيين الذين ننتظر منهم وضع برامج خاصة لميكنة المعجم العربي، حيث تعد الجذور قاعدة المعطيات الأساسية التي تكوّن مادة المعجم الحاسوبي.
2- قاعدة بيانات للأفعال العربية الثلاثية والرباعية -المجردة والمزيدة- وتُعدُّ هذه القاعدة من الأعمال الأساسية التي تقوم عليها العديد من التطبيقات الهامة في مجالات التعليم، وأعمال النشر والطباعة، مثل الترجمة من اللغة العربية وإليها.
3- قاعدة بيانات شاملة لجميع البنيات المتعدية بحرف، وصَنَّفوا حروف الجر الواردة في هذه البنية.
4- قاعدة بيانات تطبيقية للمشتقات انطلاقًا من الجذور الثلاثية المجردة والمزيدة، وحصروا أوزانها القياسية والسماعية.
5- قاعدة بيانات معلوماتية تطبيقية شاملة للمصادر في اللغة العربية، وقد حصروا أوزان المصادر في اللغة العربية من خلال البيانات المعجمية المتوفرة، وربطوا المصادر على اختلافها -السماعي منها والقياسي- مع أوزانها بالجذور مرورًا بالفعل،
6- قاعدة بيانات شاملة للأسماء الجامدة، تكون على شكل معجم آلي ينتج عن تطبيق خوارزميات التوليد على الجذور العربية.
9- أهم النتائج في مجال بناء المعاجم من المكانز والمدونات:
استطاع عدد من الباحثين بناء نمط معجمي جديد ينظر إلى واقع اللغة وشيوع مفرداتها في المجتمع اللغوي، بهدف وضع منهجية صالحة لبناء معجم تكراري للغة العربية المعاصرة؛ فدمجوا بين معايير الصناعة المعجمية العربية والمناهج التربوية؛ للوصول إلى المعجم المنشود القائم على الاحتكام إلى تحليل معلومات التكرار الخاصة بمفردات المستوى اللغوي المدروس؛ لوضع يد المستخدم على أكثرها شيوعًا وأهمية.
وهناك من اقترح منهجًا لمعالجة الجوانب المعجمية الدلالية في المعجم تحليلا وتمثيلا؛ فأعدَّ قاعدة بيانات للتعريفات المعجمية العربية، تكون صالحة لاستثمارها في مجالات العمل المعجمي، ومجال تطبيقات اللسانيات الحاسوبية؛ بهدف الوصول لحلول لأهم إشكاليات الصياغة والمحتوى في لغة التعريف في المعجم العربي العام الحديث.
تمكن الباحثون كذلك من بناء مدونة معجم عربي معاصر، يستمد مادته بأكملها من مدونة لغوية، ويمكن الإفادة منها في مجالات عدة، كالصناعة المعجمية، وتعليم اللغات، وتطوير أدوات المعالجة الآلية. كما تمكنوا من إعداد معجم محوسب لمعاني الأفعال الثّلاثيّة المجرّدة في اللّغة العربيّة، وحصر كل ما يتعلق بالفعل من معان مختلفة في سياقات معاصرة تمثّل الواقع اللغوي.
10- أهم النتائج في مجال استرجاع المعلومات والكشافات الموضوعية:
استطاع الباحثون بناء نظام محوسب للاسترجاع الموضوعي باللغة الطبيعية، بهدف التعرف على إمكانيات اللغة العربية والمشكلات التي تواجهها في نظم استرجاع المعلومات بوصفها لغة طبيعية، ومن ثَمَّ الوصول إلى حلول مقترحة لتلك المشكلات، ومحاولة الارتفاع بكفاية الاسترجاع في النظم التي تعتمد على اللغة الطبيعية لغةً للمدخلات والمخرجات، للوصول إلى مجموعة من المعايير والمواصفات التي يجب مراعاتها عند تصميم أو تطوير نظم استرجاع المعلومات العربية في المستقبل، ومحاولة بناء مرصد بيانات عربي يتأسس على المعايير الدولية، ويراعي في الوقت ذاته خصائص اللغة العربية، ليكون نموذجًا يحتذى به في المنطقة العربية.
أمكن التغلب على بعض القضايا الدلالية التي تثيرها العربية، والتي تقف حجر عثرة في طريق تحقيق كفاءة الاسترجاع، كالترادف، والاشتراك اللفظي، والتغلب على مشكلات السوابق، والتي تدخل على الكلمة العربية فتغير من رسمها الإملائي. ومن الباحثين من حلَّلَ عددًا من الكشافات الموضوعية الآلية التي تتيح إمكانية البحث الموضوعي في نص القرآن الكريم، وقارن بينها للوصول إلى أفضلها.
المبحث الرابع: أهم المناهج العلمية التي استخدمها الباحثون في حوسبتهم للغة العربية
لكل دراسة من دراسات حوسبة اللغة العربية موضوعها الذي يُحدد منهجها، ففي ضوء المشكلة التي سيتصدى الباحث لحلِّها، والطريقة التي يتبنّاها لحل هذه المشكلة، يختار المنهج المناسب؛ فالصرف العربي -مثلا- يمثل موضوعاً مثالياً للوصف المعتمد على الإحصاء منطلقًا له؛ وذلك لوقوعه في المنطقة الوسطى بين الاطراد والشذوذ. وقد اتَّبَعَتِ البحوث التطبيقية التوصيف وسيلة لصوغ القانون اللغوي، بما يجعله قابلًا للتعامل الحاسوبي، فيصوغ الباحث القاعدة الصرفية -مثلا- ثم يوصِّف تغيراتها الصرفية والصوتية والكتابية (الإملائية).
أما عند دراسة أثر الظواهر اللغوية في المعالجة الآلية للغة العربية، فيعتمد الباحث على المنهج الوصفي التحليلي، مع عدم إغـفال مناهج البحث الأخرى عندما يتطلب الأمر ذلك. ويعد المنهج الوصفي مدعومًا بالمنهج الإحصائي مناسبًا لدراسات الشيوع (شيوع الألفاظ والصيغ والتراكيب) لما للمنهج الإحصائي من قدرة على تدعيم الرأي، ودقته في الحكم على الظواهر اللغوية بشكل موضوعي.