جهود طلاب الدراسات العليا في حوسبة العربية (2)
د. عبدالعزيز بن عبدالله المهيوبي
4- المعالجة الآلية للقواعد النحوية:
“إنَّ معالجة النحو العربي حاسوبيًا تترقَّبه مشاكل كثيرة؛ وذلك لأن أساليب البرمجة الحاسوبية صُمِّمت للغة الإنجليزية، ولم تأخذ بالحسبان خصائص اللغة العربية، كالإضمار، والاستتار، والتقدير، والحذف، وتعدد الحالات الإعرابية، وإسقاط علامات التشكيل، وتعدد حالات اللبس”[1]؛ فكان على اللغوي توصيف هذه القواعد والقوانين للحاسوب، ليتمكن من تحليل المعلومة المدخلة إليه، وتوليد التركيب الصحيح.
وقد كان للجامعات الأردنية مجهودات مهمة في ميدان حوسبة نحو اللغة العربية؛ ففي عام 2002م حاول الباحث (معتصم الحمدان، جامعة آل البيت) تقديم نموذج محوسب لمحلل نحوي للجمل الاسمية غير المشكولة في اللغة العربية؛ فدرس الجملة الاسمية في اللغة العربية وتركيباتها المختلفة، واقترح مجموعة من القواعد التركيبية أو ما يسمى بقواعد إعادة الكتابة للجمل الاسمية، وذلك لإنجاز المحلل النحوي.
وفي عام 2004م قامت الباحثة (تمارى القبلان، جامعة آل البيت) ببناء برنامج يؤدي عمل محلل نحوي في اللغة العربية لجمل فعلية غير مشكولة من الفعل الماضي المبني للمعلوم، فدرست الجملة الفعلية ذات الفعل الماضي المبني للمعلوم، وتركيباتها المختلفة، واقترحت قواعد تركيبية للجملة الفعلية من الفعل الماضي المبني للمعلوم، لإنجاز التحليل النحوي، وفي عام 2007م حاولت الباحثة (جنات أحمد، الجامعة الأردنية) مقاربة النظام التركيبي في اللغة العربية حاسوبيًا، متخذة من المركب الإضافي نموذجًا له، واقتصرت المعالجة الحاسوبية للتركيب الإضافي على معالجة الإضافة في صورة الإفراد، وفي عام 2009م وصَّف (أحمد أنيس، الجامعة الهاشمية) الأفعال الواردة في شعر محمود درويش توصيفًا نحويًا في ضوء اللسانيات الحاسوبية، فصاغ محددات الفعل الحاسوبية على شكل معادلات رياضية، يمكن تطبيقها على أشكال الفعل كافة، وفي العام نفسه وصَّفت الباحثة (أحلام الزبن، الجامعة الهاشمية) الفعل الماضي في ضوء اللسانيات الحاسوبية.
كما كان للجامعات المصرية أثر كبير في إثراء هذا الميدان الدقيق في حوسبة اللغة، ففي عام 1989م تمكنت (سلوى السيد حمادة، جامعة عين شمس) من بناء تطبيق لتقسيم الجملة العربية، وتحليلها من خلال الجملة البسيطة، وفي عام 2004م درس (مدحت السبع، جامعة القاهرة) العلاقات التركيبية في الجملة الفعلية القرآنية، وفي عام 2008م حاول (محمد رأفت، جامعة بني سويف) أن يقدم تصورًا للتحليل النحوي للجملة الخبرية الواردة في شعر كعب بن مالك الأنصاري، وفي عام 2011م درس (حميد خلاف، جامعة عين شمس) اللبس الدلالي والتركيبي للفعل حاسوبيًا، من خلال التكامل بين النحو والمعجم، فحصر أنواع اللبس اللغوي ومصادره، وناقش إمكانية بناء معجم حاسوبي يحتوي على العديد من المعارف اللغوية التي تمكن الحاسب الآلي من القيام بعملية فك اللبس.
وفي عام 2014م درس (عمرو جمعة، جامعة القاهرة) ظاهرة اللبس في البنية والتركيب، فتحدث عن أنماطه وأسباب حدوثه وطرق التخلص منه، وفي العام نفسه تناول (محمد فرج، جامعة بني سويف) الخصائص الصرفية والنحوية للأفعال العربية؛ نظرًا لما تمثله تلك الخصائص من أهمية بالغة في معالجة اللغة العربية آليًا، وقد اقتصر في دراسته على الخصائص اللفظية سواء أكانت خصائص صرفية كـ (النمط الصرفي، والملحقات الإلصاقية) أم خصائص نحوية كـ ( الرتبة، والأداة، والتضام، والمطابقة، والربط، والعلامة الإعرابية).
وفي الجزائر عمِلَ الباحث (فارس شاشة، جامعة الجزائر) في عام 2008م على إنشاء نموذج جذري إعرابي يعمل على نمذجة الفعل، بهدف التعرف على مختلف المشكلات التي تواجه معالجة الأفعال العربية آليًا، ومحاولة إيجاد حلول لها، كما سعى الباحث (بابا رضا، جامعة أبوبكر بلقايد) في عام 2015م إلى توظيف مجموعة من الأسس اللسانية الحاسوبية لإقامة برنامج حاسوبي يمكنه توليد الجمل، وقد ركَّز في دراسته على الجمل العربية المحددة في أشكالها المكتوبة، والبعيدة عن تحقيقاتها النطقية. ويكاد الباحث بعمله هذا يكون الوحيد من بين الباحثين الذي تجرأ وخاض تجربة بناء مولد آلي للجملة العربية.
5- صناعة المعاجم الآلية:
أصبحت المعاجم اللغوية من الضخامة بحث يستحيل على الباحثين تحليل موادها يدويًا، وقد ظهرت العديد من البحوث التي تناولت حوسبة المعجم العربي، ولعل من أهم الإنجازات في ميدان صناعة المعاجم الآلية، رسالة الماجستير التي أنجزها (عمر مهديوي، جامعة سيدي محمد بن عبد الله) عن المعجم الآلي للجذور، وفي عام 2004م طوَّر (محمود مصطفى، جامعة حلوان) معجمًا صرفيًا حاسوبيًا للغة العربية، وفي عام 2008م ناقش (عبدالعاطي هواري، جامعة القاهرة) إشكالية صياغة لغة التعريف ومحتواه في المعجم العربي العام الحديث، فقدَّم رؤية حاسوبية لإعداد قاعدة بيانات للتعريفات المعجمية العربية، تكون صالحة لاستثمارها في مجالات العمل المعجمي ومجال تطبيقات اللسانيات الحاسوبية، واقترح من خلالها منهجًا لمعالجة الجوانب المعجمية الدلالية في المعجم تحليل وتمثيلا، وفي عام 2014م أنجز (جهاد العرجا، الجامعة الإسلامية، غزة) معجمًا محوسبًا لمعاني الأفعال الثّلاثيّة المجرّدة في اللّغة العربيّة، فأعدَّ قاعدة بيانات نصيّة للأفعال الثلاثية المجردة، وحصر المعاني الممكنة لتلك الأفعال، وبيَّن معنى كل فعل في سياقات توضّح معناه، وفي العام نفسه قدَّم (يوسف أبوعامر، جامعة القاهرة) تأصيلا نظريًا وتصميمًا عمليًا لمعجم آلي يلبي احتياجات النظم المختلفة، كالترجمة الآلية، واسترجاع المعلومات، والتحليل الصرفي، والإعراب الآلي، وزوَّد المعجم الآلي بمحلل صرفي آلي ثنائي الاتجاه؛ لتوليد الصيغ القياسية من جذوعها وتحليلها، وفي عام 2016م اقترح (محمد حامد، جامعة القاهرة) نمطًا معجميًا جديدًا ينظر إلى واقع اللُّغة وشيوع مفرداتها في المجتمع اللُّغويِّ، فوضع منهجية صالحة لبناء معجم تكراري للغة العربية المعاصرة.
وفي المملكة العربية السعودية أنشئ مساق اللسانيات الحاسوبية في جامعة الأميرة نورة بنت عبد الرحمن، وكانت اتجاهات القسم معجمية تطبيقية؛ حيث نُوقشت أول رسالة ماجستير في 31/مايو/2017م، وكان للباحث شرف مناقشتها، وكان عنوان الرسالة “معجم محوسب لألفاظ الحب والكره في اللغة العربية” سعت الباحثة (سارة السيف) من خلالها إلى بناء معجم إلكتروني للأجهزة الذكية لألفاظ الحب والكره في اللغة العربية، تلتها رسالة ماجستير أخرى بعنوان “بناء جزئي لأنطولوجيا معجمية في ضوء حقل جسم الإنسان” للباحثة (أريج الشقراوي) حيث جمعت الباحثة مدونة لغوية خاصة بفئة الناشئة، ثم استخلصت مفردات الأنطولوجيا، ثم صنفتها وفق مجالات الحقل وفئاته وعناصره، وتلت هذه الرسالة دراسة ثالثة بعنوان “ألفاظ العنف في لغة الصحافة: تحليل معتمد على المدونات الحاسوبية” حيث سعت الباحثة (منال الزنيدي إلى جمع الألفاظ العربية الدالة على العنف في الصحف، وتصنيف ألفاظ العنف ومترادفاتها بواسطة مدونة لدراسة امتدادات التماثلية واللاتماثلية لأبعاد الترادف غير التام، ومعالجة الكلمات المتعلقة بمجال دلالي معين في اللغة العربية بواسطة التحليل الآلي.
6- الترجمة الآلية:
وقد نالت الترجمة الآلية نصيبًا من تلك الجهود (النظرية والتطبيقية) التي بذلها الباحثون العرب؛ فكان للجامعات المصرية نصيب كبير من تلك الدراسات والمشاريع، ففي عام 1999م حاول الباحث (أحمد الصادق، جامعة القاهرة) تطوير محلل نحوي آلي للغة العربية لتحليل النصوص العلمية الحديثة، وعمل على جعل هذا المحلل النحوى جزءًا من نظام ترجمة آلية متعدد اللغات، وفي عام 2002م سعى (محمد عبد العال، جامعة الأزهر) إلى استكشاف إشكاليات المطابقة في عملية الترجمة الآلية وآثارها، كما حاول إثبات أن المطابقة كمجموعة سمات ومجموعة قواعد مسؤولة عن توليد جمل عربية صحيحة ومترابطة في الترجمة الآلية، وفي عام 2003م طوَّر (حسام الدين علي، جامعة حلوان) نظامًا للترجمة الآلية من العربية إلى الانجليزية، وفي عام 2004م طوَّر (محمود عثمان، جامعة حلوان) نظامًا للترجمة الآلية في الاتجاهين، مع إمكانية تقييم أداء الترجمة الآلية، وفي العام نفسه اختارت الباحثة (إيمان الزقلعي، جامعة الإسكندرية) نظامين للترجمة الآلية من الإنجليزية إلى العربية، ثم اختارت أربعة نصوص إخبارية بالإنجليزية وأدخلتها في البرنامجين لترجمتها، وحللت النصوص، وصنفت الأخطاء الموجودة في تلك النصوص إلى مجموعات، ثُمَّ جدولتها تبعًا لنوع الخطأ أو التركيب، وفي عام 2006م صاغ (حميد خلاف، جامعة عين شمس) بعض القواعد لترجمة الأسماء والمركبات الاسمية من اللغة الإنجليزية إلى اللغة العربية آليًا.
وفي عام 2012م ناقشت (نيفين سلامة، جامعة عين شمس) أسباب محدودية نجاح الترجمة الآلية للنصوص المتخصصة من الألمانية إلي العربية، وفي عام 2014م درست الباحثة (أروى الخولي، جامعة الإسكندرية) خدمة الترجمة الآلية على مواقع الإنترنت دراسة تحليلية تقييمية، بهدف الاعتماد عليها في تقديم خدمة الترجمة بالمكتبات ومراكز المعلومات، وفي عام 2017 م سعى (ضاحي غانم، جامعة الأزهر) إلى بناء قاعدة للترجمة الآلية من اللغة الألمانية إلى اللغة العربية والعكس.
وفي الجزائر سلطت الباحثة (بربارة بن طاهر، جامعة الجزائر) في عام 2006م الضوء على أهمية بناء برامج آلية عربية بواسطة تضافر جهود علماء الحاسوب، وعلماء اللغة واللسانيات؛ لاستيعاب الثروات المعرفية الأجنبية، من خلال بحثها الموسوم بـ”الترجمة بمساعدة الحاسوب من الإنجليزية إلى العربية”، وفي عام 2008م قامت (آمنة طالبي، جامعة منتوري) بتحليل وصفي لإشكالية المتلازمات اللفظية في الترجمة الآلية، بإدخال نصوص تحتوي على عدد معين من المتلازمات اللفظية في نظام للترجمة الآلية، وقد فشلت الآلة بدرجة عالية في ترجمة المتلازمات اللفظية، وارتكبت أخطاء عديدة ومتنوعة، لاسيما في بناء الجمل والتراكيب، وفي عام 2011م تناولت (وفاء التركي، المعهد العالي العربي للترجمة) موضوع الترجمة الآلية بمقاربة إحصائية.
7- معالجة النصوص آليًا بهدف صنع الفهارس وتصنيفها وترتيبها:
تواجه معالجة نصوص اللغة العربية حاسوبيًا العديد من المشكلات؛ بعضها يرجع إلى طبيعة أصوات اللغة العربية، والكلمات التي تتكون منها، وكيفية ترابطها، في حين يرجع بعضها الآخر إلى طبيعة نظم الاسترجاع المصممة، لذا كان من الضروري توظيف تقنيات المعلومات للتعامل بكفاءة مع اللغة العربية، وخاصة في مجال نظم استرجاع المعلومات. وسنستعرض في السطور التالية جهود مجموعة باحثين ساهموا في التعرف على إمكانيات اللغة العربية في نظم استرجاع المعلومات، والمشكلات التي تواجه النظم المعتمدة على اللغة العربية.
ففي عام 2000م اقترح (علي ذياب، جامعة آل البيت) نظامًا خبيرًا للبحث في النص العربي، وفي عام 2003م قدَّم (محمد عبدالهادي،جامعة القاهرة) مجموعةً من المعايير والمواصفات التي يجب مراعاتها عند تصميم نظم استرجاع المعلومات العربية وتطويرها في المستقبل، محاولا بناء مرصد بيانات عربي يتأسس على المعايير الدولية، ويراعي في الوقت ذاته خصائص اللغة العربية، يكون نموذجًا يحتذى به في المنطقة العربية، وفي عام 2006م حَلَّل (مجدي الجاكي، جامعة الإسكندرية) عددًا من الكشافات الموضوعية الآلية للقرآن الكريم، التي تتيح إمكانية البحث الموضوعي في نص القرآن الكريم، وفي عام 2008م قدَّم (حجير إسماعيل، وزارة التعليم العالي والبحث العلمي، الجزائر) مشروعًا لإعداد مدقق إملائي عربي مفتوح المصدر، باستطاعته تدقيق النصوص العربية بطريقة آلية، والقيام بتحديد الأخطاء الإملائية فيها، واقتراح التصحيحات المناسبة البديلة لها.
8- دراسة المعنى حاسوبيًا:
لم يُغفل الباحثون دراسة المعنى حاسوبيًا، على الرغم من أنَّه يمثل مشكلة يصعب حلَّها عند معالجته آليًا؛ “فهو يتعامل مع دلالة الجمل والتعرف على معانيها وتحليلها تحليلا ذا معنى، كما أنَّه يجمع ما بين التحليل الصرفي والنحوي علاوة على تراكيب الجمل من حيث المعنى والدلالة. ولا تكاد أغلب النظم الآلية تصل إلى هذا المستوى من التحليل حتى في اللغات التي لها باع طويل في اللغويات الحاسوبية مثل الإنجليزية والفرنسية وغيرهما؛ لأن معنى الكلام يختلف من سياق لآخر”[2].
وكانت (سلوى السيد حمادة،جامعة عين شمس) من أوائل من ناقش قضية المعنى، فأنجزت في عام 1998م قاعدة بيانات صرفية ونحوية ودلالية، وصممت نموذجًا لتفهم الجملة العربية البسيطة والمركبة، وفي عام 2011م قدَّم (حسين البسومي، جامعة القاهرة) رؤية لحلِّ إحدى المشكلات الأساسية التي تواجه حوسبة اللغة العربية وهي اللبس الدلالي، وتعدد المقصود من الجملة العربية، واقتصر في دراسته على اللغة العربية المعاصرة المكتوبة، وفي عام 2015م دراس (عبد الحليم أبوشوشة، جامعة عين شمس) أثر ظاهرة التعدد الدلالي في المعالجة الآلية من خلال ثلاثة محاور هي: أثر التعدد الدلالي في بناء المعجم الآلي، وأثر التعدد الدلالي في التحليل الآلي للنصوص، وأثر التعدد الدلالي في الترجمة الآلية.
9- معالجة الشعر العربي حاسوبيًا:
ونعني بمعالجة الشعر حاسوبيًا أن يتمكن الحاسوب من قراءة الشعر، وإدراك أوزانه، والكشف عن مكوناته أبياته اللفظية، وتحديد أماكن التقطيع الصحيحة للبيت الشعري، والوقوف على الصور الاستعارية في القصيدة. وتعد دراسة (عشري محمد، جامعة عين شمس) في عام 2004م من الدراسات الحاسوبية القليلة التي تناولت أنماط الصور الاستعارية في القصيدة العربية المعاصرة من خلال مجموعة من القصائد العربية المعاصرة، وفي العام نفسه اقترحت (شيماء رشاد، جامعة حلوان) نظامًا حاسوبيًا لمعالجة الشعر العربي، وفي عام 2006م تمكنت الباحثة العراقية (جنان العيداني، جامعة البصرة) من حوسبة علم العروض، فنجحت في تصميم نظام حاسوبي خبير، وتطويره للقيام بتحليل أبيات الشعر العربي.
10- بناء المكانز وتحليل المدونات اللغوية المحوسبة:
كان للباحثين المصريين النصيب الأوفر من دراسات بناء المدونات اللغوية وتحليلها؛ ففي عام 2007م صمَّم (المعتز بالله طه، جامعة القاهرة) مدونة لغوية إلكترونية بهدف بناء معجم يعكس الواقع اللغوي للعربية في الوقت الراهن. وبعدها بثلاث سنوات قدَّم الباحث نفسه في أطروحته لنيل درجة الدكتوراه هيكلا لمدونة المعجم التاريخي للعربية، في محاولة لإحياء مشروع المعجم التاريخي، فطوَّر مدونة لغوية لمعجم تاريخي للغة العربية، وفي عام 2016م سعى (أحمد روبى، جامعة الفيوم) إلى بناء مدونة لغوية للغة العربية الفصحى المعاصرة، وتهيئة مادتها للعنونة اللغوية، كما قدَّم منهجًا لبناء بنك شجريّ نحوي للغة العربية الفصحى المعاصرة في ضوء المدونة اللغوية.
في عام 2005م تتناول (محمد الوديان، جامعة آل البيت) موضوعًا في غاية الأهمية في الوقت الحاضر، وهو تنظيم المعلومات، والاستفادة منها، لاسيّما أن هناك انفجارًا معرفيًا هائلًا له اتصال باللغة العربية، مما يقتضي توظيف تقنيات المعلومات للتعامل بكفاءة مع اللغة العربية، وخاصة في مجال استرجاع المعلومات؛ فقدَّم اقتراحًا لبناء مكنز آلي لتعزيز نظام استرجاع المعلومات للغة العربية، وفي عام 2013م أعدت الباحثة (نقاز هجيرة، جامعة أبوبكر بلقايد، الجزائر) مدونة لغوية حاسوبية تمثل أسماء المواقع الجغرافية في مدينة تلمسان تمثيلًا فعليًا. واختارت (بدرية العنزي، جامعة الإمام محمد بن سعود) في عام 2017م مائة متلازمة لفظية ورَدَتْ في مدونة لغوية محوسبة، ووَرَدَتْ في ثلاثة معاجم مختارة، ثم قارنت معطياتها بمعطيات المدونة حسب المقياس الإحصائي. كما تناول (أحمد المطرودي، جامعة الإمام محمد بن سعود) النظم التركيبي والدلالي لألفاظ الجموع التي لا مفرد لها من لفظها دراسة معتمدة على المدوَّنات.
كان اللغويون العراقيون من أوائل من حاول تطويع الحاسوب لخدمة اللغة العربية، غير أن الحروب الكثيرة التي خاضها هذا البلد العربي وجهت ضربة قوية لجهود حوسبة اللغة العربية؛ ففي عام 1992م حاول الباحث (الزبيدي حسن، جامعة بغداد) تطبيق النظريّة التوليديّة التحويليّة على اللغة العربية حاسوبياً، وفي عام 1997م صمَّم (مؤيد فاضل، الجامعة التكنولوجية ببغداد) معجمًا للمساعد على الترجمة الآلية من الإنجليزية إلى العربية، وفي العام نفسه صمَّم (علي فؤاد صالح، جامعة بغداد) معجمًا حاسوبيًا للأفعال العربية، وفي عام 2004م استخدم (سفيح عجرش، جامعة البصرة) المنطق المضبّب[3] آليّةً لتمييز الحروف العربيّة، وفي عام 2005م رمَّزَ (مكّي بشّار، الجامعة المستنصريّة) الكلام من خلال خوارزمية التّرميز الخطّيّ التّوقّعيّ باستخدام نظريّتي لايرووكس ورابينيير، وفي عام 2012م صمَّم (علاء عبد الحسين، جامعة التّكنولوجيا) برنامجًا لتمييز الكلام باستخدام نموذج ماركوف المخفيّ[4].
وأخيرًا فإننا لم نقصد من استعراض تلك الأطروحات والرسائل العلمية التي تتفاوت قوة وضعفًا الإحاطة بتلك الجهود، بقدر ما كُنّا نهدف من ورائها إعطاء النموذج، وضرب المثل، فكان المقصود بيان أهم الموضوعات التي نوقشت في ميدان معالجة اللغة العربية حاسوبيًا. كما أنَّ ميدان حوسبة اللغة العربية لا يزال خصباً، ينقصه العمل الجاد، وجهود اللغويين العرب تبقى خجولة ترتقب المزيد من دعم الجامعات وتشجيعها.
وقد شهدت لهولاء الباحثين بحوثهم ومشاريعهم في جامعاتهم بأنهم بذلوا جهدهم، ولم يقصروا في السعي إلى تطويع تلك الآلة الصماء لخدمة اللغة العربية، غير أنَّ بعض المعوقات قد شتت تلك الجهود، وأضعفت قيمتها العلمية.
[1] يُنظر: المرجع السابق، ص391.
[2] مساعد الطيار، “اللغويات الحاسوبية”، صحيفة الجزيرة، العدد: 10892، الخميس 15 جمادى الاولى 1423هـ.
[3] المنطق المضبب أو الضبابي هو: منظومة منطقية تقوم على تعميم للمنطق التقليدي ثنائي القيم.
[4] يقوم نموذج ماركوف المخفيّ بتوصيف إحصائي لتسلسل الأصوات المختلفة ضمن الكلمات.