جهود طلاب الدراسات العليا في حوسبة العربية (1)
د. عبدالعزيز بن عبدالله المهيوبي
عندما بدأت حركة استخدام الحاسوب في معالجة اللغة العربية، كان أكثر اللغويين لا علم لهم بالحاسوب، ولا معرفة لهم بتطبيقاته؛ فاحتاجوا إلى الحاسوبي الذي يوفر لهم التطبيقات التي استخدموها في معالجة بياناتهم، وربط قواعد معطياتهم، فكانوا إذا انتهوا من جمع البيانات اللغوية أو توصيف القواعد، دفعوا بها إلى الحاسوبي لمعالجتها، واستخراج النتائج والإحصائيات. ومعلوم أنَّ لعلم اللغة الحاسوبي فرع نظري يتناول قضايا نظرية في علم اللغة الحديث، بهدف اكتشاف قدرات عقل الإنسان على إنتاج المعرفة اللغوية، وآخر تطبيقي عملي يهتم بتقييس الاستعمال اللغوي، بهدف بناء برامج حاسوبية وأدوات تطبيقية تخدم اللغة، وتجعل التعامل معها متاحًا.
وسيتناول الباحث في هذا المبحث الجهود الأكاديمية التي بذلت في الأقسام العلمية في الجامعات العربية منذ أواخر القرن الماضي لمعالجة اللغة العربية آليًا، وقد اقتصر البحث على جهود طلاب الدراسات العليا في حوسبة العربية نظريًا وتطبيقيًا من خلال أطروحاتهم العلمية ومشاريعهم التطبيقية. ويمكننا تصنيف جهود الدارسين في حوسبة اللغة العربية وتطويع الآلة لخدمة الدراسات اللغوية حسب مجالات علم اللغة الحاسوبي والمستويات اللغوية[1]، وقد عرض الباحث الموضوعات حسب التسلسل الزمني قدر الإمكان، كما جاءت طريقة العرض متخذة الوصف بعيدًا عن التسرع في إصدار الحكم.
1- إحصاء المفردات والتراكيب بالحاسوب:
بدأ الباحثون في التفكير بالربط بين اللغة والحاسوب، وقد اقتصر الأمر في البداية – فيما يخص استخدام الحاسوب في معالجة اللغة العربية- على دراسات شيوع المفردات والصيغ والألفاظ، فنوقشت الكثير من الموضوعات في قسم علم اللغة التطبيقي بمعهد تعليم اللغة العربية في جامعة الإمام محمد بن سعود، وقد أضحى هذا النوع من البحوث تيّارًا واضحًا وقويّا، استمر عقدًا من الزمن، ثم أخذ يضعف، حتى توقف تمامًا.
وتفيد دراسات الإحصاء والشيوع في معرفة “معدلات استخدام الحروف، والكلمات والصيغ الصرفية، وأنواع الأساليب النحوية، أو التوزيع النسبي للأفعال المعتلة والصحيحة، أو للإفراد والتثنية والجمع، أو لحالات الإعراب المختلفة، كما تساعد في تفسير بعض الظواهر اللغوية، وتحليلها”[2]. وهذه جداول توضح أهم دراسات الشيوع، وإحصاء الألفاظ في قسم علم اللغة التطبيقي في جامعة الإمام محمد بن سعود:
أ- دراسات الشيوع في الكتب الشرعية:
وقد سعت جميع دراسات شيوع المفردات في الكتب الشرعية إلى تحقيق الأهداف نفسها، وهي: إعداد قائمة بالمفردات التي تشيع في تلك الكتب، والإفادة منها في إعداد المواد التعليمية، وتُوظيفها في كتب تعليم اللغة العربية لغير الناطقين بها، وأهم هذه الدراسات:
الباحث | الرسالة | العام |
عثمان النجران | قائمة مفردات فقه العبادات | 1990م |
خالد الفليح | قائمة المفردات الشائعة في الفتح الكبير | 1991م |
عبد العزيز السالم | إعداد قائمة مفردات العقيدة الإسلامية | 1992م |
عبدالكريم الشعلان | إعداد قائمة مفردات فقه المعاملات المالية | 1992م |
يوسف العقيل | إعداد قائمة مفردات فقه الجنايات | 1995م |
فهد العليان | إعداد قائمة مفردات كتاب البيوع في الصحيحين | 1995م |
ب- دراسات الشيوع في كتب التعليم العام وتعليم العربية لغة ثانية:
كما سعت دراسات شيوع المفردات والمشتقات في كتب التعليم العام إلى تحقيق الأهداف ذاتها التي سعت إلى تحقيقها دراسات شيوع المفردات في الكتب الشرعية، ومن أهم تلك الدراسات:
الباحث | الرسالة | العام |
إبراهيم الخريجة | المشتقات الشائعة في كتب المطالعة العربية في المرحلة الثانوية | 1997م |
عبداللطيف العمار | قائمة المفردات الشائعة في كتب الحديث والثقافة الإسلامية للمرحلة الثانوية بوزارة المعارف ومدى فهم الطلبة غير العرب لها | 1997م |
خالد المرداسي | قائمة مفردات كتب التاريخ للمرحلة الثانوية العامة بالمملكة العربية السعودية ومدى فهم غير الناطقين بالعربية لها | 1997م |
فهد الأحمد | المصادر الشائعة في كتاب المطالعة العربية بمدارس وزارة المعارف السعودية | 2000م |
حسن القحطاني | قائمة المفردات الشائعة في كتب التفسير للمرحلة الثانوية بوزارة المعارف السعودية | 2000م |
سليمان الحميضي | قائمة المفردات الشائعة في كتب المطالعة للمرحلة الثانوية بوزارة المعارف السعودية | 2000م |
عبدالله العمري | مفردات كتب القراءة وعلاقتها بالمعجم اللغوي لطلاب الصفوف العليا في المرحلة الابتدائية | 2003م |
ظافر الشهري | مفردات كتب القراءة وعلاقتها بالمعجم اللغوي لطلاب الصفوف الثلاثة الأولى من المرحلة الابتدائية | 2003م |
خالد الحمادا | مفردات كتب القراءة وعلاقتها بالمعجم اللغوي لطلاب معهد تعليم اللغة العربية في جامعة الإمام محمد بن سعود | 2004م |
جـ- دراسات الشيوع في الصحف والمجلات:
وفي مجال دراسات شيوع المصطلحات، أنجز (صالح السحيباني) في عام 1991م قائمة بالمصطلحات السياسية الشائعة في الصحف العربية، فحدَّدَ نسب شيوع هذه المصطلحات خلال فترة زمنية معينة، وصمَّم دروسًا باللغة العربية في ضوء تلك المصطلحات الشائعة للدبلوماسيين الناطقين بغير العربية.
من خلال ما سبق، تبرز ملاحظتان، أولاهما: جرت دراسات الشيوع -في الأغلب- على مستوى كلمات اللغة العربية. وثانيهما: لم يتم التنسيق بين أصحاب هذه الدراسات، لتكون دراساتهم متكاملة.
ومن الدراسات المهمة في هذا المجال، ما قدَّمته (هبة سيد راشد، جامعة عين شمس) في بحثها “اللغة العربية المعاصرة في المجال السياسي، دراسة لغوية حاسوبية من واقع ذخيرة لغوية في الفترة من (2000م إلى 2004م)، فاختارت موضوعين سياسيين رئيسيين، وحصرت كلماتهما وحللتها صرفيًا ودلاليا. ولعل من الدراسات القليلة التي استهدفت شيوع التراكيب، دراسة (خالد مصطفى، جامعة القاهرة) حيث درس في عام 2006م التراكيب اللُّغوية غير الشائعة في الصحافة المصرية المعاصرة دراسة تحليلية إحصائية، بهدف تعرف الأنماط الشائعة وغير الشائعة والمهجورة في اللغة المعاصرة، والعوامل التي تحكم ذلك.
ومن دراسات الشيوع الحديثة، دراسة “المفردات اللغوية شائعة الاستعمال وتوظيفها النصي في الصحف السودانية والإماراتية” للباحث (عوض أحمد، جامعة السودان للعلوم والتكنولوجيا) حيث حصر الباحث المفردات اللغوية الشائعة في الصحافة الإماراتية والسودانية، وكشف أسباب شيوع تلك المفردات.
2- المعالجة الآلية لأصوات اللغة العربية:
انصرفت جهود الباحثين وطلاب الدراسات العليا بادئ الأمر إلى تطويع الحاسوب لخدمة العلوم الشرعية؛ فاستخدم معظم الباحثين تقنيات الحاسوب لدراسة النظام الصوتي للغة العربية في القرآن الكريم، وكان للجامعات المصرية النصيب الأوفر من هذه الدراسات، ففي عام 2011م ناقش الباحث (أحمد راغب أحمد، جامعة القاهرة) الظواهر الصوتية المتعلقة بتجويد القرآن الكريم في ضوء ما وصلت إليه الحوسبة، من خلال أطروحته “التجويد القرآني عند قراء المصحف المرتل لرواية حفص عن عاصم: دراسة صوتية حاسوبية” فدرس التشكيل الصوتي للقرآن الكريم عن طريق دراسة المتغيرات السياقية التي تؤثر في تشكيل الصوت القرآني، وفي العام نفسه درس الباحث (خالد محمد مصطفى، جامعة القاهرة) الخصائص الصوتية للغة العربية الفصحى المنطوقة في نشرات الأخبار في القنوات الفضائية المصرية، معتمدًا على الإحصاء، مستعينًا بالحاسوب، مستفيدًا من تقنياته العالية في تسجيل المادة الصوتية وتحليلها؛ وذلك في خطوة علمية تهدف إلى فهم طبيعة الخصائص الصوتية للغة العربية المنطوقة، واكتشاف قواعد وقوانين يعتمد عليها في عملية المعالجة الصوتية للكلام المنطوق.
وفي عام 2013م درست الباحثة (عائشة التركاوي، جامعة القاهرة) النبر والتنغيم في القرآن الكريم؛ بهدف وضع أطر علمية لظاهرتي النبر والتنغيم، وبيان أثرهما في الكشف عن البنيتين السطحية والعميقة، وفي عام 2015م سعى الباحث (محمد الخطيب، جامعة القاهرة) إلى الكشف عن النسيج الداخلي للبنية الصوتية للغة والقرآن الكريم، من خلال بحثه الموسوم بـ”الائتلاف الصوتي في القرآن الكريم: دراسة لغوية حاسوبية” فوظَّف الحاسوب في خدمة البنية الصوتية للقرآن الكريم، لإحصاء ائتلاف ثنائيَّاتها على مستويي الكلمة والتركيب القرآني، مستخدمًا تقنيات الحاسب الآلي، وخاصة ما يُسمى بقواعد البيانات، وفي العام نفسه حاولت الباحثة (بشرى محمد، جامعة القاهرة) رصد الوحدات المقطعية وفوق المقطعية في بعض النصوص الشعرية المنشدة، من خلال دراستها “البنية الصوتية في شعر بدر شاكر السياب ولميعة عباس عمارة: دراسة حاسوبية” فقدَّمت تصورًا لبنية الشعر الحر مستفيدة من الاتجاهات اللسانية الحديثة في الدرس الصوتي الحاسوبي؛ للتعرف على الأساس الفيزيائي للمتغيرات الصوتية التي تتحكم في تشكيل البنية الصوتية لقصيدة الشعر الحديث.
إن بناء برنامج حاسوبي يستقبل الكلام المنطوق، ويحوله إلى نصوص مكتوبة يتطلب معرفة المواضع التي تتغير فيها صفات الوحدات الصوتية على مستوى الكلمة والجملة، وكذلك التنبه إلى ما يُكتب من الأصوات ولا ينطق، أو يُنطق ولا يُكتب. ولعل من أقدم الدراسات في التعرف على الكلام المنطوق ما قدمته الباحثة (إيمان أبو المعالي، جامعة الخرطوم) في عام 1993م، فقد صممت نظاما لتمييز الكلام العربيّ باستخدام نماذج ماركوف الخفيّة، وفي عام 2003م أنجتْ (نزيه عبد القوىّ، جامعة القاهرة) تطبيقًا محوسبًا للتحقّق من الكلام المنطوق، وفي عام 2004م صممت (رندا الوكيل، جامعة القاهرة) برنامجًا لتحسين الكلام آليًا تمهيداً للتّعرّف عليه.
3- التحليل والتوليد الصرفي الآلي لكلمات اللغة العربية:
أُنْجزت العديد من الدراسات في مجال معالجة صرف اللغة العربية، والبحوث التطبيقة في هذا المستوى اللغوي كثيرة؛ وذلك نظرًا “لوضوح مسار عملية الاشتقاق، واطراد التصريف باستثناء حالات نادرة، وميل الصرف العربي لتركيب الكلمات بالإضافة، وكرهه لتكوين الكلمات من خلال المزج والاختصار”[3]. وقد كان لقسم علم اللغة التطبيقي بمعهد تعليم اللغة العربية في جامعة الإمام محمد بن سعود جهودًا كبيرة ومتواصلة في حوسبة الصرف العربي، فأوجد عمل الدكتور “محمد الحنّاش” في القسم ابتداءً من عام 1997م حراكًا علميًا في مجال حوسبة اللغة العربية، ظهرت آثاره في عدد البحوث والرسائل التي نوقشت في القسم، حيث ظهر نوع جديد من البحوث اللغوية وثَّق الصلة بين اللغة والحاسوب. وقد أضحت دراسات وبحوث طلاب الدكتور (محمد الحناش)[4] أول الأعمال التي استعانت بالحاسوب، ووظَّفته لخدمة اللغة العربية، وكثير من هذه البحوث كانت تطبيقية الجانب. ومن أوائل هذه الدراسات ما قدمه الباحث (عبد العزيز المهيوبي) في عام 1999م من جهد لبناء “نظام تصريف للفعل الثلاثي في اللغة العربية” حيث استهدف الباحث بناء نظام آلي لتصرف الأفعال الثلاثية في اللغة العربية يقوم بتصريفها في الأزمنة كافة، ويسندها إلى ضمائر الرفع كافة. ثم بدأت الدراسات الصرفية، والصرف-نحوية تترى بإشراف الدكتور (محمد الحناش)؛ فعالج الباحثان ( أحمد الشيبان وعبد العزيز العسكر) في عام 2000م الجذور الثلاثية والرباعية معالجة تطبيقية ببناء قاعدة بيانات للمصادر في اللغة العربية، وفي عام 2011م نهج (خالد الصقير) نهج سابقَيه فتمكن من بناء قاعدة بيانات للبنية الفعلية البسيطة المتعدية بحرف الجر للفعل الثلاثي الصحيح المجرد، وفي العام نفسه قام الباحثان (أحمد المطرودي وناصر الهويريني) ببناء قاعدة بيانات للمشتقات في اللغة العربية، فعالجا الجذور الثلاثية معالجة تطبيقية، وفي العام نفسه أنجز الباحث (صالح العصيمي) قاعدة بيانات لمشتقات الجذور الثلاثية، وفي العام نفسه أيضا سعى الباحثان (عبد العزيز العبداللطيف ومحمد السلطان) إلى بناء قاعدة بيانات شاملة للأسماء الجامدة، تكون على شكل معجم آلي ينتج عن تطبيق خوارزميات التوليد على الجذور العربية، ووظَّف الباحثان في ذلك برنامجًا حاسوبيًا للإدخال والتوليد.
توقفت دراسات حوسبة اللغة العربية بعد مغادرة الدكتور (محمد الحناش) ثم عاد تيار الحوسبة للظهور في عام 2012م فأنجزت الباحثة (أفراح التميمي) خوارزمية حاسوبية للتوليد والتحليل الصرفيين في باب النسب، بعد أن حصرت القواعد الصرفية التوليدية في باب النسب، ووصَّفَتْها، ورَمَّزِتْها توليدًا وتحليلًا، في طوري التشكيل وغيابه، وبعدها بثلاثة أعوام تمكن الباحث (عبد العزيز المهيوبي) من بناء قاعدة بيانات تتضمن جذور اللغة العربية وأفعالها، وقد اعتمد في استقصاء الجذور والأفعال على معجم تاج العروس، وثلاثة معاجم أخرى هي: تكملة المعاجم العربية لرينهارت دوزي، وتكملة معجم تاج العروس لوهيب دياب، والمعجم الكبير حتى حرف الذال، من شأن قاعدة بيانات الجذور والأفعال هذه أن تيسر عمل الحاسوبيين لميكنة المعجم العربي.
من خلال ما سبق يتضح لنا أن جهود حوسبة الصرف العربي في جامعة الإمام محمد بن سعود قد شهدت من عام 1997م إلى عام 2000م سلسلة من الدراسات والبحوث العلمية لبناء قواعد بيانات صرفية ضخمة. بينما حدثت النقلة المهمة عام 2012م، وجاءت على مستوى بنية الكلمة وتوليدها حاسوبيًا، فسعت بحوث الدارسين إلى تفعيل القدرة التوليدية الخلاقة للغة العربية.
بعد أن استعرض الباحث جهود جامعة الإمام في معالجة الصرف آليًا، فإنه سيحاول أن يعرض جهود بعض الباحثين في الجامعات الأردنية، فقد أنجز الباحثون في تلك الجامعات مشاريع مهمة في حوسبة اللغة العربية؛ ففي عام 2005 م وَصَّفت الباحثة (هدى آل طه، الجامعة الأردنية) جموع التكسير في ضوء اللسانيات الحاسوبية، محاولة إعادة النظر في وصف النظام الصرفي للعربية، بما تقتضيه حاجة اللغة للحوسبة، وفي عام 2011م وَصَّف الباحث (محمود خليل، الجامعة الأردنية) إسناد الأفعال إلى الضمائر في ضوء اللسانيات الحاسوبية، في محاولة لإعادة النظر في وصف إسناد الأفعال إلى الضمائر في العربية، بما تقتضيه حاجة اللغة لتمثيلها حاسوبيًا. أما في جامعة اليرموك فتمكنت الباحثة (صفا الشريدة) في عام 2009م من برمجة أسماء الفاعلين والمفعولين حاسوبيًا، بهدف جعل الحاسوب قادرًا على اشتقاق أسماء الفاعلين والمفعولين وتحليلهما؛ لمساعدة المتعلم في تقويم إنتاجه اللغوي، وفي العام نفسه وَصَّف الباحث (عزت العجوري، الجامعة الهاشمية) شعر بدر شاكر السيّاب توصيفًا صرفيًا في ضوء اللسانيات الحاسوبية، وفي عام 2010م استطاع الباحث (مسفر الدوسري، جامعة اليرموك) حوسبة أكثر من مائة قاعدة حاسوبية للنسب بالياء، كما عالج كثير من الكلمات الشاذة بحفظها في قاعدة البيانات، وفي العام نفسه برمج الباحث (أحمد الخلوف، جامعة اليرموك) اشتقاق المصادر في العربيّة حاسوبيّا.
أمّا في جامعة القاهرة فقد درس الباحث (محمد المرشدي) في عام 1998م مصادر الفعل الثلاثي المجرد القياسية والسماعية دراسة نظرية وتطبيقية باستخدام الحاسوب؛ فجمع مصادر الأفعال الثلاثية من نصوص حديثة، لتوضيح اتجاه الاستعمال الحديث لها، ثم وصفها وصفًا إحصائيًا دقيقًا، وفي عام 2003م درس الباحث (محمد العربي، جامعة القاهرة) منظومة الصرف العربي والمعالجة الحاسوبية، دراسة تقويمية.
ومن جهود جامعة سيدي محمد بن عبدالله (المغرب) في حوسبة الصرف ما قدَّمه الباحث (عمر مهديوي) في عام 1999م حيث سعى في دراسته “توليد الأسماء من الجذور الثلاثية المعتلة، مقاربة لسانية حاسوبية” إلى معالجة توليد الأسماء البسيطة من الجذور المعتلة، مركِّزًا على الزوائد التصريفية التي تدخل على بنية الجذر، سواء أكانت سوابق أم أواسط أو لواحق، فقد كان الدكتور (مهديوي) من أوائل الباحثين الذين اهتموا بحوسبة اللغة العربية، وفي عام 2007م صاغ الباحث (الحسن أمراني، جامعة سيدي محمد بن عبدالله) القواعد الصرف – صوتية للمشتق في اللغة العربية صياغة لسانية حاسوبية من خلال مجموعة من النماذج التطبيقية. ونلحظ من خلال ما أوردناه من دراسات ومشاريع في معالجة الصرف في اللغة العربية، أنَّها تناولت الجانبين النظري والتطبيقي من حوسبة اللغة.
وكان للجامعات السورية جهودا في تحليل كلمات اللغة العربية؛ فأنجزت الباحثة (هنادي عميش، جامعة دمشق) معجمًا لجذور الأفعال الثلاثية والرباعية، وصمَّمت خوارزمية لتجذير الفعل، وتوليد الماضي والمضارع والأمر؛ ليتم توظيفها في بناء محلل صرفي كامل يستخدم في بناء الشكل الآلي للنصوص العربية، وقد هدف البحث للوصول إلى تخاطب مباشر مع الحاسوب.
[1] هناك تداخل شديد بين مستويات اللغة العربية؛ حيث يتداخل المستويان الصرفي والصوتي -مثلا- ويبدو ذلك واضحًا في كثرة حالات الإعلال والإبدال عند اشتقاق الكلمات مثلا.
[2] يُنظر: نبيل علي (ت: 2016م)، اللغة العربية والحاسوب – دراسة بحثية، تعريب، د.ط، الكويت، 1988م ، ص131-132.
[3] يُنظر: المرجع السابق، ص270-271.
[4] يُعد الدكتور محمد الحناش من أوائل الباحثين في هندسة اللغة العربية، والداعين إلى تطويع الحواسيب لخدمتها، وذلك من خلال أبحاثه ودراساته المنشورة في الكتب والدوريات المختلفة.