خصائص اللغة العربية وإشكالية معالجة اللغة العربية حاسوبياً
د. عبدالعزيز بن عبدالله المهيوبي
تبلغ عدد حروف اللغة العربية المنطوقة ثمانية وعشرين حرفاً (أما المكتوبة فهي 35 حرفا، بزيادة: آ، أ، إ، ؤ، ئ، ة، ى)، وتُكتب كلماتها من اليمين إلى اليسار، مع وجود العديد من الخطوط العربية، كالنسخ والرقعة والديواني والثلث. كما تتعدد طرق الكتابة بالعربية؛ فتُكتب مشكولة، ومشكولة جزئياً، وخالية من التشكيل. وتتغير أشكال الحروف في اللغة العربية بتغيّر موقعها في الكلمة. كما تتميز اللغة العربية بالمرونة النحوية[1].
تمثل السوابق واللواحق في اللغة العربية ثراءً لا حدَّ له؛ فيمكن من خلالها التعبير بالكلمة نفسها عن الإفراد، والتثنية، وضمائر الفاعل، والمفعول، والأزمنة، والاستفهام…، كما “يُمثل البناء النحوي للغة العربية عمقا دلالياً لا نظير له؛ حيث تقود حركات الإعراب المختلفة إلى حسم العديد من أوجه اللبس حسماً لا يدع مجالاً لسوء الفهم.”[2]
إشكالية معالجة اللغة العربية حاسوبياً:
تعد مسألة تطويع الحاسوب لمعالجة اللغة العربية أمراً ضروريا ومستعجلا لردم الفجوة[3] بين التقدم التقني في الغرب، وبين أمتنا العربية التي لها خصوصيتها وحضارتها. كما أنه الوسيلة الوحيدة التى تستطيع بها الأمة العربية مواكبة الانفجار المعرفي والمعلوماتي فى عصر الإنترنت الشاسع والفضاء الإلكتروني الرحب. فلا يستطيع أي مجتمع أو أمة -مهما كانت- أن تعيش بمعزل عن هذه الثورة المعرفية أمام اكتساح اللغة الإنجليزية لأغلب المراجع المعرفية والمعلوماتية الموجودة على الإنترنت، وانتشارها بشكل يهدد بسحق كل الأمم واللغات التى لا تستخدم تقنية المعلومات والحاسوب فى اللحاق بعصر المعلومات.
وعلى الرغم من التطبيقات التقنية الهائلة والسريعة التي تحققت في مجال العلوم الطبيعية والتطبيقية، ولا سيَّما معالجة اللغات وحوسبتها، فمازالت هناك الكثير من الصعوبات، والإشكاليات المتعددة التي تصادف حوسبة اللغة العربية على المستويين اللساني والحاسوبي. “فاللغة العربية تتميز بخصائص كثيرة تجعلها لغة قابلة للحوسبة، ومعاصرة للتقنيات الحديثة، وإن كانت معالجة الحاسب الآلي للغة العربية ليست بالأمر المستحيل إلا أنها ليست بالأمر اليسير، فصعوبات المعالجة تكمن في أن اللغة العربية لغة مترابطة ومتشعبة، يكثر فيها الاشتقاق والتصريف، ويحتل الإعراب فيها دورا أساسياً، و تلك تحديات معروفة ومدروسة بشكل عميق لدى المختصين في المعالجة الآلية للغة العربية، لذلك سنتعرض مباشرة إلى دور لغة التواصل العالمية في التعامل مع تلك التحديات على المستوى التركيبي، والدلالي، والصرفي العربي”[4].
1- مشكلات لسانيّة:
إنَّ تعدّد المناهج اللسانية واختلافها، وعدم وجود منهج معياري واحد، من أهم المشكلات في اللسانيات الحاسوبية. واللغة العربية تفتقر إلى منهج لساني متكامل الأبعاد، يمكن من خلاله إخضاعها للمعالجة الآلية، ناهيك عن غياب النسق المنظومي في تناول فروع اللغة العربية المختلفة، فمفهوم المنظومة اللغوية لم يستوعبه كثير من اللسانيين أو العاملين في العربية؛ فاللغة منظومة متكاملة تشمل الفروع اللغوية المختلفة: الصوتيات، والصرف، والتركيب، والدلالة، والمعجم.
اللغة العربية من أكثر لغات العالم وضوحاً؛ إذْ إنَّ مواطن اللبس فيها محدودة، ولعل ذلك راجع إلى ثراء اللغة بالمفردات، مع إمكانية استخدام الاشتقاق للتعبير عن كثير من المعاني، ومع ذلك فإننا نواجه صعوبة في معالجتها آلياً، وسبب هذه الصعوبة يعود إلى ظهور اللبس في كثير من الحالات بسبب قلة حركاتها, والاعتماد الكبير على حركات التشكيل، “فغياب تشكيل الكلمات، إمّا بصورة كاملة او جزئية، يُؤدي إلى ظهور حالات معقدة من اللبس، نظراً لتعدد احتمالات قراءة الكلمة”[5] فغياب حركات التشكيل يُشكِّل عقبة أساسية أمام معالجة النصوص العربية آلياً، وهي مشكلة ليست سهلة أو بسيطة، إذ تمثل عصب التحدي للمعالجة الآلية للغة العربية، ونحن في حاجة ماسّة إلى معالجة النصوص العربية بشكلٍ آلي، ووسيلة دقيقة لتشكيل النصوص تلقائياً، فعلى سبيل المثال كلمة (قاتل) يمكن قراءتها (قاتَلَ) لتعني الفِعْل، كما يمكن قراءتها (قاتِلٌ) لتشير إلى الاسم.
وعلى المستوى الصرفي تتصف اللغة العربية بالاشتقاق، ومع أنَّه اشتقاق غزيز فهو شبه منتظم. وهذا الانتظام يدفع بالصرف ليكون أكثر مستويات اللغة العربية قابلية للحوسبة، وخاصة في مرحلة التوليد الآلي للغة العربية.
يُضاف إلى ما سبق، عدم توافر صياغة دقيقة ومتكاملة لقواعد اللغة العربية. وصعوبة تحديد متعلقات الفعل العربي النحوية والدلالية؛ فاللغة العربية تتمتع بمرونة نحوية كبيرة؛ فالفاعل يمكن أن يأتي قبل الفعل أو بعده، وأحيانا يكون مستتراً، كما أنَّ المفعول به يمكن أن لا يأتي مباشرة بعد الفاعل.
مما سبق يتضح لنا أن لغتنا العربية تتميز بمجموعة من الخصائص على جميع المستويات اللغوية، تلك الخصائص التي قد تسهم في تعقيد معالجتها حاسوبياً، وقد تكون عوناً في تسهيل تلك المعالجة.
2- مشكلات حاسوبية:
تبرز أهم الصعوبات الحاسوبية في تعامل الآلة مع اللغة العربية في نواحٍ عدة منها: ” أنَّ تصميم الحاسبات كان في الأصل ملائماً للغة الإنجليزية، التي تختلف اختلافاً جوهرياً عن اللغة العربية، فرموز تبادل البيانات في الحاسبات مصممة للحروف الإنجليزية التي تتخذ شكلين للحرف الواحد فحسب، وتخلو من حركات التشكيل، كذلك فإنَّ وسائل عرض الحروف وطباعتها مصممة للحروف الإنجليزية. كما أنَّ صعوبة الوصول للبحوث والدراسات التي تهتم بتهيئة اللغة العربية ووضعها بالصورة الملائمة للحاسبات من الصعوبات أيضاً، لأنها الركيزة التي يحتاجها العاملون في مجالات تعريب الحاسبات. واللغة العربية لغة مترابطة ومتشعبة؛ يكثر فيها الاشتقاق، ويحتل الإعراب فيها دوراً أساسياً. وهذه الخصائص تحتاج قبل تطبيقها في الحاسب إلى إعادة صياغتها بشكل علمي دقيق، ليستطيع خبراء الحاسب برمجتها والاستفادة من الحاسب بالقدر الممكن في معالجتها.”[6]
كما أن الفهم الضيِّق للمعالجة الآلية للغة العربية من أهم مشكلات معالجتها حاسوبياً، ذلك الفهم الذي “لا يتجاوز القدرة على إدخال الحروف العربية من لوحة المفاتيح، وطباعتها على الورق، أو إظهارها على شاشة عرض الوحدة الطرفية”[7]، كما نجد أن التطبيقات الحاسوبية الجديدة في مجال اللغة العربية “خَلَقتْ مشكلات جديدة أضافت عبئاً جديداً إلى المشكلات القديمة لضعف التفاعل ما بين الجهات المستفيدة والأنظمة الجديدة، وذلك لأسباب عديدة أهمَّها قلة اهتمام المستفيدين من الأنظمة المبتكرة، وما تتطلبه من دقة في التعامل لم يتُعوّد عليها سابقاً، فضلاً عن سوء تصميم هذه الأنظمة، وتعريبها أساساً من قبل أخصائيين حديثي الخبرة”[8]
3- مشكلات عامة (تطبيقية منهجيَّة):
أ- قلة عدد مراكز البحوث الأكاديمية النظرية، والتطبيقية في مجال اللسانيات الحاسوبية، وندرة بحوثها، سواء أكان على المستوى الفردي أو الجماعي، وقلة انتشارها “ونحن في أمس الحاجة لدراسة ببيلوغرافية لحصرها، وذلك تحاشياً لتكرار البحوث، وهي ظاهرة متفشية في حقل تعريب الحاسبات”[9] واقتصار أقسام اللغة العربية في الجامعات على الجهد التدريسي، ومحدودية الإمكانيات المتاحة لمجامع اللغة العربية.
ب- الندرة في إنتاج البرمجيات الجاهزة التي تساعد على وضع إطار تقني من المعلومات من منظور اللغة العربية، وإضافة النماذج اللغوية، وتحليل فروعها المختلفة في ميادين الصرف الحاسوبيّ، والنحو الحاسوبيّ، والدلالة الحاسوبيّ، والمعجمية الحاسوبيّ، وذلك كله من أجل المواءمة بين المنظومات البرمجيّة وخصوصية اللغة العربية.
ج- قلة التعاون بين الحاسوبيين واللغويين العرب، وما نتج عنه من بعثرة الجهود العربية على المستويين النظري والتطبيقي، فكل باحث، وكل منظمة تعمل بمعزل عن غيرها. “إضافة إلى محدودية الدراسات في هذا المجال كمّا ونوعاً، فإنها تُعاني من ضعف الانتشار، وانعدام التكامل والتعاون بينها، ولا تكاد تتجاوز الملتقيات والندوات”[10] “فلا يمكن وضع البرمجيات المنشودة دون الاستناد إلى معرفة لغوية صرفية، ونحوية، ودلالية، تركيبية”[11]. وفي محاولة جادة لجمع شتات الجهود العربية في ميدان اللسانيات الحاسوبية، أعدَّ وليد العناتي وخالد الجبر (2007م) دليلاً للدراسات العربية المُنجزة في ضوْء اللسانيات الحاسوبية بقسميها العربي والإنجليزي، يتضمّن كلّ قسم بابين: أحدهما البحوث الملخصة، والثاني للفهارس، وقد وقفا في كتابهما على أغلب الأبحاث والدراسات المُقدَّمة في اللسانيات الحاسوبية حتى تاريخ إعداد الكتاب (2007م).
د- “الطابع التجاري الذي أصبح يحكم ضرورة الإنجاز الحاسوبي، وجَعَلَ من حقل اللسانيات الحاسوبية حقلاً تجارياً يخضع لسوق العرض والطلب، ومرجع ذلك طبيعة اللغة العربية الثرية والمرتفعة المستوى، وقلة الأبحاث الأكاديمية التقنيّة بها، ولذلك كان على الشركات المطوّرة لتقنيات اللغة العربية، إجراء أبحاث أكاديمية مكلفة، في علوم اللغويات والرياضيات والصرف، لا تستطيع تحمل تكلفتها إلا الشركات الكبيرة، ومراكز البحث العلمي والجامعات”[12] لذا يرى الدكتور نبيل علي أن احتلال العراق لدولة الكويت قد وجَّه ضربة قوية لحوسبة اللغة العربية، التي كان معظمها يجري في دولة الكويت.
هـ – قلة الدعم المادي اللازم للقطاع المهتم بمعالجة اللغة العربية، وحوسبتها آلياً.
و- “الانفصال بين النظري والتطبيقي في مجال اللسانيات الحاسوبية، وذلك نتاج الانفصال بين نظر اللغوي، وتطبيق الحاسوبي. فلا يُعقل أن ينهض المرء لمعالجة العربية بالحاسوب، وهو يفتقر إلى الحدّ الأدنى من المعرفة اللغوية”[13].
[1] ونعني بالمرونة النحوية: الحرية التي نلحظها في ترتيب الكلمات داخل الجملة العربية.
[2] يُنظر: عجماوي، علاء الدين، المعالجة الآلية للغة العربية بين الواقع والتحديات، عمّان، الموسم الثقافي التاسع عشر لمجمع اللغة العربية الأردني، 2001م.
[3] شاع استخدام مصطلح “الفجوة الرقمية” في خطاب التنمية المعلوماتية، ويقصد به تلك الهوة الفاصلة بين الدول المتقدمة، والدول النامية في النفاذ إلى مصادر المعلومات والمعرفة، والقدرة على استغلالها.
[4] يُنظر: الأنصاري، سامح، ناجي، مجدي، عدلي، نهى، النظام العربي للغة التواصل العالمية، المؤتمر الدولي لعلوم الحاسوب باللغة العربية، 2011م.
[5] بشير، محمد أبو الحاج، المعالجة الآلية للغة العربية-جهود الحاضر وتحديات المستقبل، مجلة لغة العصر، عدد اغسطس 2008م.
[6] العجيلي، عبده ذياب، الحاسوب واللغة العربية، ص15.
[7] علي، نبيل، اللغة العربية والحاسوب، ص65.
[8] الغوثاني، راتب مزيد، البعد الثقافي والاجتماعي والاقتصادي لاستعمال اللغة العربية في المعلوماتية، مجلة استخدام اللغة العربية في المعلوماتية، تونس، المنظمة العربية للتربية والثقافة والعلوم-إدارة الثقافة، 1996م، ص245.
[9] علي، نبيل، اللغة العربية والحاسوب، ص71.
[10] الخطيب، حسام، العربية في عصر المعلوماتية، تحديات عاصفة ومواجهة متواضعة، مجلة التعريب، المركز العربي للتعريب والترجمة والتأليف والنشر، العدد15،ص83.
[11] أبوهيف، عبدالله، مستقبل اللغة العربية: حوسبة المعجم العربي ومشكلاته اللغوية والتقنيّة أنموذجاً، مجلة التراث، العدد93، 2004م، ص118.
[12] يُنظر: صالح، عالية، حوسبة العربية: نحو لغة قادرة على التغيير، الموسم الثقافي الرابع والعشرون، مجمع اللغة العربية الأردني.
[13] يُنظر: البواب، مروان، والطيّان، محمد، أسلوب معالجة اللغة العربية في المعلوماتية (الكلمة – الجملة)، استخدام اللغة العربية في المعلوماتية.