بحوث في اللسانيات الحاسوبية

توظيف المدونات اللغوية واستخدامها في تدريس اللغة الثانية والترجمة

فهيم أحمد

مما لا شك فيه أن اللغة نعمة من نعم الله تعالى التي أعطاها للناس وذلك للتواصل والتفاهم فيما بينهم ونقل أفكارهم ومشاعرهم إلى الآخرين. تطورت اللغة مع تطور الشعوب الإنسانية واتسعت معها حتى أصبحت هناك آلاف اللغات واللهجات في العالم مع مرور الزمن وتعدد اللغات. احتك متكلمو مختلف اللغات لأسباب متعددة مثل الاقتصاد والسياسة وتبادل الثقافات والحرب وما إلى ذلك من الأسباب الأخرى للاحتكاك.1

بدأ الناس اهتمام تعلم اللغات غير لغتهم الأم كما بدأوا ترجمة العلوم من لغة إلى أخرى. بعد ازدهار العولمة والتقدم في مجال التكنولوجيا خاصة الحاسوب ازدادت وسائل التعلم والتعليم والمصادر الأخرى. وبدأ الطلاب والمدرسون والباحثون استخدام التكنولوجيا في عملهم العلمي والبحثي. حتى أصبحت الحاسوب جزءاً لا يتجزأ لمجال التعليم والتعلم كما أصبحت مهمة لعملية الترجمة. في هذه الرسالة البحثية أقدم أمامكم تعريفاً موجزاً للمدونات اللغوية التي هي جزء مهم للسانيات الحاسوبية وتوظيف هذه المدونات في تعليم اللغة الثانية والترجمة.

تطورت ظاهرة لسانيات المدونات بشكل ملحوظ خلال القرن الماضي. قام صانعو المعاجم والعاملون في مجال اللغة بجمع الأمثلة للكلمات والعبارات المستخدمة في كل من الشكلين المنطوقة والمكتوبة لتحديد الكلمات بدقة منذ أواخر القرن التاسع عشر. بعد ظهور أجهزة الحاسوب، أصبح الجمع والعملية ذات الصلة أمرًا سهلاً للغاية؛ أدى ذلك إلى جمع مجموعة من الكلمات والنصوص إلكترونيا التي يطلق عليها اسم “مدونة“. فما هي هذه المدونة:

تعريف المدونات اللغوية (Corpus):

لغة: اسم مفعول مشتقٌّ من دوّن يدوّن تدوينًا بمعنى كتب. والفعل دون) مشتقٌّ بدوره، من كلمة فارسية معربة هي ديوان) التي استعملها العرب لتدل على الدفتر التي تكتب فيه أسماء العمال والجند وأهل العطية، وكذلك على المكان التي تُحتفظ فيه هذه الدفاتر. ودون الكتب والصحف: جمعها ورتّبها. ويقال إن الخليفة عمر بن الخطاب أول من دون الدواوين في الدولة الإسلامية، أي أنشأها ونظّمها2 .

اصطلاحا: توجد هناك تعاريف عديدة للمدونات اللغوية ومنها:

يعرف د. علي القاسمي المدونة بأنّها مجموعة من النصوص تمثّل اللغة في عصر من العصور، أو في مجال من مجالات استعمالاتها، أو في منطقة جغرافية معينّة، أو في مستوى من مستوياتها، أو في جميع عصورها، ومجالاتها، ومناطقها، ومستوياتها. والمدونة إما أن تجمع يدويا وتقرأ ورقيا، وإما كما هو الشائع حاليا_ تُخزن في الحاسوب وتُعالج وتقرأ إلكترونيا3.

ويقول كروغ (Kruger) في رسالته البحثية “Corpus Based Translation Research”: يعني المدونة اللغوية مجموعة من النصوص المخزونة إلكترونيا، يمكن تحليلها والاستفادة بها أوتوماتيكيا أو شبه أوتوماتيكيا بدلا من تحليلها يدويا. تحتوي على النصوص المكتوبة والمنطوقة من عد مصادر مختلفة وموضوعات مختلفة.

ولعل أبسط تعريف للمدونة اللغوية هو أنه مجموعة من النصوص اللغوية الشفوية أو المكتوبة والموثقة (من حيث المصدر والتاريخ والنوع وما إلى ذلك من التحشيات الأخرى)4

وهناك تسميات أخرى مستخدمة في نفس المعنى مثل المدونة النصية والمكنز والذخيرة اللغوية. وإن “المدونة” في سياق لسانيات المدونات اللغوية يقصد بها المدونة اللغوية المحوسبة، أي المخزنة رقميا في الحاسوب. لذلك نجد بعض للغويين الذين يتحدثون عن لسانيات المدونات باسم لسانيات المدونات الإلكترونية (Electronic Corpus Linguistics).

وأما العلم الذي يدرس الظاهرة اللغوية من خلال مدونة أو مجموعة كبيرة من النّصوص التي يمكن قراءتها آليا أي؛ في نصوص مقتبسة من العالم الحقيقي. وهذا المصطلح يرتبط ارتباطاً وثيقاً باستخدام الحاسوب حتى أن كثيرا من اللغويين يعرفون هذا العلم بأنه: “مجموعة من النّصوص المحوسبة التي يمكن قراءتها إلكترونيا من أجل البحث اللّغوي“. ولسانيات المدونة ليس مجرد الحصول على البيانات والأمثلة الحية بواسطة الحاسوب، وإنّما هي في حقيقتها دراسة وتحليل تلك البيانات والنصوص بعد الحصول عليها من المدونة. فمهمة لسانيات المدونة هي التحليل والتطبيق في البحوث اللغوية المختلفة.5

على مر السنين وقد ساهم العديد من العلماء واللغويون في تطوير علم المدونات اللغوية. ومن أسماء المساهمين البارزة هي Leech وBiber وJohanson وFrancis وHunston وConrad وMcCarthy الخ. وقد قدم هؤلاء العلماء مساهمات كبيرة في مجال لسانيات المدونات.

فكان أول مدونة إلكترونية مدونة براؤن (Brown) الذي تم إعداده في عام 1961على يد هنري كوسيرا ودبليو نيلسن. تتألف هذه المدونة من مليون كلمة. اليوم المدونات العامة تحتوي على مئات الملايين من الكلمات في الحجم. وبعض من أبرز المدونات اليوم تشمل مدونة اللغة الإنجليزية الأمريكية المعاصرة (400 مليون كلمة)، ومدونة اللغة الإنجليزية الأمريكية التاريخية (COCA) (400 مليون كلمة)، والمدونة الأمريكية الوطنية (22 مليون كلمة)، بنك اللغة الإنجليزية (4.5 مليار كلمة)، والمدونة البريطانية الوطنية (100 مليون كلمة) وغيرها من المدونات.

وأبرز المدونات العربية هي:

المدونة اللغوية العربية لمدينة الملك عبد العزيز للعلوم والتقنية (أكثر من مليار كلمة)

مدونة مشروع معجم الطلاب (السعودي) (٣ ملايين كلمة)

المدونة اللغوية العربية الدولية (International Corpus of Arabic)

مدونة صخر – 500 مليون كلمة

مدونة (ArTenTen) – وهي مدونة إلكترونية مركبة في موقع Sketch Engine. تحتوي هذه المدونة على أكثر من 5.8 مليار كلمة.

وكذلك هناك كثير من المدونات مثل مدونة الشعر الجاهلي ومدونة الكلمات القرآنية ومدونة اللغة الصحفية وما إلى ذلك.

أنواع المدونات:

هناك أنواع مختلفة كثيرة للمدونات اللغوية من حيث المواد واللغة والمجال العلمي وكيفية الاستخدام. والأنواع التي تهمنا بالنسبة لهذه الدراسة هي:

المدونة الأحادية اللغة (Monolingual Corpus): أي المدونة التي تحتوي على نصوص لغة واحدة فقط. والمثال على ذلك British National Corpus, American National Corpus وغيرها من المدونات.

المدونة المتوازية (Parallel Corpus): تشتمل على مجموعة من النصوص المتماثلة بلغتين مختلفين (مثلا أحد النصين ترجمة للنص من لغة أخرى).

المدونة المقارنة (Comparable Corpora): مجموعة من النصوص التي تم إعدادها بشكل مستقل في اللغة المعنية ويتم وضعها معا على أساس 6التشابه بين المحتوى والمجال والوظيفة التواصلية.

مزايا المدونات اللغوية:7

تتسم لسانيات المدونات المحوسبة بمزايا كثيرة، ولعل من أهمها ما يلي:

إنها عملية وتجريبية، مبنية على نصوص حقيقية للاستعمال اللغوي، وليس على الحدس الشخصي. وتدرس نماذج واقعية للغة أو التركيب.

الحجم الكبير للنصوص أو المدونات التي تخضع للبحث والتحليل.

التنوع المبنى على أسس علمية لنصوص المدونة لتمثل استخدامات اللغة المختلفة، وذلك بمراعاة التمثيل الجغرافي والتاريخي والنوعي (الأسلوبي مثلا) للغة واستعمالاتها المختلفة. (غير أن ذلك يعتمد بالطبع على التصميم والاختيار الجيدين من قبل معد(ي) المدونة اللغوية.)

سهولة الحصول على النصوص والمدونات (بصور مختلفة: أقراص مضغوطة CD، على الشابكة (الإنترنت)) أو في صورة نصوص إلكترونية / رقمية، وباستخدام قارئة المحارف البصرية OCR لتحويل النصوص المطبوعة إلى نصوص رقمية)، مما جعل بناء المدونات أمرا ميسورا.

الاعتماد على أساليب التحليل الكمية (الإحصائية، مثل شيوع كلمة أو تركيب ما في نص أو نصوص مختلفة) والكيفية (التفسير والاستنتاج، مثل تفسير سبب كثرة استعمال كلمة أو تركيب ما في أنواع النصوص المختلفة).

إمكانية التثبت من صحة القواعد المبنية على الحدس والتخمين في ضوء الاستعمال الواقعي للغة، من ثم التعرف على دقة تلك القواعد من حيث وصفها للاستعمال اللغوي.

الكشف عن مزيد من المعلومات المعجمية والنحوية وغيرها في ضوء النصوص المتاحة في المدونة. فقد ثبت مثلا في البحث المبني على المدونات أن كثيرا من الألفاظ لها معان تزيد عما يرد عادة في المعاجم المعروفة.8

الوظائف التي تقوم بها المدونات اللغوية:

المدونة في حد ذاتها لا تفعل شيئا إذ أنها مجرد مخزونة للغة المستخدمة أي اللغة الطبيعية. وكل ما تفعله هي البرمجيات الحاسوبية التي تستخدم لتحليل المدونات. فبمساعدة هذه البرمجيات يمكن القيام بالوظائف اللغوية التالية:

تردد الكلمات: يمكن معرفة تردد أو حدوث كلمة ما في مدونة أو في جزء من المدونة على سبيل المثال يمكن أن نعرف تردد كلمة “سياسة” في مدونة خاصة أو جزء خاص من المدونة. وهكذا اللغة الانجليزية الكلمة الأكثر ترددا هي كلمة “The”.9

فهم السياقات (Concordance): يمكن استخدام المدونات من برنامج كشاف سياقي (Concordancing programme). هذه البرامج تقدم للباحث أمثلة عديدة مختلفة لاستخدام الكلمة في المدونة كما تقدم الجمل حيث تم استخدام تلك الكلمة.10

مصاحبة لفظية (Collocation): وهي الميول الإحصائي لكلمة أو كلمات للحدوث معا. وتعني أنه يمكن لنا أن نطلع على تردد كلمة ما مع أي كلمة أو كلمات أخرى وما هي معدل هذا التردد. مثلا كلمة shed الإنجليزية مع light, tear, garden, jobs, blood. وفي كل هذه المصاحبات تدل كلمة shed على معان مختلفة.11

كيف يتم استخدام المدونات في تعليم اللغة والترجمة:

تستخدم المدونات في مختلف المجالات العلمية واللغوية والتدريسية. نناقش هنا إثنين منها:

المدونات في تعليم اللغة

المدونات في تدريس الترجمة

أولاً. المدونات في تعليم اللغة الأجنبية:

إن الحاسوب دخل حقل اكتساب اللغة الثانية وتعليمها على وجوه متعددة؛ فهو أداة بحثية مهمة في دراسة موضوعات كثيرة في تعليم اللغة الثانية ومراقبة اكتسابها وحساب ذلك كميًّا. وكذلك هو أداة تعليمية مباشرة؛ فهو وسيلة نستعين بها لتيسير تعليم اللغة الثانية وتوفير بيئة تعليم مستمر ودائم طوال اليوم؛ بما ننجزه من برامج تخزين حاسوبي للنصوص والتدريبات والاختبارات الإلكترونية، ومواقع التعليم المجانية المتنوعة… إضافة إلى مصادر التعلم المفتوحة على الشابكة؛ كالمواد الأصيلة من الأفلام والمحاضرات والندوات.

ومع كل ما تقدم فإن مجال تعليم اللغة العربية لغةً ثانية ما يزال بحاجة ماسة إلى استثمار الحاسوب واللسانيات الحاسوبية استثمارًا فاعلاً. إن ما أقصده على وجه الدقة هو استثمار لسانيات المدونات (المتون) وما تتيحه من خيارات وإمكانات فذة يمكن أن تُحْدِث تحولات جذرية في مجال تعليم اللغة الأجنبية، وسأعتني هنا بالحديث عن مدى فائدة المدونات في هذا المجال.

إن إنجاز مدوَّنة للغة المتعلم على نحو منظَّم ومدروس يمكِّن المعلم الباحث والقائمين على تدريس اللغة الأجنبية من اتخاذ قرارات مهمة تتعلق بعملية التدريس وعناصرها كلها بدءًا من تصميم مواد تعليمية وانتهاء بتنفيذ المهام التعليمية المتنوعة. ويمكن لنا أن نستفيد من المدونة في جوانب تطبيقية متنوعة منها:

بمساعدة تحليل المدونة يمكن معرفة الكلمات الأكثر ترددا في أي مجال. فحينما يتعلم طالب لغة أجنبية فمن الأحسن أن يتعلم الكلمات الأكثر ترددا لكي يستفيد منها أكثر نطقا وكتابة.

مقارنة لغة المتعلم بلغة الناطقين الأصليين لفهم وجوه افتراق لغة المتعلم عن لغة الناطق الأصيل وتعرُّف أسباب تلك الاختلافات، ومحاولة تبيُّن الصعوبات التي يواجهها المتعلم.12

في تدريس اللغة من الممكن أن تعطي المدونات معلومات عن كيفية عمل اللغة على سبيل المثال التردد اللغوي والسياق والمصاحبة اللغوية لكلمة ما.13

ويشجع الأساتذة الطلاب لاستخدام المدونة من تلقاء أنفسهم لفهم الفروق الدقيقة في استخدام الكلمات والمقارنة بين اللغات.14

النتائج المتخذة من المدونات تطبق وتستخدم بشكل حصري في تحسين المواد المرجعية للمتعلمين مثل القواميس والنحو. إذ أن القواميس المستندة على المدونات تقدم أهم استخدامات كلمة في الحالات الطبيعية للغة.15

وكذلك كتب النحو للمتعلمين تعتني بتقديم الأمثلة المستخدمة في اللغة الطبيعية.

تتأثر المدونة على طريقة التدريس ومحتوى التدريس. فالمدرس حينما يعد المحتوى للتدريس فيمكن له تحليل مدى فاعلية المحتوى بمساعدة المدونة من حيث استخدام المتعلم.

ثانياً. المدونات في الترجمة:

برزت بحث الترجمة المستند على المدونات اللغوية في أواخر التسعينيات من القرن العشرين على يد منى بيكر (Mona Baker) وهي التي عرفت استخدام المدونات في مجال الترجمة.16

توجد هناك مكتوبات كثيرة عن استخدام المدونات والكشاف السياقي لأغراض تدريس الترجمة. تؤكد هذه المكتوبات على الفوائد الرئيسية التي يمكن أن نتلقى عن طريق استخدام مختلف أنواع المدونات. تأتي هذه المدونات في إطار نوعين رئيسيين. (أ) المدونة المقارنة (ب) المدونة المتوازية

يمكن استخدام المدونة المتوازية لتعزيز فهم الطلاب للغة المصدر والنص المترجم وذلك عن طريق:

توفير المعلومات مثل السياقات والمصاحبات اللفظية وأمثلة التردد في اللغة الطبيعية التي لا توجد في القواميس.

مساعدة الطلاب في الحصول على معارف اللغة والثقافة المتضمنة في النص المصدر والنص المترجم.

ترويج معرفة اللغة في الطلاب فيما يخص بالسياق، نوع النص، المحاور أنواع الاستخدام لكلمة معينة.

يمكن استخدام المدونة كتدريب المترجمين كي يمكن استخدامها كمرجع للمترجمين المهنيين ويمكن استخدامها أيضاً كدراسة وتدريس عملية الترجمة.17

يتم استخدام المدونة المتوازية (parallel corpus) في مثل هذه التطبيقات والبرمجيات حيث يتم مواءمة مدونتين لطريقة يمكن تحديد ترجمة كل جملة في النص الأصلي مباشرة بدون أي صعبة. وتعطي هذه فرصة لمدربي الترجمة أن يلاحظ ترجمة كلمة معينة في سياقات مختلفة.18

يؤكد تحليل المدونة المتوازية أن المترجمين يترجمون وحدة أكبر ولا كلمة واحدة فقط. ورغم أن كلمة واحدة تحمل دلالات عديدة وعند الترجمة يتم تحديد دلالة واحدة حسب السياق. على سبيل المثال لكلمة “عمل” عدة معان مثل “Work” و“Labor”. والسياق سوف يقضي ما إذا كان المعنى هنا يدل على “Work” أو“Labor”.19

وهناك فوائد أخرى لاستخدام المدونات في تدريس الترجمة. الآن معظم شركات الترجمة في العالم يستخدمون نظام ذاكرات الترجمة (Translation Memory System) وهو نظام يساعد في جعل الترجمة أكثر سرعة واتساقاً كما يساعد في جعل الترجمة أكثر دقةً. فطلاب الترجمة الذين يأتون إلى ميدان العمل في المستقبل لا بد أن يعرفوا ويكونوا على علم عن هذه التكنولوجيا التي أصبحت الآن جزءاً لا يتجزأ لمجال الترجمة المهنية. وهذا ما يصفه “Kiraly” بـ “جلب مكان العمل في المنهج الدراسي“.20

خلاصة البحث:

لاحظنا أن مختلف أنواع المدونات مهم جدا في مجال تدريس اللغة الأجنبية وتدريس الترجمة إذ أنها توفر معلومات فذة عن طرق استخدام اللغة كما تساعد الباحث والمتعلم في اختيار الكلمات والعبارات المناسبة تحدثا وكتابة وترجمة. وعلينا بصفتنا مستقبل تدريس اللغة العربية والترجمة في الهند أن نحاول لفهم المدونات وكيفية الاستفادة منها كما نحاول حسب الاحتياج في حين نختار مواد للتدريس في فصول اللغة والترجمة. وكذلك بصفتنا طلاب اللغة العربية والترجمة يمكن الرجوع المدونات اللغوية المتوفرة مجانا على الانترنت لكي نفهم ونستفيد منها.


هوامش المقال:

1لمزيد من المعلومات عن أسباب الاحتكاك والتبادل اللغوي يرجى الرجوع إلى كتابي “علم اللغة و “فقه اللغة: لعلي عبد الواحد الوافي

2ابن منظور، لسان العرب، مادة (دون).

3علي القاسمي، علم المصطلح أسسه النظرية وتطبيقاته العملية، 2008، مكتبة لبنان ناشرون، ص 68

4مدونة الدكتور محمود اسماعيل صالح: ًصـ 2

5كمال لعناني: دور لسانيات المدونة الحاسوبية في ترقية ونشر المصطلح، صـ 3-4

6

7مدونة الدكتور محمود اسماعيل صالح: ًصـ 2

8Hunston (2002) Corpora in Applied Linguistics, 96-99

9المرجع السابق

10المرجع السابق

11المرجع السابق

12أ.د وليد العناتي – المدونات ودورها في تعليم العربية لغير الناطقين بها، الجزيرة 9 فبراير 2016

13S. Hunston: Corpus Linguistics, page 11-13

14المرجع السابق

15المرجع السابق

16Baker M: Corpus linguistics and translation studies: implications and applications, Francis & Tognini-Bonelli (eds.), 1993

17Cocile Frerot: Corpora and Corpus Technology for translation purpose in professional and academic environment. major achievements and new perspectives, University of Grenoble. PAGE: 2-11

18المرجع السابق

19المرجع السابق

20المرجع السابق

قائمة المصادر والمراجع:

إسماعيل، دكتور محمود. المدونات اللغوية العربية، بناؤها وطرائق الإفادة منها. 1 ط. الرياض: مركز الملك عبد الله بن عبد العزيز الدولي لخدمة اللغة العربية، 2015.

أغبر، بسام. “علم اللسانيات الحاسوبية.. تعريفه ومجالاته”، د.ت. تاريخ الوصول 9 يوليو، 2021.

الدكروري، أيمن. المدونات اللغوية ودورها في معالجة اللغة العربية. الرياض: مركز الملك عبد الله بن عبد العزيز الدولي لخدمة اللغة العربية، 2018.

العارف، بن حسن، وعبد الرحمن. “توظيف اللسانيات الحاسوبية في خدمة الدراسات اللغوية العربية جهودٌ ونتائج”. AL-Lisaniyyat 12، عدد 2 (25 ديسمبر، 2007): 11–44.

العناتي، وليد. “المدونات ودورها في تعليم العربية لغير الناطقين بها”، 2 سبتمبر، 2016. https://www.al-jazirah.com/2016/20160209/cu3.htm.

العناتي، وليد أحمد. “اللسانيات الحاسوبية العربية”. مجلة الزرقاء للبحوث والدراسات، 2005.

“المدونة اللغوية العربية الدولية”. تاريخ الوصول 10 يوليو، 2021. https://www.bibalex.org/ica/ar/about.aspx.

على، د. نبيل. اللغة العربية والحاسوب. مطبع التعريب، 1988.

Abdul Razak, Zainur Rijal. ‘Modern Media Arabic: A Study of Word Frequency in World Affairs and Sports Sections in Arabic Newspapers’. D_ph, University of Birmingham, 2011.

Al-Thubaity, Abdulmohsen O. ‘A 700M+ Arabic Corpus: KACST Arabic Corpus Design and Construction’. Language Resources and Evaluation 49, no. 3 (September 2015): 721–51. https://doi.org/10.1007/s10579-014-9284-1.

Baker, Mona. ‘Corpus Linguistics and Translation Studies: Implications and Applications’. In Researching Translation in the Age of Technology and Global Conflict, 9–24. Routledge, 2019.

———. ‘Corpus-Based Translation Studies: The Challenges That Lie Ahead’. In Somers, Harold (Ed.) Terminology, LSP & Translation, 175–86. Philadelphia/Amsterdam: John Benjamins, 1996.

Gouadec, Daniel. ‘Training Translators: Certainties, Uncertainties, Dilemmas’. Maia B., Haller J., Ulrych M.(a Cura Di), Training the Language Services Provider for the New Millennium, Oporto, Universidade Do Porto, 2002, 31–41.

Hatim, Basil, and Jeremy Munday. Translation An Advanced Resource Book. London & New York: Routledge. Taylor and Francis Group, 2004.

Munday, Jeremy. Introducing Translation Studies: Theories and Applications. 4th ed. London: Routledge, 2016. https://doi.org/10.4324/9781315691862.

Vintar, Spela. ‘Corpora in Translator Training and Practice: A Slovene Perspective’. In Incorporating Corpora, edited by Gunilla Anderman and Margaret Rogers, 153–67. Multilingual Matters, 2007.

Zanettin, Federico. ‘Corpora in Translation’. In Translation: A Multidisciplinary Approach, edited by Juliane House, 178–99. London: Palgrave Macmillan UK, 2014. https://doi.org/10.1057/9781137025487_10.

0 Reviews

Write a Review

مقالات ذات صلة

زر الذهاب إلى الأعلى