اللّغة العربيّة والحَوْسَبة
د. عبد الإله الديوه چي*
عُرفت اللّغة العربيّة لدى العرب قبل ظهور الإسلام بأنّها لغة تتناقلها الألسن والأجيال شفهيّاً، وعندما تُكتب كانت حروفها غير منقوطة وكلماتها وجملها غير مشكولة. وقد أُكْمل جمع القرآن، غير منقوط وغير مشكول، بعد أكثر من 12 سنة من وفاة نبيّ الإسلام الأكرم محمّد في عهد الخليفة عثمان بن عفّان.
وقيل إنّ أبا الأسود الدُؤلي (16 هـ - 69 هـ)، وهو ظالم بن عمرو بن سفيان، وُلد في الكوفة ونشأ في البصرة، هو مَن وضع عِلم النحو، وشكّل المصحف. وقيل إنّ عليّاً بن أبي طالب وضع له: الكلام كلّه ثلاثة أضرب: اسم وفعل وحرف، ثمّ رفعه إليه وقال له: تمِّم على هذا. إذ يُروى أيضاً أنّ حديثاً دار بين الدؤلي وابنته ما جَعَلَه يهمّ بتأسيس عِلم النحو، وذلك عندما خاطبته ابنته بقولها ما أجملُ السماء (بضمّ اللّام لا بفتحها) فأجابها بقولِه (نجومها) فردّت عليه بأنّها لم تقصد السؤال، بل عنت التعجُّب من جمال السماء، فأدرك حينها مدى انتشار اللّحن في الكلام وحينئذ شرع بوضْعِ النحو. وسمّي النحو نحواً، لأنّ أبا الأسود قال: استأذنتُ علي بن أبي طالب أن أضعَ نحو ما وضع، فسمّي لذلك نحواً.
تَبع أبا الأسود كثيرٌ من المُهتمّين باللّغة العربيّة وتطويرها كالفراهيدي (الذي وضع قواعد اللّغة العربيّة قبل قرون من وضْعِ الألسني الأميركي نعّوم تشومسكي قواعد مُماثِلة للّغة الإنكليزيّة في القرن الماضي)، وسيبويه، وابن جنّي، وغيرهم. فكُتب القرآن بعد ذلك منقوطاً مشكولاً، ولم يَتّهم الناسُ في ذلك الزمان هؤلاءَ المُطوّرين العُلماء بأنّهم أخلّوا بقدسيّة القرآن أو تجاوزوها. فقد ميَّز ابن خلدون بين اللّغة والكتابة والخطّ، لكنّ كثيرين منّا يخلط بينها ويضفي القدسيّة اعتباطاً على الخطّ والكتابة واللّغة، ما مَنَعَ التطوُّرَ في اللّغة والكتابة وتبسيطهما منذ ذلك التاريخ وحتّى يومنا هذا.
ومع أنّ الطباعة الميكانيكيّة ظهرت في أوروبا في العام 1439، إلّا أنّها لم تُستخدم للّغة العربيّة حتّى سنة 1798 بعد حملة نابليون على مصر، أي بعد ثلاثة قرون، وذلك بسبب مُعارَضة بعض رجال الدّين ممَّن آمَنَ بقدسيّة الخطّ والكتابة ومانَعَ التغيير. واضْطرّت الشركات المُصنِّعة لأجهزة الطباعة، ومن ثمّ الأجهزة الحاسوبيّة خلال العقود الأخيرة، التزام الحروف التي تُكتب باليد أساساً لتحديد أشكالها بحسب مواقعها في الكلمة إرضاءً للمُتشدّدين، على عكس ما حصل في أوروبا في اعتماد أشكالٍ موحّدة للحروف الطباعيّة لا تتغيّر بحسب مواقعها في الكلمات. واعتُبر التشكيل اختياريّاً في طباعة النصوص ليجعل من العربيّة لغةً صعبة في التعلُّم والتعليم، والإلقاء، والتأليف، والترجمة. فالنصوص العربيّة يجب أن تُفهم أوّلاً كي تُقرأ.
اللّغة والتقنيّات
لا شكّ في أنّ شعبيّة أيّ تقنيّة مُرتبطة بخصوصيّات المجتمع الذي تنتشر فيه، وتقنيّة المعلومات، أكثر من غيرها من التقنيّات، مرتبطة ارتباطاً عضوياً باللّغة السائدة في المُجتمع المستخدِم لها. ذلك لأنّ مُدخلات ومُخرجات هذه التقنيّة هي المعلومات، والمعلومات المُتداوَلة في مُجتمعٍ ما يجب أن تكون بلغة المُجتمع نفسه. وقد يبدو لغير المُختصِّين أنّ البلدان العربيّة تملك من القدرة الاقتصاديّة والسكّانيّة ما يجعلها متمكّنة من فرْضِ احتياجاتها على مصنّعي الأجهزة والبرمجيّات والباحثين من عرب وغيرهم، إلّا أنّ هذا لم يكُن صحيحاً في الماضي وما زال كذلك إلى حدّ كبير حتّى الآن، مع أنّ بعض الإنجازات الإيجابيّة قد تحقَّق في هذا الجانب، وذلك بسبب الخوف من المسّ بقدسيّة الدّين والتاريخ، ما أدّى بأجيال القرنَيْن الماضي والحالي إلى عدم الاهتمام باللّغة العربيّة واعتبارها لغة لا تتماشى مع التطوّرات العلميّة والتقنيّة الحديثة. والحقيقة أنّ الناطقين بها، وعلماءَها هُم المسؤولون عن تهميشها. وتهميش اللّغة العربيّة مُستمرٌّ وبشكلٍ مُتسارع عند العرب حتّى يومنا هذا.
من نتائج التهميش أنّ الدول العربيّة لم تستطع منذ ستينيّات القرن الماضي ولفترةٍ طويلةٍ اعتماد شيفرة (يقال إنّ أصل كلمة شيفرة من الكلمة العربيّة “جفرة”. والجفر عِلم يبحث عن الحروف من حيث دلالاتها ويُقال أيضاً إنّها مشتقّة من كلمة “صفر”) موحّدة للحروف والرموز العربيّة. ومع أنّ الشيفرة ليست هدفاً بذاتها، بل وسيلة للانطلاق نحو مجالاتٍ أكثر أهميّة تكون اللّغة العربيّة فيها مُستلزماً أساسيّاً للتعامل بها مع الحاسوب وما شابهه من المعدّات والعُدد لكنّها أساسيّة للمُعالجات الآليّة وسيروراتها. والحروف العربيّة لا تحتلّ الآن مواقع متسلسلة في جداول الشيفرات الدوليّة، ما يحدّ من كفاءة المُعالَجة اللّغويّة للنصوص.
من ضمن المعوّقات التي حالت دون الوصول إلى الشيفرة العربيّة الموحّدة الخلط ما بين طُرق الكتابة واللّغة، والتشبُّث ببعض الخصائص الثانويّة للّغة العربيّة وجعْلها خصائص أساسيّة. كذلك الاهتمام بأشكال الحروف وتغيّرها من موقع إلى آخر من الكلمة من دون الاهتمام بالمحتوى اللّغوي للنصّ.
ومع أنّ هناك ضرورة لتطويع التقنيّات لتتماشى مع اللّغة، إلّا أنّ الإيمان المطلق بهذا الشعار من دون القبول بالتفاعُل المُتوازن ما بين اللّغة والتكنولوجيا قد يكون مكلفاً من الناحيتَيْن الثقافيّة والاقتصاديّة. إنّ التقيُّدَ بأشكالٍ للحروف وفرْضَها بطريقةٍ تعجيزيّة، والخلْطَ ما بين فنّ الزخرفة والخطّ، وما بين المحتوى الأساسي للّغة كوسيلةٍ للاتّصال والتفاهُم ونشْر المعرفة، قد أدّى إلى تخلُّف دخول اللّغة العربيّة على نطاقٍ واسع في الكثير من تقنيّات المُعالَجة الآليّة منذ عهد الطباعة والآلة الكاتبة. فقد أصبحت الحروف العربيّة وأعدادها وغياب التشكيل معوّقات حقيقيّة لانتشار اللّغة العربيّة وتعليمها وتعلّمها بكفاءة وفاعليّة تمشّياً مع عصر الحواسيب، وثورة المعلومات، والمعرفة، وصناعتها.
وبسبب التأخُّر في وضْعِ القياس الموحّد للحروف العربيّة وحركاتها، تأخَّرت البحوث والدراسات والتطبيقات التي تخدم اللّغة، ومن ضمنها التطبيقات الخاصّة باللّسانيّات، والترجمة الآليّة، وتوثيق المعلومات، واسترجاعها. فالبحث عن المعلومات باللّغة العربيّة عن طريق الكلمات الدليليّة والتقارُب الصوتي لا يزال متخلّفاً إذا ما قورن بما وصلت إليه مثل هذه التطبيقات في لغاتٍ حيّة أخرى.
خطواتٌ متقدّمة
التطوّر الإلكتروني والبَرمجي والسُرع والسعات الكبيرة التي أصبحت مُتاحة في الأجهزة والمنظومات الإلكترونيّة الجديدة، وتوسُّع وتنوُّع وتعقُّد بعض التطبيقات الحاسوبيّة التي للّغة دَورٌ مِحْوريّ فيها، والمتطلّبات التفاعليّة في التعامل مع هذه التطبيقات مباشرة (online) بواسطة المحطّات الطرفيّة والحواسيب الشخصيّة.
تنفيذ مشروعات حاسوبيّة تتطلّب احتواء اللّغة العربيّة والإنكليزيّة أو الفرنسيّة من ضمن جدولٍ موحّد كي يسهل التعامل بأكثر من لغةٍ في آنٍ واحد.
3) إنّ تغيير شكل الحرف من مَوقعٍ إلى آخر مُرتبطٌ بالكتابة اليدويّة وسريانها. والمعروف أنّ الكتابة بلغاتٍ حيّة أخرى وتغيير أشكال الحروف من مَوقعٍ إلى آخر تتبع الأسلوب نفسه، إلّا أنّ الشعوب الأوروبيّة عندما قامت بمكْنَنَة الطباعة حاوَلت استخدامَ الحرف المعياري الذي لا يختلف شكله من مَوقعٍ إلى آخر؛ وبذلك اختصرت الجهود وبسّطت صناعة الطباعة وساعدت في نشْرِ لغاتها في العالَم. وبسبب تطوّر تقنيّة الإلكترونيّات، أصبحت مُعالَجةُ الرموز وتغييرها ضمن خوارزميّات أو برامج بسيطة نسبيّاً أمراً سهلاً وفي متناول مُصنّعي هذه الأجهزة. ولذلك ظَهرت الأجهزة التي تتعامل مع ما يُسمّى خوارزميّة “تحليل السياق” (context analysis) وهو برنامج مُدمج ضمن أجهزة الإدخال والإخراج يُمكّن المُستخدِمَ من إدخال شكلٍ واحدٍ للحَرف، ويقوم البرنامج الداخلي لجهاز الإدخال بتحويله آليّاً إلى شكله الموضعي قبل عرضه على الشاشة أو طبعه. وقد استُخدمت في هذه الحالة الوسائل التكنولوجيّة المستجدّة لإبقاء حال الطباعة العربيّة مُشابهاً للكتابة اليدويّة. فهل يا ترى أحسن برنامج تحليل السياق إلى اللّغة العربيّة أم أساء لها؟ ولكنّ المؤكّد أنّ هذا الحلّ جَعَلَ المُقاوِمين للتغيير يتمسّكون بالإبقاء على الطباعة التي تُشبه الكتابة اليدويّة.
من المؤسف حقّاً أنّ محاولات التطوير وتشكيل الجُمل لم تأخذ البعُد العلمي واللّغوي والتربوي الذي تستحقّه، وبقيت الكثير من المشكلات التي تُعاني منها اللّغة العربيّة موقوفة إلى الآن. وهنا ساعدتِ الإلكترونيّات وتطورّها وتوفُّر الأموال العربيّة على إبقاء وضع اللّغة المتصلّب على حاله، ما أثَّر سلباً في انتشار اللّغة العربيّة، بل أثَّر سلباً في إتقانها كتابةً وتكلُّماً من قِبَلِ الذين تشكِّل العربيّةُ لغتَهم الأمّ، لا فرق بين متعلِّم وأُمّي، وهي حالة غير موجودة في لغاتٍ أخرى.
بعض الإشكالات في مُعالَجة اللّغة العربيّة
ما زالت هناك إشكالات في اللّغة العربيّة من دون مُعالَجة، ومن المفيد استعراضها، وليس بالضرورة حلّها:
الحدّ الأدنى من الرموز التي تُمثّل اللّغة العربيّة
تشكيل النصوص العربيّة
هناك خلْطٌ ما بين الكتابة والخطّ وما بين الكتابة والطباعة. وهذا الخلْط أدّى إلى تأخير الاتّفاق على شيفرة عربيّة موحّدة. فاللّغة هي الأساس، والكتابة تعبيرٌ يدوي أو آلي عنها، والخطّ هو تحويل هذا التعبير إلى فنّ، والطباعة هي الاستفادة من الآليّة في ترويج الفكر المُعبَّر عنه في اللّغة. ومُعالَجة اللّغة ودراسة جوانبها ليس محكوماً بشكل الحرف أو بطريقة رسْمه. وعُلماء اللّغة يدعون دائماً إلى تبسيط الكتابة لتحقيق الهدف الأساس وهو نشْر النِّتاج الفكري في أوسع رقعة جغرافيّة واجتماعيّة مُمكنة.
تخلَّصَ الكثيرُ من اللّغات الحيّة من استخدام الحركات بتعويضها بحروف العلّة. فالفتحة هي الألف، والضمّة هي الواو، والكسرة هي الياء. إنّ اقتراحَ تغييرٍ جذريّ كهذا سيَلقى مُقاومَةً شَرِسة من معظم المُتكلّمين بالعربيّة. وقد تُهيِّئ التكنولوجيا حلّاً توفيقيّاً جيّداً في المُساعدة في تشكيل النصوص آليّاً، كليّاً أو جزئيّاً ممّا يُسهِّل على القارئ قراءة النصّ وفهْمه على نحوٍ أفضل. والتشكيل الآلي من البحوث المُهمّة التي تستحقّ التطوير، لكي يصبح مُتاحاً لجميع المُتعاملين باللّغة العربيّة بشفافيّة مُماثلة لبَرامج التصحيح الإملائي. قد يكون تحقيق ذلك بالإتقان المنشود ما زال صعباً؛ إلّا أنّ تشجيع البحث في هذا المجال مطلوبٌ وضروريّ. ولأنّ التشكيلَ مُرتبطٌ بالمعنى، تغدو الخوارزميّات المطلوب تصميمها لمُعالَجة التشكيل الآلي معقّدة، وإنّ النجاحات الجزئيّة في هذا الاتّجاه أمرٌ مهمٌّ لتفهّم تراكيب الجُمل العربيّة ومُعالجتها آليّاً، ومن ثَمّ الوصول إلى أدواتٍ أفضل للترجمة الآليّة. لكنّ السؤال المهمّ هنا هو: هل من المقبول الاعتماد الكلّي على التكنولوجيا في فهْم النصوص في جميع الظروف، والحالات، والمستويات الاجتماعيّة، والعُمريّة؟
النصوص العربيّة من دون التشكيل قد تُعطي معانيَ مُختلفة، كما حَصَلَ لابنة الدُؤلي. فكلمة “علم”، على سبيل المثال، من دون تشكيل لا يُمكن التكهُّن بمعناها من دون سياق الجملة التي جاءت فيها.
هل تُكتب الأعداد العربيّة من اليمين إلى الشمال أم من الشمال إلى اليمين؟
يجيب معظم الناطقين بالعربيّة عن هذا السؤال بعجالة فيقولون: تُكتب الأعداد في معظم الحالات من الشمال إلى اليمين، وهي إجابة نظلم بها اللّغة العربيّة والعرب الأوائل الذين نشروا استعمال “الأرقام العربيّة” في العالم. والسبب في الاعتقاد أنّ الأعداد تُكتب من الشمال إلى اليمين هو تعوُّد العرب في هذا القرن والقرن الماضي، وبسبب التأثير الأوروبي على نطْقِ معظم الأعداد من الشمال إلى اليمين خلافاً للأسلوب الذي كان شائعاً بين العرب في القرون السابقة. ولكنّ المتكلّم بالعربيّة هذه الأيّام لا ينطق الأعدادَ كلّها من الشمال إلى اليمين؛ فنقول “خمسة عشر” ونكتبها من اليمين إلى الشمال، ونقول “مئة وعشرون” ونكتبها في اتّجاه نطْقها من الشمال إلى اليمين، لكنّنا نقول مئة وخمسة وعشرون ونكتبها بتسلسُل نطْقها، أي نكتب “1” ثمّ “5” ثم “2”، وكذلك الحال في ألف وتسعمائة وسبع وثمانين 1987. هل نقبل بهذا الواقع ونستنتج أنّ الأعداد تُكتب من الشمال إلى اليمين؟ فهي ليست كذلك، ولماذا لا نعود إلى الطريقة المنطقيّة في نطْق الأرقام وكتابتها من اليمين إلى الشمال، أي باتّجاه النصّ العربيّ؟ فنقول مثلاً، سبعة، وثمانون، وتسعمائة وألف؟
الغريب في الأمر أيضاً أنّ كثيرين من مُواطني الدول العربيّة يلجؤون، إمّا الى الفرنسيّة أو الإنكليزيّة (بحسب مَن استعمرَ بلدَهم ثقافيّاً) لنطْقِ الأرقام عند التحادُث بعضهم مع بعض باللّغات العربيّة الدارجة، وكأنّ العربيّة قاصرة في التعامُل بالحساب والأرقام، وهي اللّغة التي نُشر بواسطتها الحساب في أوروبا عن طريق الأندلس (711 – 1492 م).
لقد شجَّعت الشركاتُ المصنِّعة لأجهزة الحواسيب والاتّصالات المُستخدِمين العرب على كتابة الأرقام من الشمال إلى اليمين لتسهيل مُعالجتها في الأجهزة وشبكات الاتّصال ولغات البرْمَجة المصمَّمة أصلاً لبلدانهم. ومع أنّ ذلك سهَّل الحلّ على الشركات إلّا أنّه أساء إلى منطقيّة النصوص العربيّة وسريانها. فأصلُ نظام الأعداد والحساب عربيّ. وعندما نَقَلَ الأوروبيّون الحسابَ عن العرب نقلوا الأرقامَ والعمليّات الحسابيّة أيضاً. فالأوربيّون يجمعون ويطرحون ويضربون من اليمين إلى الشمال وعند مُعالَجة الحاسوب النصوص اللّاتينيّة، فإنّه يُعالِج الحروفَ من الشمال إلى اليمين لكنّه يُعالِج الأرقامَ من اليمين إلى الشمال. فعلى العرب أن يفخروا بأنّ اتّجاهَ الحروف والأرقام والقيام بالعمليّات الحسابيّة في لغتهم واحد، على خلاف اللّغات الأوروبيّة.
بعض التحدّيات التي تنتظر حلولاً
القراءة الضوئيّة للنصوص العربيّة
التعرُّف الضوئي على المَحارف Optical character recognition أو اختصاراًOCR هي نَوع من البرمجيّات لتحويل صُور النصوص المكتوبة باليد أو بآلة إلى نصوصٍ يستطيع الحاسوب مُعالجتها بواسطة التعرُّف الضوئي على الحروف آليّاً أو تحويل الصورة الممسوحة الإلكترونيّة من صيغةٍ مكتوبة بخطّ اليد، أو مطبوعة على الآلة الكاتبة أو نصّ مطبوع إلى نصٍّ مُرمَّز تفهمه الآلة وتُدعى آلة ترميز النصوص.وهو يُستخدَم على نطاقٍ واسع باعتباره شكلاً من أشكال إدخال البيانات سواء أكانت وثائق، أم إيصالات مبيعات، أو أيّ عددٍ من السجلّات المطبوعة. لأنّه من الأهميّة بمكان أنّ حَوْسَبة النصوص المطبوعة تكون مَطلباً حتّى يُمكن أن يكون البحث عنها أو خزْنها إلكترونيّاً بحيث تُصبح قابلة للانضغاط أكثر ليتيسَّر عرْضها على الإنترنت، وتُستخدم في عمليّاتٍ آليّة مثل الترجمة الآليّة، وتحويل النصّ إلى كلام والغَوْص في النصوص. التعرُّف الضوئي على الحروف هو مجال البحث في التعرُّف على النماذج، الذكاء الاصطناعي وجهاز الرؤية عن طريق الحاسوب.
التشكيل الآلي للنصوص العربيّة
يُعَدّ غياب التشكيل في النصوص العربيّة الحديثة من أكبر التحدّيات التي تُواجِه المُعالَجة الآليّة للّغـة العربيّة؛ إذ يُمكـن للقارئ العربي المُتمكّن من اللّغة أن يستنبط التشكيل الصحيح للكلمات عند قراءته نصّاً غير مشكول، لكن ليس الحال لمَن لا يُتقِن اللّغة، في حـين يحتـاج الحاسـوب إلـى خوارزميّات لضبْط التشكيل. ونقصد بالتشكيل الحركات جميعها (ضمّة، فتحة، كـسرة، سكون)، فضلاً عن الشدّة والتنوين. تعتمد بعضُ منهجيّاتِ التشكيل الآلي على المُعالَجة اللّغويّة للنصوص، فـي حـين تعتمد منهجيّاتٌ أخرى على طرائق إحصائيّة تستند إلى المدوّنات، وتدمج بعض النُّظم المنهجيّتَيْن في مُقارَباتٍ هجينة.
الترجمة الآليّة من وإلى اللّغة العربيّة
الترجمة الآليّة للعربيّة مُهمّة صعبة لما لها من خاصيّاتٍ صرفيّة ونحويّة وحَرفيّة ولفظيّة مُخالِفة لأكثر اللّغات، حيث إنّ اتّجاهَ الكتابة وطريقةَ نطقِ الحروف وتحريكها وقرائن فهْم المعاني واختلاف اللّهجات تجعل من الترجمة الآليّة عمليّة معقّدة، وقد توفِّر خوارزميّات الذكاء الاصطناعي حلولاً ناجعة وكفؤة في المستقبل.
حَوْسَبَةُ اللّغة مُهِمّة حضاريّة لازِمة لتطوُّر اللّغة؛ إنّها عمليّة مستمرّة تتطلّب تطويراً مستمرّاً، فهي في جوهرها محاولة مُحاكاة للعقل البشري. وتُعتبر الترجمة الآليّة من أهمّ أهداف حَوْسَبَة اللّغة لتحقيق ما يُسمّى “الفهْم الآليّ للّغة”. ولا يُمكن للآلة أن تُحوِّل نصّاً معيّناً من لغةٍ إلى أخرى من دون تحليله إلى عناصر تكوينه، ثمّ بناء النصّ الهدف باللّغة الأخرى.
للإطلاع على محاضرة الترجمة الآلية للغة العربية / قضايا وحلول
_____
*مُختصّ في مجال تقنيّات المعلومات والاتّصالات – العراق / مؤسسة الفكر العربي