قال الأكاديمي عبد الفتاح الحجمري إن “اللغة ما زالت بحاجة إلى الذكاء البشري أكثر من الذكاء الاصطناعي”، مضيفا “مع تطوّر البحث التكنولوجي واعتماد آليات الذكاء الاصطناعي، فإن التوجه الآلي لتصور معالجة الوحدات الكتابية للغة العربية ما زال بحاجة للتطوير بالرغم من كل الجهود التي بذلها المهندسون والإعلاميون واللغويون”.
وبعدما قارب الحجمري، في مقال له، موضوع “العربية والتقنية” من جوانب مختلفة، ذكّر ببعض خلاصات دراسة حول “رصد واقع اللغة العربية في ميادين التواصل الاجتماعي على الشابكة (الأنترنيت) والهاتف المحمول”، خاصة ما يتعلق بـ”المشكلات اللغوية” المحصورة في “الثنائية اللغوية”، و”الازدواجية اللغوية”، و”الضعف اللغوي”.
هذا نص المقال:
وصلتني قبل أيام دعوة للمشاركة في مؤتمر دولي حول اللغة والذكاء الاصطناعي؛ اعتبرت الموضوع مهما وآنيا، علما أنه شكل مدار بحث العديد من المؤتمرات منذ مطلع الألفية الجديدة، بل إن العديد من مختبرات المدارس العليا للهندسة التطبيقية والتقنيات الصناعية جعلت منه أيضا مجالا للتجريب والدراسة وابتكار خوارزميات قادرة على تنفيذ تطبيقات حاسوبية للغة العربية توازي مجال اللغات الطبيعية، كل ذلك من أجل ابتكار حلول تقنية لخصائص اللغة العربية الصوتية والصرفية والتركيبية؛ وتداعت إلى ذهني جهود علماء كان أحمد الأخضر غزال واحدا منهم، فقد عمل منذ مطلع الثمانينيات من القرن الماضي على إدخال الحروف العربية في علوم الحاسوب باستعمال نظام الترميز العربي الموحد CODARU / FD الذي أدى إلى معيار ISO 9036 وASMO 969، وهو النظام الذي ما زال معمولا به إلى اليوم؛ كانت تلك إحدى البدايات التأسيسية الأولى لحوْسبة الحرف العربي، ووضع آلة للرقن بالعربية.
ماذا لو كان عنوان المؤتمر اللغة والذكاء الإنساني؟
أعتقد أن اللغة ما زالت بحاجة إلى الذكاء البشري أكثر من الذكاء الاصطناعي.
مع تطوّر البحث التكنولوجي واعتماد آليات الذكاء الاصطناعي على نحو ما وفره برنامج “شات جي بي تي Chat GPT” في محاكاته للذكاء البشري بتأليف القصص وكتابة المسرحيات وتأليف الموسيقى وكتابة أبحاث الطلاب الفلسفية والأدبية، فإن التوجه الآلي لتصور معالجة الوحدات الكتابية للغة العربية ما زال بحاجة للتطوير بالرغم من كل الجهود التي بذلها المهندسون والإعلاميون واللغويون فيما يتعلقّ بالقارئ الآلي والضوئي reconnaissance optique de caractères (OCR) في صيغتها الورقية كتبا ومخطوطات، وتحويل الصور إلى نصوص يمكن التحكم فيها بالإضافة والحذف والتعديل، مع الأخذ بالاعتبار طبيعة النظام الكتابي لحروف اللغة العربية ومختلف تنويعاته والتي تشمل الثمانية والعشرين حرفا، من ذلك مثلا تنويعات الهمزة وهي- كما هو معلوم- سبعة: (ا، آ، أ، إ، ء، ؤ، ئ)، هذا فضلا عن ظاهرة الإعراب بعلامات الضبط المميزة للغة العربية، والتدقيق النحوي والإملائي والتشكيل الآلي وغيرها من الأنظمة الكفيلة بتحسين استعمال العربية تقنيا وحاسوبيا.
كان انتشار ظاهرة “العربيزي” لافتا للنظر، أي كتابة العربية بحروف لاتينية، من خلال ابتكار أبجدية مركبة من حروف وأرقام ذاع استعمالها على الهواتف المحمولة ومواقع التواصل الاجتماعي؛ وقد أخذت هذه الظاهرة في الانتشار مع ظهور الجيل الأول من الهاتف المحمول ولم يكن يتوفر على الحروف العربية لكتابة الرسائل القصيرة، ولما كانت الحاجة ماسّة لكتابة تلك الرسائل من قبل المستخدمين، وأمام غياب الحرف العربي، باشر المستعمل بكتابة الرسالة بحروف لاتينية؛ كان ذلك قبل أن تطوّر مايكروسوفت وغوغل برمجيات لتحويل الكلمات العربية المكتوبة بحروف لاتينية إلى كلمات عربية مكتوبة بحروف عربية، من خلال تطبيقات الإنترنت المختلفة.
أشرت سابقا إلى الوحدات الكتابية للحرف العربي في لوحات التحكّم على بعض الهواتف المحمولة وعلى لوحات الكتابة الحاسوبية؛ وبعملية حسابية بسيطة نلاحظ أن عدد الحروف العربية 28 حرفاً، بينما لوحة المفاتيح على الحاسوب تتوفر على 34 حرفاً، ما بين ألف بهمزة وأخرى ِبمَدّة وثالثة بدونهما، وثلاثة أشكال لحرف الياء واثنين للواو، واحدة منها عليها همزة، وهمزة بمفردها؛ للحرف العربي أيضا أربعة أشكال في أول الكلمة ووسطها ونهايتها ومنفصلة عنها، أي أننا لو ضربنا 28 x 4 يكون عندنا 112 حرفاً، فهل لاعتبار الوحدات الكتابية للحرف العربي دور في نزوع أغلب الشباب نحوَ كتابة رسائلهم الهاتفية بالحرف اللاتيني، وأن ذلك أبسط بكثير من كتابتها بالحرف العربي؟
أضحت الهواتف المحمولة ذكية اعتمادا على نظام مُيسّر في الكتابة، وبكل لغات العالم. أصبحت الهواتف والحواسب مُعربة؛ ورغم ذلك ظلت العربية المكتوبة بلغة لاتينية مهيمنة على كتابة الرسائل القصيرة؛ سألت أحد الشباب عن ذلك، فأجابني: هي منتشرة بيننا لأنها تتيح لنا هامشا من السّرية في الأحاديث الخاصة، فالكتابة مُشفرة ويصعب على من لا يملك دُربة كتابتها فكّ رموزها؛ ثم إنها لغة تحررنا من ضغط الأخطاء الإملائية وتمكن من التعبير باقتصاد وإيجاز عن المقصود، وباقتراب من الدارجة المتداولة.
والمؤكد أننا أمام ظاهرة جديدة لا تخصّ اللغة العربية فقط، بل كل اللغات؛ يتعلق الأمر بميلاد لغة تعبيرية قريبة من أن تكون عالمية واسعة الانتشار؛ بل إن بعض الدراسات تعتبرها كتابة وليس لغة لقدرتها على التعبير المختزل أكثر من أي لغة أخرى، من ذلك استعمال الأرقام أثناء الكتابة واعتبارها حروفا: كأن يكتب المرء حرف القاف (ق) مقابلا لرقم: 9، وحرف العين (ع) برقم: 3، وحرف الحاء (ح) برقم: 7؛ وهناك أيضا تركيبات هي عبارة عن أيقونات انفعالية تُعرف بـ”الإيموجي”، وهو في الأصل مصطلح ياباني يعني الصور الرمزية أو الوجوه الضاحكة المستعملة في كتابة الرسائل الإلكترونية؛ أصل الكلمة نحتٌ من كلمتي e وتعني صورة، وmoji وتعني حرفا أو رمزا.
في دراسة قيمة للأستاذ محمد زكي خضر من الجامعة الأردنية لها راهنيتها وجدواها بعنوان “رصد واقع اللغة العربية في ميادين التواصل الاجتماعي على الشابكة (الأنترنيت) والهاتف المحمول”، وبالاعتماد على عينات من النصوص زادت عن 8500 نص موزع على “الفيسبوك” و”تويتر” والمواقع الإخبارية والمدونات والتعليقات ورسائل الهاتف المحمول، خلص الباحث إلى جملة من النتائج المهمة أوردها مختزلة فيما يلي، وتخص المشكلات اللغوية، وهي محصورة في ثلاث:
– الثنائية اللغوية: وتجلت في استخدام مفردات إنجليزية إلى جانب اللغة العربية في 5% من النصوص التي شملتها الدراسة، وفي كتابة النص العربي بالأبجدية الإنجليزية في 14% من مجمل تلك النصوص.
– الازدواجية اللغوية: وتجلت في مزاحمة اللهجة العامية للغة الفصحى في النصوص المكتوبة، إذ تبين أن أكثر من نصف نصوص العينة (55%) قد كتبت بلهجة عامية، وحوالي 8% كتبت بمزيج من فصحى وعامية، وباقي نصوص العينة (حوالي 36%) كتبت باللغة الفصحى الخالصة.
– الضعف اللغوي: في مستويات الكتابة والمعجم والصرف والنحو والتركيب.
هذا من غير شك ملمح من ملامح استعمال اللغة العربية في ميادين التواصل الاجتماعي والهاتف المحمول؛ وهو ملمح يدعونا لتأمل المشاكل اللغوية السالفة ونتساءل:
لماذا، في مواقع التواصل الاجتماعي، يكتب المرءُ كما يتكلم أثناء تواصله اليومي؟
يكتبُ كما يتكلّم… لنتأمَّلْ!
المصدر: وكالات