لنبدأ بصدمة. إن لم تنهض اللغة العربية الآن كي تواجه التحدي الذي يفرضه عليها الذكاء الاصطناعي التوليدي، فالأرجح أن تسقط في ظلام الخروج من الزمن، خصوصاً أنها الآن تقارب العيش خارج التاريخ المعاصر للعلوم اللغوية الحديثة في الغرب.
ولتستكمل الصدمة بأن اللغة العربية تحتاج إلى فتح أبواب الاشتغال عليها كي يدخل منها علماء الرياضيات من المتخصصين في المعلوماتية، بغية إحداث ثورة، أبسط الأمثلة عليها أن تصنع كتب حديثة عن قواعد اللغة العربية، فتكون سطورها محملة بمعادلات الرياضيات الحديثة، مما يسهل أمام خبراء المعلوماتية صوغها في خوارزميات متخصصة بألسنيات الكمبيوتر.
ولعله مؤلم القول إن شيئاً يشبه لذلك الفريق المتخيل، كان ليظهر لو أن المشتغلين على اللغة العربية تابعوا ما بدأه نحاة من قماشة عبدالقاهر الجرجاني في مؤلفه المعروف "العوامل المئة"، وكذلك نظريته عن نظم الكلام، والخليل بن أحمد الفراهيدي الذي كاد يسبق الزمن في كتابه "معجم العين". وعاش الجرجاني في القرن الـ11 والفراهيدي في القرن الثامن. ولعلها محطة أخرى من الانطباع السلبي (إذ لا يخلو من عنصرية مضمرة أو معلنة) المعروف بأن شيئاً ما قد توقف في التطور الأساس للحضارة العربية الإسلامية منذ القرن الـ14.
الذكاء التقليدي للآلات يصبح توليدياً بفضل اللغة
لماذا الجرجاني والفراهيدي؟ لعل من تابع الظهور الانفجاري لظاهرة الذكاء الاصطناعي التوليدي، لا يسعه سوى التأمل في اللغة، من ثم محاولة تلمس السبيل، للمقارنة بين ذكاء الآلات التوليدي وبين أحوال لسان الضاد.
ومثلاً، حينما انعقدت "القمة العالمية عن الذكاء الاصطناعي للصالح العام" Global Summit on AI for Common Good التي استضافتها جنيف في يوليو (تموز) 2023، ظهرت مقالة علمية كتبها المتخصص في المعلوماتية في صحيفة "نيويورك بوست" الأميركية تضمنت خلاصة مكثفة تفيد بأن الذكاء الاصطناعي التوليدي يمثل أقصى ما توصل إليه ذكاء الكمبيوتر [خصوصاً ثلاثية الشبكات العصبية الإلكترونية ورصد الأنماط وملاحظة الارتباطات]، مع العلوم اللغوية الحديثة، أي علم الـ"سيميولوجيا" (علم العلامات) Semiology وفروعه في علوم الدلالية "سيمانتكس" Semantics والتداولية "براغماتيكس" Pragmatics و"سينتاكس" Syntax، إضافة إلى مراجع نظرية عن كيفية وضع ملخصات للنصوص من نوع كتاب "إعادة الصياغة" Paraphrase من تأليف العالم دزيدريوس إراسيموس في عام 1548. واستطرداً، لا يوجد في علوم لسان الضاد ما يوازي كتاب إراسيموس، ولكن هناك كتباً تعليمية ومدرسية كثيرة تقدم وسائل لصنع ملخصات، مع غياب تنظيم نظري منهاجي لغوي لذلك الأمر.
أبعد من ذلك، لم تلتقط علوم اللغة العربية الخط التطوري الذي أوصل علوم اللغة والألسنيات في الغرب إلى صيغة علم الـ"سيميولوجيا"، بمعنى دراسة اللغة بوصفها بنيات منسوجة في معادلات رياضية تتناول الإشارات والرموز وارتباطاتها مع النصوص، وما تتضمنه من معان وسياقات وخطابات ومضامين. وتدرس الدلالية (سيمانتكس) معنى الكلمات في الجمل استناداً إلى معادلات رياضية تمكنها من ربط التشيكلات اللغوية المختلفة مع مدلولاتها ومحمولاتها من التمثلات العقلية.
واستناداً إلى علم الدلالية، تتعامل التداولية (براغماتيكس) بمساندة من معادلات رياضية، مع طريقة استخدام اللغة في المجتمعات وكيفية تطور معاني الكلمات مع الزمن، وكذلك كيف تكتسب الجمل معانيها من خلال الاستخدام الاجتماعي والزماني. من ثم تمكن العلوم الدلالية ومعادلاتها الرياضية من إدراك كيفية فهم العبارات بالنسبة إلى أصحاب لغة معينة، وتطور ذلك عبر الزمن. وقد أضاف نعوم تشومسكي إلى ذلك نظرية علم القواعد التوليدي Generative Grammar المتعلق بقدرة البشر كلهم، وعبر الأزمنة، على توليد اللغات المختلفة واستعمالها، على رغم التفاوتات الواسعة بينها.
ويتناول علم الـ"سينتاكس" اللغة بوصفها منظومة إشارات صرفة، تتبع تنظيماً خاصاً بها في صناعة الكلمات والجمل، وكذلك ينظم منطق تراكيبها في معادلات رياضية. ومن البين أن ال"سينتاكس" يمثل مرحلة التطور الرياضية الصرفة في علوم القواعد والنحو والصرف وغيرها من علوم اللغة المعروفة لدى اللغويين العرب.
واستناداً إلى تلك التقنيات والعلوم اللغوية، إضافة إلى أدوات أخرى على غرار إعادة الصياغة، درب العلماء الآلات أيضاً على صنع قوالب أو هياكل أو تمثيلات أولية، كي تتمكن من صنع نصوصها الخاصة، بالأحرى إعادة صياغة واختزال وتكثيف للنصوص الموجودة في مليارات الكتب والمطبوعات والمنشورات، كي تولد قوالب تستند إليها حينما تعطي أجوبة عن الأسئلة التي توجه إليها. إذاً، يجري تدريب الآلات في البداية على النصوص الفصيحة المضبوطة كي تصنع قوالبها وتمثيلاتها عن اللغة، ثم تعرض للعامية كي تلاحظ الفوارق فلا تعود تمنعها من الاستمرار في "التقاط" المعاني.
يعطي ذلك الوصف السابق كله تفسيراً لمعنى صنع "النماذج اللغوية الأساسية الكبيرة" Basic Large Language Models التي تعتبر الهيكل الأساس لنموذج "جي بي تي"، ويؤمل أن يستطيع العرب التوصل إلى صوغ نموذج مماثل عن لغتهم.
لعل الكلمات السابقة لم توضح كفاية على رغم إلحاحها، على الدور الهائل للغة في التطور المعلوماتي المتمثل بالذكاء الاصطناعي التوليدي. لنتأمل في اسم التقنية الجديدة "جي بي تي" GPT الذي يختصر عبارة "المحول التوليدي المسبق التدريب" (Generative Pre Trained Transformer). وتشير كلمة "توليدي" إلى ما يشبه إعادة لصياغة النصوص، ويتضمن ذلك صنع نص جديد يلخصها ويحافظ على أسلوبها ونسقها وترابطاتها.
اقرأ المزيد
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
هل يعني ذلك أن "جي بي تي" يمثل ذكاء اصطناعيا تقليديا أضيفت إليه ملكة إعادة صياغة للنصوص، مع ما تضمنه من تلخيص واختزال لها؟ لعل ذلك ما قصده المقال المشار إليه أعلاه الذي ظهر في "نيويورك بوست" عن الذكاء الاصطناعي التقليدي، مع ملاحظة أن علم "ألسنيات الكمبيوتر"Computer Linguistics، يؤدي دور الجسر الذي يربط طرفي ذلك المسار.
وفي الغرب، أنجز علماء اللغة خلال سبعينيات القرن الـ20 وثمانينياته، تحولاً ضخماً في دراسة اللغة عبر إدماجها مع الرياضيات، ونقلها إلى مرحلة الـ"سيمولوجيا" ومكوناتها المتعددة التي تفوق، بالطبع، ما ورد في السطور السابقة.
ترجمة علوم السيمائية لا تغني عن صنعها
لا شيء يشبه ذلك في علوم اللغة العربية. بالأحرى، ربما هناك النزر القليل من ذلك، ولعله قد فات كاتب المقال.
وفي المقابل، ثمة من بذل جهداً في توصيل اللغة العربية إلى وعي ذلك التطور، خصوصاً من طريق الترجمة. ومثلاً، هنالك كتاب توين فان دايك "النص والسياق، استقصاء البحث في الخطاب الدلالي والتداولي"، وقد ترجمه الزميل عبدالقادر قنيني في عام 2000. وهنالك كتب مماثلة غير قليلة، لكنها تتناول مؤلفات عن العلوم اللغوية الحديثة في الغرب. وثمة دراسات كثيرة، بعضها لعلماء معلوماتية عرب يعملون في مختبرات لغوية معلوماتية غربية، عن استعمال المنهجيات اللغوية الحديثة مدموجة مع الذكاء الاصطناعي، في تحليل نصوص عربية.
واستكمالاً، لعل ذلك الوصف لتدريب الآلات على توليد النصوص والتعامل مع اللغة اليومية المختلفة عنها، يدفع إلى التفكير نحو كتب من نوع "معجم العين" و"العوامل المئة". ويتفرد "معجم العين" بأنه يدرس بطريقة شبه حسابية، تركيب الحروف في كلمات اللغة العربية، والتراكيب المقبولة في اللغة للحروف وتلك التي لا تحصل فيها. إنه عمل قابل للتطوير عبر أساليب الرياضيات اللغوية الحديثة، إذا وضعت وصيغت في لغة الضاد. ويفيد ذلك أيضاً في ملاحظة أحد مناحي الاختلاف بين فصيح اللغة وعاميتها المتنوعة، مع التذكير بأن تدريب النماذج الأساسية اللغوية الكبيرة، لا يكتمل إلا بتدريبها على الكلام العادي واليومي الذي يتداوله الجمهور، بتراكيبه التي تتقاطع وتتباعد مع النصوص التقليدية الكلاسيكية المضبوطة لغوياً.
واستطراداً، تستطيع قوة الحوسبة في الكمبيوتر أن تدرس وتدقق في كل كل كلمة وجملة، مع تطبيق "العوامل المئة" عليها. واشتهر الجرجاني بنظريته عن النظم. ولنترك كلماته تتحدث عن نفسها. ومن مشهور القول عنه إن "النظم هو توخي معاني النحو وأحكامه فيما بين الكلم من علاقات. واعلم أن النظم ليس إلا أن تضع كلامك في الوضع الذي يقتضيه علم النحو، وتعمل على قوانينه وأصوله، وتعرف مناهجه التي نهجت، فلا تزيغ عنها، وتحفظ الرسوم التي رسمت فلا تبخل بشيء منها". أليست تلك الكلمات قريبة مما يشبه إعطاء توصيف لعلم الدلالية، على رغم عدم تطابقه تماماً معه؟