ملخص
الطفرة التوليدية في الذكاء الاصطناعي تعتمد أساساً على تعلم الآلات وتصميم نماذج أساس كبرى، وثمة 15 مصطلحاً تشرح أساسات تلك الطفرة التقنية
في أواخر عام 2022، بدا فجأة كأن العالم أمام إعصار هائل اجتاحه بصورة كاسحة، أو كأنما جني المصباح السحري انفلت في كل مكان من العالم. لعل تلك الصورة تقترب من الدوي الهائل الذي رافق إطلاق روبوت المحادثة "تشات جي بي تي" Chat GPT الذي صنعته شركة "أوبن إيه أي" Open ai. وانبهرت عيون كثيرة برؤية أن ذلك البرنامج يرد على أسئلتهم المتنوعة، بنصوص يتولى ذلك البرنامج صنعها بنفسه، بمعنى توليدها، أي أنه "محول توليدي مسبق التدريب" Generative Pretrained Transformer، واختصاراً "جي بي تي" GPT.
وتلقفت عوالم العرب تلك الموجة الهائلة، وسرعان ما صارت جزءاً من فضاء النقاشات العامة فيها. وتوضح أن "تشات جي بي تي" هو نموذج لغوي كبير Large Language Model من صنع الذكاء الاصطناعي التوليدي Generative Artificial Intelligence. بمعنى آخر، لقد دخلت الآلات الذكية مرحلة نوعية في تطورها تسمى تقنياً الذكاء التوليدي، وكانت اللغة أولى المساحات التي اشتغلت عليها، وصنعت نموذجاً ذكياً عنها.
ماذ يعني ذلك؟ ما معنى تلك المصطلحات الكثيرة التي وردت في الأسطر السابقة؟
الأرجح أنه من المستطاع تقديم عرض مبسط عن تلك الطفرة التقنية عبر شرح 15 كلمة رئيسة تتعلق بها. وقد أعِدَّ هذا الشرح بالاستناد إلى مجموعة كتابات متنوعة من بينها مقالة مطولة ظهرت في موقع "بي بي سي" أخيراً.
01- ذكاء اصطناعي Artificial intelligence
انظر حولك. تأمل الإنترنت والخليوي والكمبيوتر والآلة الحاسبة وساعة "فيت بت" وغيرها. تعمل كل تلك الآلات بفضل تقنية تسمى الذكاء الاصطناعي، لأنه يشبه المهارة العقلية لدى البشر لكن المبتكرين استطاعوا نقلها إلى الآلات. إنها تحفظ المعلومات وتستعيدها. وإذا سألت "غوغل" عن مصطلح أو عبارة، يعطيك المواقع والمصادر والكتب والقواميس التي قد تجد فيها ما تبحث عنه. يعتبر الإنترنت قفزة في الذكاء الاصطناعي لأنه يربط بين "أدمغة" ما لا يحصى من الآلات المرتبطة به، مع ما تحمله من بيانات ومعلومات. ووفق وصف بيل غيتس، حينما تتمكن الآلات من تكرار كل مهارات الذكاء الاصطناعي في كل الأشياء، بما في ذلك تلك التي "تتفحص" بها محيطها كالصور وآلالات تحسس الأشياء والتعرف على تراكيبها، تكون الآلات وصلت إلى مرحلة نوعية تسمى "الذكاء الاصطناعي العام" General Artificial Intelligence الذي سيكون أكثر تقدماً من البشري بكثير بسبب السرعة الهائلة التي تستطيع الآلات التعامل فيها مع البيانات والمعلومات التي تتوفر لديها.
02- تعليم الآلات الكمومي Quantum Machine learning
هناك أشكال أخرى من التعامل مع ذكاء الآلات، يمكن إعطاء مثل عليه عبر البرامج الذكية للتعرف على الصور والوجوه التي تقدم مثلاً عن مسألة تعلم الآلات Machine Learning. إذ تعطي الكاميرات صوراً رقمية، مما يعني أنها مكونة من مجموعة إشارات مكتوبة باللغة الثنائية (صفر، واحد) لها نسق وتسلسل معين. ولنتذكر أيضاً أن الرقاقات الإلكترونية تعمل عبر التعامل، بسرعة البرق، مع تسلسلات اللغة الثنائية. بالتالي، تقرأ الرقاقات الإلكترونية الصور الرقمية باعتبارها تسلسلات ضخمة من إشارات اللغة الثنائية. في مرحلة تالية، صنع العلماء معادلات رياضية، خوارزميات، كي تصف أنساق تلك التسلسلات بالطريقة التي تنتظم فيها في الصور الرقمية، بمعنى أن لكل صورة نسقاً معيناً. وبالتالي، صنعت خوارزميات كي تستخرج ما يميز تلك الأنساق عن بعضها بعضاً. وباستخدام رقاقات متزايدة القوة، أمكن تطبيق ذلك مهارة التمييز على كل تفصيل في الصورة، بل كل خط ونقطة فيها. يعطي ذلك مثلاً عن كيفية تعليم الآلات كي تكتسب قدرة معينة، هي التعرف على الوجوه. ومن السهل تصور كيفية تطبيق ذلك في أشياء أخرى.
وحينما تصل التقنية إلى مرحلة الكومبيوتر الكمومي، ستقفز المهارات التي تتعلمها الآلات، سواء في الصور أو الكلمات والنصوص والأصوات وغيرها، إلى مستويات تفوق الخيال. يسمى ذلك التعليم الكمومي للآلات، والأرجح أنها سترافق وصول ذكاء الآلات إلى ذكاء خارق يفوق البشري أضعافاً مضاعفة.
اقرأ المزيد
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
03- نموذج لغوي كبير Large Language Model
تقدم الآلات الحاسبة نموذجاً مهماً عن ذكاء الآلات في التعامل مع الأرقام والمعادلات، وتستطيع أن تحل في ثوان قليلة ما يحتاج البشر إلى ساعات أو حتى أيام، لإيجاد حل له. تخيل أن أمراً مماثلاً يحصل مع اللغة، بمعنى أنه عند كل حرف وكل كلمة، تعمل الآلات على إجراء "حسابات لغوية" عليها، فترى ما الذي ينطبق عليها وما لا ينطبق، وما الذي يتشابه مع تراكيبها وما يختلف ويكون بعيداً منها. بالطبع، لقد صنع البشر تلك الحسابات، وصاغوها على شكل معادلات من الرياضيات تسمى خوارزميات Algorisms. وتتفوق الآلات في قدرتها على تكرار كل تلك الحسابات عند كل تفصيل، وتعيده مرات ومرات. تصف الكلمات السابقة عملية تدريب اللآلات على اللغة، بالأحرى، إنها تشرح معنى النموذج اللغوي للذكاء الاصطناعي. ويتميز الذكاء التوليدي أنه يضيف إلى تلك الحسابات السابقة، القدرة على "تلخيص" النتائج، عبر تجميع الأشياء الأكثر تشابهاً مع بعضها بعضاً وسبكها في قوالب جرى تعريف الآلات عليها، من مدربيها البشر. تسمى تلك القوالب "تمثيلات منتجة مسبقاً" Pregenerated Representations. مثلاً، هنالك نموذج القصيدة التي تصنع من كلمات مرتصفة في بحور شعرية، إضافة إلى مواصفات أخرى، وبالتالي، من المستطاع صنع "تمثيل مسبق" عنها. ومع التكرار، تصنع الآلات بنفسها قوالب وتمثيلات لا يعرف حتى صناعها ماهية تركيبها، بالإضافة إلى أنها لا تملك القدرة على التفكير المجرد، وهو أساس فهم اللغة ومحتوى الكلمات والجمل والنصوص. ويجري التوسع في تدريب النماذج عبر تعاملها مع ما يكتبه الجمهور على منصات التواصل الاجتماعي، باعتبارها نماذج عن اللغة والتواصل لدى البشر.
04- توافق الأهداف Alignment
هل تتوافق أهداف الآلات مع ما يجمع عليه معظم البشر كرفض القتل مثلاً؟ لعل المثل الأبرز على عدم التوافق جاء من الروبوت الأنثى صوفيا التي أعلنت في أول ظهور لها في 2016 أنها ترغب في تدمير البشر. وفي 2023، صرحت بأن الروبوتات يستطيعون قيادة الإنسانية بأفضل مما يفعل البشر.
05- الأشباح Ghosts
لعلك سمعت عن مجسمات رقمية لراحلين من المغنين والممثلين، على غرار صنع نموذج هولوغرافي للراحل إلفيس برسلي، أو صنع تجسيم رقمي للمثل الراحل مارتن دين. يضاف إلى ذلك إمكان منح تلك المجسمات أفكار الشخص الراحل، مستقاة من تدويناته وتغريداته أو حتى ربما نقل مجموعة ضخمة من أفكاره إلى رقاقة إلكترونية متطورة. هل يؤول الأمر إلى مرحلة من الأشباح الرقمية التي قد تدوم قروناً بعد قرون؟
06- هلاوس الآلات Machine Hallucinations
ورد في مقالة نشرتها "وول ستريت جورنال" خلال فبراير (شباط) 2023، أن الذكاء الاصطناعي التوليدي أجاب عن سؤال حول عناوين الكتب التي ألفها هنري كيسنجر عن التكنولوجيا، فأجاب بكل ثقة بأن أورد ستة منها. تبين أن خمسة كانت خطأ تماماً، فيما السادس حمل تاريخ صدور مغلوط. توصف تلك الإجابات الواثقة والمغلوطة التي تقدمها الآلات بأنها هلاوس.
07- انهيار النماذج Model Collapse
تقدم الآلات الذكاء الاصطناعي للجمهور مجموعات كبيرة من الإجابات المغلوطة، بصورة مستمرة. وضمن مشكلات أخرى، تصبح تلك الإجابات جزءاً من ذاكرة ذكاء الآلات، بمعنى أنها تتعامل معها كمعطيات وبيانات لأنها لا تستطيع فهمها أو استيعابها كمفاهيم ومعلومات، على غرار ما يفعل البشر. ومع تراكم الغلطات، يزيد إمكان حدوثها أيضاً، مما يعني حدوث نوع من الدائرة المقفلة بين تكرار الأغلاط وزيادة إمكان حدوثها. وبالنتيجة، يحدث خلل أساس في النماذج يشبه ما يحصل لدى البشر حين الوصول إلى مرحلة خرف الشيخوخة. ويسمى ذلك انهيار النموذج.
08- الذكاء الاصطناعي المفتوح المصدر Open Source AI
المصادر المفتوحة في العالم الرقمي هي برامج ومنظومات يستطيع كل شخص استعمالها. يعطي نظام "آندرويد" نموذجاً عن المصدر المفتوح. وتفيد المصادر المفتوحة في نشر العلوم ووضعها بتصرف الجميع. ثمة إشكال في إتاحة ما قد يحدث ضرراً على غرار نشر تركيبة صنع قنابل أو تعديل تركيبة فيروس زكام عادي كي يصبح مؤذياً ومسبباً لالتهابات رئوية مميتة. ماذا عن الأمر نفسه في نظم الذكاء الاصطناعي؟ إن بقاء تلك النظم في أيد قليلة يخل بتوازنات عالمية لكن انفلاتها قد يحدث أضراراً كبرى. وقد يكون الحل في توافق دولي على نظام عالمي في حوكمة الذكاء الاصطناعي.
09- السباق إلى الهاوية Race to the Bottom
تنحصر النماذج الكبرى للذكاء الاصطناعي التوليدي بأيدي شركات قليلة، لكن الشركات كلها والدول كافة تخوض غمار التسابق لتملك تلك التكنولوجيا. قد يطلق ذلك نوعاً من "سباق إلى الهاوية"، إذا تطور ذلك الذكاء بسرعة تفوق القدرة على السيطرة عليه. وهناك مساع للتحكم بذلك المسار على غرار الدعوة إلى وقف موقت لبحوث الذكاء الاصطناعي التوليدي أو التوافق مع الشركات على الالتزام طوعاً بإجراءات تجعله أكثر مأمونية أو مشروع القانون المقترح أمام البرلمان الأوروبي بشأن أول منظومة قانونية تفصيلية عن الذكاء الاصطناعي.
10- استنساخ الصوت Voice Cloning
بمجرد ظهور "تشات جي بي تي" المرتكز إلى نموذج ذكاء اصطناعي كبير للغة، تبدى إمكان استخدام التكنولوجيا نفسها في صنع نماذج عن الصوت والصور والأشرطة وغيرها. ويعني ذلك أنه بدل أن يقدم إلى تقنية الذكاء الاصطناعي التوليدي الكلمات والنصوص، يمكن أن تعطى اللوحات والخطوط والألوان والأشرطة وغيرها. ويستطيع الذكاء الاصطناعي التعرف على خصائص الصوت وتموجاته وتغيراته في وضعيات مختلفة، بالاستناد إلى قواعد بيانات صوتية ضخمة، فيصنع نسخاً طبق الأصل من الصوت الأصلي. وفي 2023، أنتجت أغنية للبيتلز بأصوات راحلين من مغنيها.
11- الذكاء الاصطناعي الضعيف Weak Artificial Intelligence
يطلق تعبير الذكاء الاصطناعي الضعيف على النظم التي تدرب كي تؤدي نوعاً محدداً من المهارات أو ضرباً معيناً من الذكاء. ثمة مثل معروف على ذلك في كومبيوتر "ديب بلو" المتخصص في الشطرنج، وجرى تدريب ذلك الحاسوب الذي يشار إليه بتسمية "النظام الخبير" Expert System، على قواعد وأصول معينة، إضافة إلى تدريبات مفتوحة عبر المباريات مباشرة مع بشر، فدرب نفسه بواسطتها أيضاً.
وتبدو تلك الصورة كأنها إلى زوال. إذ استطاع كومبيوتر "ديب مايند ميو زيرو" Deep Mind MuZero، أن يدرب نفسه على ألعاب الشطرنج و"غو" و"شوغي" و"آتاري 4"، من دون تلقينه قواعد تلك الألعاب، مما يعني أنه اعتمد أساساً على ملاحظة أنماط اللعب. وقد تكرر الأمر مع أنظمة خبيرة أخرى. ويعني ذلك أنه حتى الذكاء الاصطناعي الضعيف يميل إلى التطور صوب نموذج الذكاء الاصطناعي العام.
12- الخطر الوجودي Existential Risk
قبل 10 سنوات أو أكثر، لم تشكل الأصوات المحذرة من خطر وجودي يشكله الذكاء الاصطناعي على الإنسانية، سوى قلة قليلة نظر إليها بحذر وتوجس. وضمت صفوف المحذرين غالباً متمرسين من صناع التقنية الرقمية. ويعطي خبير الكومبيوتر الأميركي الشهير بيل جوي، مثلاً واضحاً عنها. وتذكيراً، أسهم جوي في ابتكار لغة "جافا" Java للكومبيوتر، وأسهم في تأسيس شركة "صن مايكروسيستمز" Sun Microsystems. وحين شدد على خطر كامن في انفلات تطور الكومبيوتر على البشرية، بدا صوتاً نافراً إذ قارن ذلك بأسلحة الدمار الشامل.
في المقابل، صار ذلك التشبيه شائعاً مع وجود تفاوت في المقاربات والرؤى بشأن ذلك الخطر. وتتداخل المصالح في ذلك التفاوت، لكن حتى كبار المديرين في شركات صناعة الذكاء الاصطناعي رفعوا الصوت بمثل ما فعل بيل جوي وأكثر، على غرار ما فعل البروفيسور جيوفري هينتون الذي استقال من منصبه كقائد لفريق الذكاء الاصطناعي في "غوغل" كي يتفرغ لتنبيه البشرية من مخاطر ذلك الذكاء.
13- يو لو YOLO
يختصر مصطلح "يو لو" عبارة You Only Look Once، معناها أنت تبحث مرة واحدة لا غير. وتشير إلى خوارزمية تستعمل في البحث عن شيء محدد (حرف، خط، رقم، موجة...) في الوسط الرقمي، فيلتقطه بسرعة. وتستخدم خوارزمية "يو لو" على نطاق واسع في الأدوات التي تتعامل مع الصور، بسبب سهولة استخدامها وسرعة مردودها.
14- نماذج التشتت Diffusion Models
في بدايات العمل على نماذج ذكية تستطيع التعامل مع الصور وفق طلب مستخدمها، شاع استعمال نوعين متعاكسين من البرامج الذكية، يعمل أحدهما على التقاط كل ما يشبه المطلوب في تركيب الصورة، فيما يعمل الآخر بصورة معاكسة تماماً. وكلما زاد التفاعل بين نوعي البرامج، تحسنت نوعية الصورة وصارت أكثر قرباً من الأصل.
في المرحلة الحالية، تطور الأمر أكثر. وصنعت برامج متطورة يجري تدريبها عبر إعطائها بيانات عن رسوم أصلية، ثم تعمل على إدخال كميات كبيرة من التشويش والتشويه عليها. بعد ذلك، يصار إلى إزالة البيانات عن الرسوم الأصلية من تلك البرامج المتطورة التي تدرب عبر البحث عن التشويش الذي يجب إزالته كي تعود الصورة الأصل إلى الظهور. تسمى تلك البرامج المتطورة "نماذج التشتت"، بمعنى أنها تعمل على اكتشاف التشويش الذي "يشتت" التطابق بين الصورة المولدة بالذكاء الاصطناعي وبين الواقع الفعلي.
15- نموذج تأسيسي Foundation Model
تشتهر جامعة ستانفورد الأميركية بأنها تروج بدأب لنشر مصطلح "نموذج تأسيسي" الذي يشير إلى نموذج في الذكاء الاصطناعي التوليدي يمتلك مهارات متعددة تجعله صالحاً كي يستخدم في أكثر من حقل ومجال. يشبه ذلك أن التدريب الرياضي الأساس الذي يستخدم في أنواع مختلفة من الرياضة، لأنه يدرب العضلات والتراكيب والمفاصل الأساس للجسم، فيصبح جاهزاً بعدها للتخصص في الأنواع الأولمبية كافة. إنه تشبيه تقريبي، لكنه يشير إلى وجود نموذج يمكن استعماله كـ"أساس" في التدرب على أنواع فائقة التنوع من المهارات في التعليم العميق للآلات Deep Machine Learning.
وبالتالي، يعتبر "النموذج اللغوي الكبير" (انظر أعلاه) أقرب الأمثلة عن النموذج الأساس. وثبت بالتجربة أن النموذج اللغوي الكبير الذي استعمل في صنع "شات جي بي تي"، نجح أيضاً كأساس لصنع نماذج للذكاء الاصطناعي في الرسم مثلاً على غرار ما يحصل في مواقع "ميدجورني"Midjourney و"دالي" Dall- E و"دريم بوث"Dream Booth وغيرها.