إذا ما جرب مستخدمو التكنولوجيا التحدث باستخدام لهجتهم العربية المحكية، مع أحد التطبيقات الصوتية المساعدة في الحواسيب أو الهواتف المحمولة، مثل سيري وكورتانا وغوغل، فإن التطبيق لن يستجيب لأن تلك اللهجات غير معرفة عليها، لكن قد يصبح الأمر سهلاً خلال السنوات المقبلة.
ضمن مشروع تشرف عليه جامعة بيرزيت في فلسطين والجامعة العربية الأميركية في لبنان، يعمل باحثون في الذكاء الاصطناعي على حل هذه المشكلة وإدراج اللهجات العربية المحكية ضمن اللغات المستخدمة تكنولوجياً، بخاصة أن اللغة العربية بمختلف لهجاتها تعتبر من اللغات العشر الأكثر استخداماً في العالم، وعدم قدرة المستخدمين على استعمال لهجاتهم اليومية عبر الإنترنت، قد يحد من استخدام الناس لكثير من الخدمات بسبب عدم إتقانهم العربية الفصحى أو أية لغة عالمية أخرى.
توثيق اللهجات
يتلخص عمل الباحثين والمبرمجين في الجامعتين بالتعاون مع الأمم المتحدة، على تطوير منصة لغة عربية تضم مجموعة من اللهجات العامية، من أجل تسهيل عملية بناء تطبيقات حاسوبية تفهم هذه اللهجات وتسهل استخدام التكنولوجيا لدى غير الناطقين بالعربية الفصحى، إذ يوضح أستاذ الذكاء الاصطناعي في جامعة بيرزيت مصطفى جرار، أن الفكرة ليست وليدة اللحظة، إذ بدأت الجامعة منذ عام 2011 العمل على حفظ اللهجات، بدءاً من العامية الفلسطينية ضمن مدونة اسمها "كراس"، ومن ثم اللهجة العامية اللبنانية ضمن مدونة اسمها "بلدي"، وفي نهاية العام الماضي تمت إضافة أربع لهجات أخرى وهي العراقية واليمنية والسودانية والليبية، لتكون متاحة للمستخدمين.
ويتابع جرار الذي كان المشرف الرئيس على تأسيس منصتي كراس وبلدي سابقاً، أن محتوى المنصة الآن للغات الست يصل إلى مليون و300 ألف كلمة، وقد تم جمعها من خلال منصات التواصل الاجتماعي، لكن التحدي الأكبر تمثل في تصريف هذه الكلمات، وتحديد إلى أي قسم تنتمي، كأن تكون اسماً أو فعلاً أو صفة أو غيرها، ومن ثم ربط هذه الكلمات باللغة الفصحى واللغة الإنجليزية لتسهيل عملية البحث.
تعليم العربية لغير الناطقين بها
جاءت فكرة المشروع من الحاجة إلى تطبيقات برمجية تتعامل مع اللهجات العامية، سواء باستخدام الصوت أو الترجمة، إذ بإمكان الشركات التي تطور تطبيقات المساعدة الناطقة أن تحصل على محتوى هذه المنصة بشكل مجاني لاستخدامه. ويوضح جرار أن هناك عديداً من الفوائد للمشروع، تتمثل في تسهيل استخدام الصوت للتحكم في الإنترنت باللهجات العامية، بخاصة لدى من لا يتحدث الفصحى، إضافة إلى مساعدة غير الناطقين بالعربية على تعلم اللغة المحكية لتسهيل عملية التواصل.
اقرأ المزيد
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
أما الأمر الآخر المهم بحسب جرار، فهو عملية التوثيق الثقافي للهجات المستخدمة التي تقدمها هذه المنصة، على اعتبار أن اللغات جزء من الهوية الثقافية لكل منطقة.
كل ما على الشخص فعله لاستخدام منصة "كراسات"، هو وضع الكلمة المراد إيجاد المعنى لها، ومن ثم تحديد لهجة معينة، للحصول على أصل الكلمة ومعناها في اللهجات المختارة ونوعها من الكلام، وبعض الأمثلة على استخدامها، وهذا ما يجعلها سهلة لكثيرين، بخاصة في ظل غياب مصادر تعليمية للهجات العربية، ووجود كثير من الكلمات المشتركة في ما بينها، أو تلك التي يتم استخدامها في اللهجات العامية لكنها في الأساس فصيحة. فكلمة "تأكل" على سبيل المثال، تستخدم في جميع اللهجات الموجودة.
ويشير جرار إلى أنه يجري العمل حالياً على زيادة محتوى هذه المنصة من أجل ربطها بالمدخلات اللغوية وتوفيرها كمنصة بحث علمي للغويين العرب.