ملخص
خرج بعض المطورين بعد معاينتهم خوارزمية " #تويتر" بقراءة لافتة تشرح آلية رواج #التغريدات أهمها أن تأثير عدد #الإعجابات يفوق تأثير #الردود 30 ضعفاً
في حين راهن كثير من متابعي وموظفي "تويتر" على أن إيلون ماسك يوقّع بقراراته التي اعتبرها البعض "متسرعة" على ورقة نهاية "تويتر"، يبدو أن الأخير مستمر في تطبيق منهجيته التي أشار إليها منذ اليوم الأول لاعتلائه عرش المنصة. إذ بعد أن أعلن في تغريدة نشرها منتصف الشهر الفائت نيته رفع السرية عن الخوارزمية المتعلقة بالتوصية بالتغريدات، وإصدار الكود الذي يمكن من فهم أكثر تفصيل للخوارزمية بغرض كسب الثقة وتحقيق الشفافية للمستخدمين حول كيفية عمل أنظمته، أوفى الرئيس التنفيذي لشركة "تيسلا" بوعده، لتصبح اليوم أجزاء من شيفرة المصدر الخاص بخوارزمية المنصة في متناول جميع المستخدمين حول العالم، بعد أن نشرها على موقع "غيت هاب"GitHub التابع لـ"مايكروسوفت"، والذي يوفر استضافة للمشاريع مفتوحة المصدر ونظام تحكم في الوصول بغرض تتبع الأخطاء، بحيث يتيح للمبرمجين الاطلاع واقتراح التعديلات.
وأعقبها ماسك بتغريدة كتب فيها "لا شك أنه سيتم اكتشاف العديد من المشكلات المحرجة، لكننا سنصلحها بسرعة". وهنا لمح البعض مازحاً بأن إيلون يحاول بـ"حيله العبقرية" أن يرمي طعماً للمطورين حول العالم لتفنيد خوارزميته وإظهار مناطق الضعف والخلل، فيما سيوحي لهم كما لو أنهم يظهرون مهاراتهم بتسجيل نقاط في مرماه، في الوقت الذي سيتمكن فيه ماسك من إصلاحها وتطويرها مجاناً!
فما هو مضمون هذه الخوارزمية التي كشف عنها؟ وما هي المكونات الرئيسة المستخدمة لبناء "التايم لاين" الخاص بك على "تويتر"؟
500 ميلون تغريدة
بحسب مقدمة المدونة، يجد "تويتر" أثناء سعيه إلى إيصال الأخبار حول أفضل ما يحدث في العالم في الوقت الحالي، ضرورة توفير خوارزمية توصية تعمل كفلتر لتصفية عدد قليل من التغريدات من مجموع ما يقارب 500 مليون تغريدة تنشر يومياً، لتظهر في النهاية أعلى الصفحة الرئيسة أو التايم لاين الخاص بكل مستخدم على شكل موجز خاص For you مختار من قبل "تويتر".
وتقوم القاعدة التي بنيت على أساسها توصيات "تويتر"، على مجموعة أساسية من النماذج والميزات القادرة على استخراج المعلومات داخل التغريدات ومن المستخدمين وبيانات التفاعل. والغرض من هذه النماذج تقديم إجابات دقيقة على أسئلة مهمة، تساعد "تويتر" على تقديم توصيات ذات صلة، حددها في سؤالين أساسيين هما: "ما هو احتمال تفاعلك مع مستخدم آخر في المستقبل؟"... و"ما هي المجتمعات الموجودة على تويتر، وما التغريدات الشائعة ضمنها؟".
وصيغت هذه الخوارزمية بسلسلة من التوصيات تتكون من مراحل ثلاث رئيسة، تبدأ بطلب تجميع أفضل التغريدات من مصادر توصية مختلفة ضمن عملية تسمى "تحديد مصادر الترشيح"، ثم يطلب ترتيب التغريدات باستخدام نموذج التعلم الآلي، وتنتهي الخوارزمية بالتصفية عن طريق تطبيق تقنيات الكشف والتحليل العددي والفلاتر، مثل تصفية التغريدات من المستخدمين الذين تم حظرهم أو من المحتوى غير المناسب Not suitable for work وغير الآمن، والذي يشار إليه اختصاراً NSFW، أو من التغريدات التي تصفحها المستخدم مسبقاً.
هوم ميكسر Home Mixer
هوم ميكسر Home Mixer هو الاسم الذي أطلق على الخدمة المسؤولة عن ترتيب وتزويد المستخدم بالتايم لاين الخاص به، إذ تعمل هذه الخدمة بمثابة العمود الفقري الذي يربط مختلف مصادر الترشيح والاستدلال وغيرها. وقد أرفق "تويتر" المقال برسم بياني يوضح المكونات والأجزاء الرئيسة المستخدمة لبناء "التايم لاين" والتي يتم استدعاؤها من هذا النظام، وهي تتألف أولاً من "مصادر الترشيح" التي تملك المنصة العديد منها وتستخدمها لاسترداد التغريدات الحديثة ذات الصلة للمستخدم. إذ يحاول "تويتر" أن يستخرج لكل طلب أفضل 1500 تغريدة من مجموعة من مئات الملايين بواسطة هذه المصادر، ويأخذ مرشحين من الأشخاص الذين يتابعهم المستخدم ويسميهم "تويتر" داخل الشبكة In-Network ، ومن الأشخاص الذين لا يتابعهم وتسميهم خارج الشبكةOut-of-Network .
داخل الشبكة وخارجها
وبحسب "تويتر"، يختلف اليوم نوع التغريدات من مستخدم لآخر لكن في المتوسط يتألف التايم لاين For Youمن 50 في المئة تغريدات داخل الشبكة و50 في المئة منها خارج الشبكة، ويعود المصدر داخل الشبكة إلى المصدر المسؤول عن تجميع تغريدات من المستخدمين المتابعين. والعنصر الأكثر أهمية في ترتيب التغريدات داخل الشبكة هو الرسم البياني Real Graph، وهو نموذج يتنبأ باحتمالية المشاركة بين المستخدمين، كلما زادت درجة Real Graph بين المستخدم صاحب التايم لاين والمستخدم كاتب التغريدة، يقوم "تويتر" بتضمين المزيد من تغريداته.
أما بالنسبة للمصدر خارج الشبكة، فيعد العثور على تغريدات ذات صلة خارج شبكة المستخدم مسألة أكثر تعقيداً، وهنا يتساءل "تويتر": "كيف يمكننا معرفة ما إذا كانت تغريدة معينة ستكون ذات صلة بك إذا لم تتابع المؤلف؟"، لذا تتخذ المنصة طريقتين لمعالجة هذا الأمر، إما عن طريق تقنية Social Graph بحيث يتبع "تويتر" هذا النهج لتقدير ما قد يجده ذا صلة من خلال تحليل تفاعلات الأشخاص الذين يتابعهم المستخدم أو أولئك الذين لديهم اهتمامات مماثلة، ويقوم بإنشاء تغريدات المرشحين بناء على الإجابة على أسئلة من نوع: ما التغريدات التي تفاعل معها الأشخاص الذين أتابعهم أخيراً؟ وبعدها يقوم بترتيب التغريدات الناتجة باستخدام نموذج الانحدار اللوجستي logistic regression، وهو نموذج إحصائي يستخدم للتنبؤ باحتمالية وقوع حدث ما بمعرفة إضافية لمتغيرات يمكن أن تكون مفسرة أو مرتبطة بهذا الحدث.
اقرأ المزيد
يحتوي هذا القسم على المقلات ذات صلة, الموضوعة في (Related Nodes field)
التضمين والتصنيف والتصفية
ثم نصل إلى مرحلة تسمى "مساحات التضمين" التي تعمل من خلال توليد تمثيلات رقمية لاهتمامات المستخدمين ومحتوى التغريدات، الأمر الذي يمكن "تويتر" بعد ذلك من حساب التشابه بين مستخدمين أو تغريدات في مساحة التضمين هذه، إذ تهدف إلى الإجابة عن سؤال أكثر عمومية حول مدى تشابه المحتوى وهو: ما التغريدات والمستخدمين الذين يشابهون اهتماماتي؟
وتعد SimClusters واحدة من أكثر مساحات التضمين فائدة في "تويتر"، إذ تكشف عن المجتمعات التي ترتكز عليها مجموعة من المستخدمين المؤثرين باستخدام خوارزمية تحليل مصفوفة مخصصة. وقد أشار "تويتر" إلى أن هناك مجموعة من 145 ألف مجتمع يتم تحديثها كل ثلاثة أسابيع، وينظر إلى الشعبية الحالية للتغريدة في كل مجتمع، بمعادلة أنه كلما زاد إعجاب مستخدمين من المجتمع بالتغريدة، زاد ارتباط التغريدة بهذا المجتمع.
ثم تأتي مرحلة التصنيف والترتيب التي تنجز باستخدام 48 مليون متعامل تقريباً يشكلون شبكة ترصد باستمرار تفاعلات التغريدات المتمثلة بالإجابات وإعادة التغريد والردود، لتحسين المشاركة الإيجابية، ومن خلال ذلك تحصل كل تغريدة على درجة ترفع احتمالية شملها في الترتيب.
وبعد الانتهاء من مرحلة التصنيف، تطبق الأساليب التجريبية والمرشحات التي تعمل معاً لتقديم خلاصة متوازنة ومتنوعة، مثل التصفية المعتمدة على ما يظهر أمام المستخدم وتوازن المحتوى داخل الشبكة وخارجها، والتغريدات المحررة وتنوع المؤلف والمحادثات والإثبات الاجتماعي والتغذية الراجعة وغيرها.
العامل المؤثر على الانتشار
والخطوة الأخيرة في العملية هي الدمج والتقديم. وفي هذه المرحلة تصبح لدى Home mixer مجموعة من التغريدات التي تمت فلترتها، وهنا يقوم النظام بدمج هذه التغريدات مع محتوى آخر، بخلاف التغريدات مثل الإعلانات، لعرضها على التايم لاين الخاص بالمستخدم.
وكان قد خرج بعض المطورين بعد معاينتهم للخوارزمية، بقراءة لافتة تشرح آلية رواج التغريدات، أهمها أن تأثير عدد الإعجابات يفوق تأثير الردود 30 ضعفاً، ويفوق تأثير إعادة التغريد تأثير الردود 20 مرة، إضافة إلى أن التغريد المستخدم بلغة غير اللغة الخاصة به تضعف انتشار تغريدته، وأن إرفاق التغريدة بصورة أو مقطع فيديو يعزز من انتشارها، وأخيراً أوضح بعض المبرمجين ألا تأثير للهاشتاغات على احتمالية ظهور التغريدة.
وأخيراً هل سيكسب ماسك ثقة لم يسبقه عليها أحد في عالم منصات "السوشيال ميديا"؟ وهل كشف أسرار "تويتر" فعلاً؟ أم أن هناك غايات أخرى ستتكشف تدريجاً في المقبل من الأيام؟