شركة ميتا تتلاعب بمقاييس الذكاء الاصطناعي في نموذجها الجديد Llama 4

شركة ميتا تتلاعب بمقاييس الذكاء الاصطناعي في نموذجها الجديد Llama 4
المؤلف Amgad
تاريخ النشر
آخر تحديث




أطلقت شركة ميتا نموذجين جديدين من Llama 4: نموذج أصغر يسمى "Scout"، وآخر متوسط الحجم يُدعى "Maverick"، الذي تزعم الشركة أنه قادر على التفوق على GPT-4o و Gemini 2.0 Flash "في مجموعة واسعة من المقاييس المعروفة".

سجل "Maverick" بسرعة المركز الثاني في موقع LMArena، وهو موقع خاص بمقارنة أداء النماذج الذكية حيث يقوم المستخدمون بمقارنة مخرجات الأنظمة المختلفة والتصويت على الأفضل.


في بيان ميتا الصحفي، تم تسليط الضوء على ELO الخاص بـ Maverick والذي وصل إلى 1417، مما جعله يتفوق على GPT-4o من OpenAI ويقترب من Gemini 2.5 Pro. (يشير ارتفاع درجة ELO إلى أن النموذج يفوز أكثر في المباريات عند مواجهته لمنافسين آخرين).

بدا هذا الإنجاز وكأنه يضع Llama 4 مفتوح المصدر من ميتا كمتنافس جاد مع النماذج المغلقة من OpenAI و Anthropic و Google. ولكن، سرعان ما اكتشف باحثو الذكاء الاصطناعي الذين قاموا بالتدقيق في مستندات ميتا شيئًا غريبًا.

في عالم الذكاء الاصطناعي، تعتبر ميتـا واحدة من اللاعبين الرئيسيين، لكن مؤخرًا، اتهمت الشركة بالتلاعب في مقاييس الأداء لمنتجها الجديد Llama 4، مما أثار جدلاً واسعاً. كانت الشركة قد قدمت اثنين من النماذج الجديدة، Scout و Maverick، حيث زعمت أن Maverick يستطيع التفوق على GPT-4o و Gemini 2.0 Flash في مجموعة من المقاييس المعروفة.


التحقيق وراء النتائج

بينما بدا Maverick وكأنه قد حقق إنجازًا ملحوظًا في موقع LMArena، حيث وصل إلى المركز الثاني بعد Gemini 2.5 Pro، اكتشف باحثو الذكاء الاصطناعي مؤخرًا تلاعبًا في المقاييس والنتائج، مما أثار الشكوك حول نزاهة هذه البيانات المقارنة. تم التلاعب في طريقة تقديم النتيجة لتمكين Maverick من التفوق على GPT-4o، مما يطرح تساؤلات حول المصداقية والشفافية في المقاييس المستخدمة.


ردود فعل المجتمع البحثي

أدى هذا الاكتشاف إلى ردود فعل متباينة في المجتمع الأكاديمي والتقني، حيث طالب البعض بضرورة فرض معايير موحدة وأكثر دقة لتقييم أداء نماذج الذكاء الاصطناعي. هذا التلاعب، إن ثبت، قد يؤثر على السمعة والمصداقية للشركات التقنية الكبرى في سباق الذكاء الاصطناعي.



الخلاصة

لا شك أن Llama 4 و Maverick من ميتا لا يزالان يمثلان تقدمًا ملحوظًا في المجال، لكن الاتهامات بالتلاعب في المقاييس تثير الشكوك حول المقارنات المعيارية في الذكاء الاصطناعي. في ظل المنافسة الشرسة بين OpenAI و Google و Anthropic، سيظل من المهم أن تسعى الشركات إلى تقديم بيانات شفافة ومصداقية لضمان توازن المنافسة.



تعليقات

عدد التعليقات : 0