أذكى نماذج الذكاء الاصطناعي لعام 2026

يتزايد التنافس على بناء نماذج ذكاء اصطناعي أكثر ذكاءً في القمة.

هذا التصور، وه جزء من اسبوع الذكاء الاصطناعي الذي تنظمه Visual Capitalist برعاية Terzo، يصنف الأنظمة الرائدة باستخدام بيانات من TrackingAI، التي تقيس أداء النماذج بناءً على اختبار Mensa Norway IQ اعتبارًا من أبريل 2026.

تُظهر النتائج من يتصدر اليوم ومدى ضآلة الفارق بين المتنافسين الرئيسيين، مع تجمع نماذج حدودية متعددة بالقرب من قمة لوحة المتصدرين.

تعادل في الصدارة

يقدم التصنيف لمحة سريعة عن أداء نماذج الذكاء الاصطناعي الرائدة اليوم في مهام التعرف على الأنماط المجردة، ومدى تقارب المنافسة.

كما يوضح الجدول أدناه، فإن فجوة صغيرة فقط تفصل الآن بين أفضل الطرازات:

معدل الذكاء في مينسا النرويج (أبريل 2026)

وضع الخبير في Grok-4.20

145

OpenAI GPT 5.4 Pro (الرؤية)

145

معاينة Gemini 3.1 Pro

141

OpenAI GPT 5.4 التفكير (الرؤية)

139

OpenAI GPT 5.3

136

Grok-4.20 وضع الخبير (الرؤية)

133

OpenAI GPT 5.4 Thinking

133

ميتا ميوز سبارك

133

معاينة Gemini 3.1 Pro (رؤية)

132

كوين 3.5

130

كلود-4.6 أوبوس

130

كيمي كيه 2.5

127

مانوس

115

ديب سيك آر 1

112

ديب سيك الإصدار الثالث

111

أبرز ما يُلاحظ هو مدى تقارب المراكز الأولى في قائمة المتصدرين. يتشارك كل من Grok-4.20 Expert Mode و OpenAI المركز الأول برصيد 5.4 GPT 145 نقطة، بينما يليهما Gemini 3.1 Pro Preview مباشرةً برصيد 141 نقطة .

يشير هذا التباين الضيق إلى أن نماذج الذكاء الاصطناعي الرائدة تتقارب بشكل متزايد في القمة، حيث يمكن أن يؤدي اختلاف بضع نقاط فقط إلى تغيير التصنيفات.

كما أن المكاسب التي تحققت منذ عام 2025 جديرة بالملاحظة. فقد بلغ أعلى مستوى في العام الماضي 135، مقارنةً بـ 145 في نتائج هذا العام، مما يسلط الضوء على سرعة تحسن النماذج الرائدة في هذا المعيار.

لا تواكب جميع النماذج التطورات. فمن بين كبار مطوري الذكاء الاصطناعي، يحتل نموذج ميسترال المرتبة الأدنى في هذه المجموعة من البيانات، حيث سجل 97 نقطة ، وهو أقل بكثير من المجموعة الرائدة.

كيف تُجري TrackingAI الاختبار

تستخدم منصة TrackingAI اختبار Mensa Norway العام، وهو عبارة عن مجموعة من 35 لغزًا بصريًا. بالنسبة للنماذج غير البصرية، تُطرح الأسئلة شفهيًا، بينما تتلقى النماذج البصرية الصور الأصلية مباشرةً.

لذا، يُفضّل فهم هذه النتائج كمعيار للمقارنة، وليس كمقياس نهائي للذكاء العام. ولأن الاختبار يعتمد أساسًا على الجانب البصري، فقد تختلف نتائج النماذج تبعًا لطريقة عرض الأسئلة.

لماذا يُعد هذا المعيار مهمًا؟

تُعدّ لوحة المتصدرين في TrackingAI مفيدة لأنها توفر طريقة بسيطة ومألوفة لمقارنة أداء الاستدلال بمرور الوقت. ويشير الموقع أيضًا إلى أنه في حال رفض النموذج الإجابة، يُطرح عليه السؤال نفسه حتى 10 مرات، وتُستخدم أحدث إجابة في حساب النتيجة.

مع ذلك، فإنّ معيار قياس الذكاء لا يغطي سوى جانب واحد من القدرات. فهو لا يقيس كل ما يهم في استخدام الذكاء الاصطناعي في العالم الحقيقي، مثل القدرة على البرمجة، والموثوقية في المعلومات، واستخدام الأدوات، أو الأداء في المجالات المهنية.