
هل تتفوق الآلة على العقل البشري؟ اختبار ذكاء يكشف الفرق بين الإنسان والذكاء الاصطناعي
الجريدة العربية
في عصر تزداد فيه هيمنة الذكاء الاصطناعي، بات من المشروع التساؤل: كيف نقيس ذكاءنا مقارنة بهذه الآلات فائقة الأداء؟ وهل يمكن لمجرد اختبار أن يُنصف قدراتنا العقلية أمام قدرات “الذكاء الاصطناعي”؟ منصة “الجريدة العربية” تضعكم في قلب تجربة علمية تقنية مثيرة تكشف بعض المفارقات.
اختبار ذكاء رسمي ومفتوح للجميع
مؤسسة Mensa Norway، المعروفة بتقييماتها الموثوقة للقدرات العقلية، أطلقت اختبارًا مرئيًا بسيطًا، يتكون من 35 لغزًا منطقيًا يجب حلها في 25 دقيقة فقط. لا يتطلب هذا الاختبار أي مهارات رياضية أو معرفية متخصصة، بل يقيس فقط القدرات الإدراكية والمنطقية الصافية.
كل إجابة صحيحة تمنح نقطة، وتُترجم النتيجة إلى مقياس موحد للذكاء (IQ) يتراوح بين 85 و145. متوسط الذكاء البشري يقف عادة عند 100، بينما يُعتبر من يتجاوز 130 ضمن فئة “العباقرة” — مع تحفظ علمي على دقة هذا التوصيف.
ورغم بساطة الواجهة وسهولة الاستخدام عبر المتصفح، لا يدّعي هذا الاختبار أنه بديل للاختبارات الإكلينيكية المعتمدة، بل هو أداة معيارية مرجعية تستند إلى معايير Mensa، وهي منظمة عالمية تأسست سنة 1946 وتُعرف باحتضانها لأكثر الأشخاص ذكاءً حول العالم.
عندما تدخل الذكاء الاصطناعي على الخط
في خطوة غير مسبوقة، أُجري نفس اختبار Mensa Norway على 24 نموذجًا من نماذج الذكاء الاصطناعي المتقدمة، ضمن دراسة أنجزتها Tracking AI ونشرتها منصة Visual Capitalist. وقد جاءت النتائج لتفتح بابًا جديدًا للنقاش العلمي.
المفاجأة؟ بعض النماذج، مثل نموذج OpenAI o3، حققت معدلات IQ تصل إلى 135، أي ضمن نطاق العباقرة حسب المقاييس التقليدية. في المقابل، نماذج أخرى مثل GPT-4o (Vision)، المخصصة للمعالجة البصرية، لم تتجاوز عتبة 63.
اسم النموذج | درجة QI (اختبار مينسا النرويج) |
---|---|
OpenAI o3 | 135 |
Claude-4 Sonnet | 127 |
Gemini 2.0 Flash | 126 |
Gemini 2.5 Pro | 124 |
OpenAI o4 mini | 122 |
Claude-4 Opus | 120 |
Grok-3 Think | 112 |
DeepSeek R1 | 106 |
Llama 4 Maverick | 105 |
OpenAI o1 Pro | 102 |
GPT4.5 Preview | 99 |
Bing Copilot | 86 |
Mistral | 85 |
GPT-4o (Vision) | 63 |
Grok-3 Think (Vision) | 60 |
هل هذا يعني أن الذكاء الاصطناعي أذكى من الإنسان؟
الجواب العلمي الدقيق هو: ليس بالضرورة.
اختبارات IQ مثل اختبار Mensa تُقيس نوعًا واحدًا فقط من الذكاء: المنطق الاستنتاجي المجرد. ونماذج مثل o3 صُممت أساسًا للتفوق في هذا المجال. فهي مبرمجة لتنفيذ عمليات عقلية معينة بسرعة ودقة، خاصة تلك المرتبطة بالتحليل والتجريد والحساب المنطقي.
لكن، هل يمكن مقارنة هذه النماذج بإنسان يمتلك الإبداع، الحدس، الذكريات، المشاعر، الحس العملي، والقدرة على الفهم السياقي واللغوي العميق؟ بالطبع لا. فكما أن اختبار الذكاء لا يمكنه الحكم على ذكاء طفل يعاني من عسر تعلم، لا يمكنه أيضًا تقييم قدرات الذكاء الاصطناعي متعددة الوظائف والمجالات.
بل أكثر من ذلك، النموذج o3 الذي تفوق في اختبار الذكاء، يمكن أن يُهزم بسهولة من طرف طفل في مهارات مثل اللعب، فهم العلاقات الاجتماعية، اتخاذ قرارات واقعية، أو حتى رواية قصة تحمل مشاعر ومعاني معقدة.
اختلاف الذكاء حسب الغاية والوظيفة
النماذج التي تدمج الرؤية (Vision-based AI) أثبتت ضعفها في حل الألغاز المنطقية، ليس لأنها “غبية”، بل لأنها غير مخصصة لذلك. وظيفتها هي المعالجة البصرية، التعرف على الصور، توليد فيديو، وفهم السياق البصري، وليس حل الأحجيات المنطقية.
وهنا تبرز نقطة مهمة في علم الذكاء: الذكاء ليس رقمًا ثابتًا، بل قدرة على حل نوع معين من المشكلات في سياق معين. تمامًا كما أن اختبار الذكاء لا يمثل الحقيقة الكاملة عن إنسان، فإنه لا يعكس الإمكانات الكاملة لنموذج ذكاء اصطناعي.
ذكاء الإنسان… أكثر من مجرد معدل رقمي
في النهاية، رغم تفوق بعض النماذج على المتوسط البشري في اختبارات معينة، تبقى المقارنة محدودة، إن لم تكن مضللة. الذكاء البشري متعدد الأبعاد، يتداخل فيه العاطفي والاجتماعي والحسي، بينما الذكاء الاصطناعي هندسة مخصصة لأهداف محددة.
الرهان ليس في أن نتفوق على الآلة، بل أن نفهم حدودها، ونستخدمها كمكمل لا كبديل. أما اختبار الذكاء، فليظل ما هو عليه: أداة فضولية، لا أكثر.