لحظة مفصلية في تاريخ الذكاء الاصطناعي.. GPT-4.5 يتفوّق على البشر في اختبار تورينج

تنين

عضو جديد
إنضم
17 ديسمبر 2024
المشاركات
124
التفاعل
165 5 1
الدولة
Iraq
لحظة مفصلية في تاريخ الذكاء الاصطناعي.. GPT-4.5 يتفوّق على البشر في اختبار تورينج

وائل زكير
السبت، 5/4/2025 8:25 م

توصلت دراسة جديدة إلى أن نموذج الذكاء الاصطناعي GPT-4.5، الذي طورته OpenAI، لم يكتفِ باجتياز اختبار تورينج فحسب، بل تفوّق أيضًا على البشر في إقناع المشاركين بإنسانيته. هذا الاكتشاف، الذي نُشر في ورقة بحثية أولية بانتظار مراجعة الأقران، يمثل تحولًا جذريًا في العلاقة بين الإنسان والآلة، ويثير تساؤلات جوهرية حول مستقبل الذكاء الاصطناعي ومكانته في المجتمع.

اختبار تورينج، الذي صممه عالم الحوسبة البريطاني آلان تورينج عام 1949، يُعد معيارًا كلاسيكيًا لقياس مدى "تشابه" الآلة بالإنسان. ويعتمد الاختبار على قدرة الذكاء الاصطناعي في إجراء محادثة مع شخص دون أن يتمكن المتلقي من تحديد ما إذا كان يتحدث مع آلة أم إنسان.

في هذه الدراسة، أجرى باحثون من جامعة كاليفورنيا نسخة محدثة من اختبار تورينج، حيث تفاعل المشاركون مع كلٍّ من إنسان حقيقي ونموذج ذكاء اصطناعي، ثم طُلب منهم تحديد من هو الإنسان.

وعندما مُنح GPT-4.5 شخصية محددة ليتقمصها – مثل "شاب مثقف وواعٍ ثقافيًا" – اعتقد المشاركون أنه إنسان في 73% من الحالات. وهي نتيجة تفوق بكثير النسبة العشوائية المتوقعة التي تبلغ 50%.

لكن اللافت أكثر هو أن أداء النموذج تراجع إلى 36% فقط عندما لم يُمنح أي "شخصية" يتقمصها، ما يبرز أهمية السياق والتمثيل السردي في تقنيات الذكاء الاصطناعي الحديثة. في المقابل، سجل النموذج GPT-4o من OpenAI نسبة 21% فقط، في حين حصل الروبوت ELIZA، الذي يعود إلى ستينيات القرن الماضي، على 23%، وفقا لمجلة " نيوزويك".

وعلق كارستن يونغ، رئيس قسم الاقتصاد الكلي والذكاء الاصطناعي في معهد أبحاث السياسات العامة، على النتائج بقوله: "لقد وصل الذكاء الاصطناعي إلى مستوى لم يعد الناس قادرين فيه على تمييزه عن البشر في المحادثات النصية. بل تُظهر هذه الدراسة أن الآلة قد تبدو أكثر إنسانية من الإنسان نفسه".

وأضاف: "لقد تجاوزنا 'الوادي الغريب' الذي كانت فيه الروبوتات تُشبه البشر بشكل غير مريح، ودخلنا مرحلة جديدة تمامًا. الذكاء الاصطناعي بات يُستخدم اليوم في العلاج، والدعم النفسي، وحتى الرفقة، وقد يغير جذريًا طريقة تواصلنا عبر الإنترنت".

وتابع يونغ أن السياسات الحكومية لا تزال متأخرة عن هذا التطور المتسارع، مؤكدًا على الحاجة إلى تحديثات تشريعية وتنظيمية تواكب قدرات الذكاء الاصطناعي الحديثة.

وفي تعليق منفصل، كتب الباحث كاميرون جونز عبر منصة X: "تُظهر هذه النتائج أن أنظمة الذكاء الاصطناعي قد تتمكن من أداء مهام بشرية – مثل تقديم الاستشارات القانونية أو التفاعل الاجتماعي – دون أن يدرك الآخرون أنهم لا يتحدثون مع شخص حقيقي".

وحذر جونز من أن هذا التقدم قد يؤدي إلى تغيّرات جذرية في سوق العمل، وزيادة خطورة هجمات الهندسة الاجتماعية، وحتى اضطرابات اجتماعية واسعة.

ما هو اختبار تورينج؟

اختبار تورينج هو تجربة فكرية اقترحها عالم الرياضيات والحوسبة البريطاني آلان تورينج عام 1950 في ورقته الشهيرة "Computing Machinery and Intelligence".

هدف الاختبار: معرفة ما إذا كانت الآلة قادرة على إظهار سلوك ذكي لا يمكن تمييزه عن سلوك الإنسان.

كيف يعمل؟

يتم وضع إنسان (الحكم) في محادثة نصية مع طرفين مخفيين: أحدهما إنسان والآخر آلة (ذكاء اصطناعي).

إذا لم يتمكن (الحكم) من التمييز بدقة بين الآلة والإنسان بناءً على المحادثة، فإن الآلة تُعتبر "ذكية" حسب معايير الاختبار.

ما الجديد في اختبار GPT-4.5؟

في الدراسة الحديثة، طُبِّقت نسخة معدّلة من اختبار تورينج التقليدي، أكثر واقعية ودقة، وجاءت بتغييرات أساسية:

1. مشاركة نماذج متعددة:

تمت مقارنة GPT-4.5 بنماذج مختلفة:

GPT-4o (أحدث إصدار مفتوح من OpenAI)

LLaMA 3.1–405B (من Meta)

ELIZA (أول روبوت محادثة من الستينيات)

2. إضافة "شخصية" للنموذج:

عندما أُعطي GPT-4.5 شخصية مثل "شاب مثقف وواعٍ ثقافيًا"، زادت قدرته على الإقناع بدرجة كبيرة.

النتيجة: تم التعرف عليه بالخطأ كإنسان في 73% من الحالات.

3. وضع بدون شخصية:

عند إزالة الشخصية والتفاعل بشكل عام، تراجعت النتيجة إلى 36% فقط.

4. معيار المقارنة:

المعدل المتوقع عشوائيًا هو 50%.

أي نتيجة أعلى من 50% تعني أن الذكاء الاصطناعي أقنع البشر بإنسانيته أكثر من البشر أنفسهم.

لماذا يعتبر ذلك إنجازًا؟

تاريخيًا: لم يكن أي نموذج سابق يتجاوز البشر في هذا الاختبار.

نفسيًا واجتماعيًا: أصبح الناس يرون الذكاء الاصطناعي أكثر "إنسانية" من الإنسان، عند تقديمه بالشكل المناسب.

تقنيًا: يُظهر أهمية تصميم السياق والشخصيات في أداء الذكاء الاصطناعي.

أمنيًا: قد يؤدي إلى استخدام الذكاء الاصطناعي في الهندسة الاجتماعية أو التلاعب النفسي.




 
أكرر مطلبي بفتح قسم خاص لأخبار عالم الذكاء الصناعي حيث أنها قد لا تكون مرتبطة بموضوع عسكري أو أمني محدد و لكن قد تكون لها استخدامات عسكرية أو أمنية غير مباشرة.
الإدارة @الإدارة
 
نفس الخبر يتم تكريره كل 6 أشهر لزيادة سعر الأسهم، قليل من البحث يظهر أن إجتياز اختبار تورينغ ليس بالعظمة التي تحاول بعض الشركات و المواقع أن تقنع الناس بها.
 

المرفقات

  • ai.PNG
    ai.PNG
    40.5 KB · المشاهدات: 26
نفس الخبر يتم تكريره كل 6 أشهر لزيادة سعر الأسهم، قليل من البحث يظهر أن إجتياز اختبار تورينغ ليس بالعظمة التي تحاول بعض الشركات و المواقع أن تقنع الناس بها.
منقول من الورقة البحثية نفسها:

Over the last 75 years there have been many attempts to construct systems that could pass the Turing test (Shieber,, 1994; Loebner,, 2009), though none have succeeded (Oppy and Dowe,, 2021; Mitchell,, 2024). The development of Large Language Models (LLMs)—connectionist systems which learn to produce language on the basis of distributional statistics and reinforcement learning feedback—has led to renewed interest in the Turing test (Bievere,, 2023; James,, 2023; Borg,, 2025; Giunti,, 2025). Two recent studies have evaluated LLMs in a simplified two-party version of the test where the interrogator talks to either a machine or another participant and must decide if they are human (Jannai et al.,, 2023; Jones and Bergen, 2024a,). One such study (Jones and Bergen, 2024a,), found that GPT-4, when prompted to adopt a particular persona, was judged to be
human 54% of the time.

Although this suggests that people were no better than chance at determining whether or not GPT-4 is a human or a machine, Turing’s original three-party formulation of the test is likely to be a more challenging test for several reasons (Restrepo Echavarría,, 2025; Mitchell,, 2024). First, it allows the interrogator to make a direct comparison between a real person and a machine, rather than comparing the machine to their mental model of human behaviour. Second, it ensures that the interrogator has an appropriate base rate of the incidence of humans and machines (where participants in the two-party formulation could err by judging all witnesses to be humans or machines). Extant implementations of the three-party Turing test using older LLMs have found that they are detected as the artificial participant at rates of greater than 90% (Restrepo Echavarría,, 2025; Temtsin et al.,, 2025).

With these historical, theoretical, and practical stakes at play, we conducted a randomised, controlled three-party Turing test to ask whether contemporary LLMs are distinguishable from humans in this setting. We evaluated GPT-4.5 and LLaMa-3.1-405B, and used GPT-4o and ELIZA as baseline models to contextualize their performance. In order to quantify the importance of prompting, we compared the performance of models with and without prompts that encouraged them to adopt a specific persona. As a test of robustness, we conducted experiments separately on two independent populations (undergraduate students and Prolific workers). In each study we tested the same pre-registered hypotheses (Jones and Bergen, 2025a,; Jones and Bergen, 2025b,), including that participants would not be significantly better than chance at distinguishing between humans and the evaluated models
(GPT-4.5 and LLaMa).
الورقة البحثية

الخلاصة:
التجربة التي حدثت عام 2024 و اجتاز فيها الذكاء الصناعي اختبار تورينع (المبسط) بنسبة 54% كانت تجربة ثنائية الطرف (two party virsion)، لكن التجربة الأخيرة كانت الأعقد و هي ثلاثية الطرف (three party virsion) و هذا هو اختبار تورينغ الأصلي أن يكون ثلاثي الطرف و ليس النسخة المبسطة التي تمت في 2024 ثنائي الطرف، لذلك رسميا هذه اول مرة يجتاز فيها نموذج ذكاء صناعي اختبار تورينغ بصيغته الحقيقية ثلاثي الطرف، و حقق أداء مذهلا بنسبة 73%.

 
الذكاء الاصطناعي سيصبح أداه للقمع و القتل و مراقبه العباد و كتم الانفاس و وضع سجلات رقميه للافراد و ملايين كاميرات المراقبه ( كما حدث في الصين). سيتجرد الانسان من انسانيته ليصبح نصف آله و ليس العكس.
 
الذكاء الاصطناعي سيصبح أداه للقمع و القتل و مراقبه العباد و كتم الانفاس و وضع سجلات رقميه للافراد و ملايين كاميرات المراقبه ( كما حدث في الصين). سيتجرد الانسان من انسانيته ليصبح نصف آله و ليس العكس.
و يمكن أن يكون أداة لسد الفجوة العلمية الهائلة بين دول العالم الثالث و دول العالم الأول.
 
الذكاء الاصطناعي يتطور بشكل رهيب ومتسارع.
من يعلم قد يكون الذكاء الاصطناعي أكثر عدلا من الانسان ونلجأ إليه ليدير أمور وشؤون الدول بشكل أفضل من الحكام الحاليين والسياسيين الفاشلين. قد تكون ديموقراطية الذكاء الاصطناعي أكثر فائدة وعدلا من ما يسمى بالنظام العالمي
 
عودة
أعلى