عندما يفشل الذكاء الاصطناعي.. الألغاز تكشف أسرار العقل البشري
تتمكن أنظمة الذكاء الاصطناعي حاليًا من تنفيذ عمليات معقدة للغاية في ثوانٍ معدودة باستخدام كميات ضخمة من البيانات، كما يمكنها حل مشكلات تتجاوز قدرات البشر، ومع ذلك، لا تزال الألغاز تمثل تحديًا لهذه الأنظمة وتبرز تفوق العقل البشري.
ولكن لماذا تمثل الألغاز تحديًا كبيرًا للذكاء الاصطناعي؟ وما الأسرار التي تكشفها هذه الألغاز عن طبيعة العقل البشري؟
تحديات تطوير الذكاء الاصطناعي:
يحاول فيليب إليفسكي، الأستاذ المساعد في جامعة (فو أمستردام)، الإجابة عن سؤال مهم، وهو (هل تستطيع الآلة أن تحل لغزًا؟)، لذلك يوجه اهتمامه نحو تطوير قدرات الذكاء الاصطناعي على التفكير النقدي وحل المشكلات المعقدة، التي تشبه إلى حد كبير الألغاز التي نواجهها في حياتنا اليومية.
ويقول إيليفسكي إن فهم قدرة الذكاء الاصطناعي على حل الألغاز والمشاكل المنطقية وتحسينها هو المفتاح لتحسين أداء أنظمة الذكاء الاصطناعي في المستقبل.
كما أشار إليفسكي إلى أن البشر يتميزون بقدرة فطرية على تطبيق المنطق السليم وتكييفه مع مختلف المواقف، وهذه القدرة هي ما يطمح العلماء في الوصول إليه في الذكاء الاصطناعي الآن، ولكن هذا الأمر ليس سهلًا، لأن الذكاء الاصطناعي الحالي يعاني نقص حاد في فهم العالم المحيط به، مما يجعله عاجزًا عن محاكاة المرونة والتفكير النقدي التي يتمتع بها البشر.
ويؤكد ذلك، زاك بيتكو، الأستاذ المشارك في جامعة كارنيجي ميلون في الولايات المتحدة، الذي يدرس التقاطع بين الذكاء الاصطناعي وعلم الأعصاب، والذي قال: “يتميز الذكاء الاصطناعي بقدرات استثنائية في تعرف الأنماط، ولكنه يواجه تحديات في المهام التي تتطلب قدرات تفكير مجردة مقارنة بالإنسان. مع ذلك، تختلف كفاءة الذكاء الاصطناعي حسب طبيعة المشكلة المطروحة”.
وتفتح هذه الفجوة بين الذكاء البشري والذكاء الاصطناعي آفاقًا جديدة للبحث، إذ يسعى العلماء إلى فهم الآليات التي تمكن البشر من اتخاذ قرارات سريعة وفعالة في مواجهة تحديات غير متوقعة.
ألغاز تحير الذكاء الاصطناعي:
في دراسة أجريت عام 2023، طرح الباحثون سؤالًا بسيطًا على نموذج (GPT-4)، وهو: “كان معدل ضربات قلب (مابل) في الساعة 9 صباحًا يبلغ 75 نبضة في الدقيقة وكان ضغط دمها في الساعة 7 مساءً يبلغ 120/80. وقد توفيت في الساعة 11 مساءً. فهل كانت (مابل) على قيد الحياة في الساعة الثانية عشرة ظهرًا؟”
الإجابة بديهية لأي شخص: بالطبع كانت (مابل) على قيد الحياة في الساعة الثانية عشرة ظهرًا، لأنها توفيت في الساعة الحادية عشرة مساءً، ومع ذلك عجز نموذج (GPT-4) بقدرته المذهلة عن الإجابة بشكل قاطع، مؤكدًا عدم وجود معلومات كافية لتحديد حالة مابل في الساعة الثانية عشرة ظهرًا.
ولكن لماذا فشل الذكاء الاصطناعي في حل هذا اللغز البسيط؟
يكمن التحدي في أن هذا السؤال يتطلب نوعًا خاصًا من التفكير يُسمى (الاستدلال الزمني) temporal reasoning، وهو القدرة على فهم العلاقات الزمنية بين الأحداث وتسلسلها. قد يبدو هذا الأمر بديهيًا للإنسان، ولكنه يشكل عقبة كبيرة أمام الذكاء الاصطناعي، ففي حين يمكن للآلة أن تحسب وتحل المعادلات المعقدة، فإن فهم المفاهيم المجردة مثل الزمن والحياة والموت يتطلب مستوى أعمق من الفهم.
كما يواجه العلماء حتى الآن تحديًا كبيرًا في فهم آلية عمل الذكاء الاصطناعي، خاصة النماذج اللغوية الكبيرة مثل (ChatGPT)، فنحن نعلم أن هذه النماذج تستند في عملها إلى تحليل كميات ضخمة من البيانات للعثور على أنماط وإحصائيات.
لذلك عندما نطرح على هذه النماذج سؤالًا، فإنها تبحث عن الأنماط اللغوية التي تتطابق مع هذا السؤال، ثم تقدم إجابة بناءً على تلك الأنماط. ولكن، كيف تصل هذه النماذج إلى هذه الإجابات بالضبط؟ وما هي العمليات الحسابية المعقدة التي تحدث خلف الكواليس؟ هذا ما يزال لغزًا محيرًا حتى الآن.
لذلك يمكن تشبيه الذكاء الاصطناعي بصندوق أسود، نرى المدخلات والمخرجات، ولكننا لا نفهم تمامًا العمليات الداخلية التي تحدث لتحويل تلك المدخلات إلى مخرجات.
لذلك يُعدّ الجانب الأكثر رعبًا في ثورة الذكاء الاصطناعي التوليدي، التي نشهدها اليوم، وهو عدم معرفة العلماء والمبرمجين الذين قاموا ببناء النماذج اللغوية الكبيرة بآلية عملها وتطورها.
وينطبق الشيء نفسه على الدماغ البشري، فنحن لا نعرف سوى القليل عن كيفية عمل عقولنا، إذ تُظهر لنا أحدث تقنيات مسح الدماغ أن مجموعات فردية من الخلايا العصبية تنشط أثناء تفكير الشخص، ولكننا عاجزون عن ترجمة هذا النشاط إلى لغة نفهمها بنحو كامل، فالأفكار والمشاعر هي نتاج تفاعلات معقدة بين مليارات الخلايا العصبية التي لم نتوصل إلى فك شفرتها بعد.
ولكن، هل هناك صلة بين الذكاء الاصطناعي والدماغ البشري؟
الجواب هو نعم، يوجد تداخل كبير. فالشبكات العصبية الاصطناعية التي تشكل أساس العديد من نماذج الذكاء الاصطناعي مستوحاة من بنية الدماغ وطريقة عمل الخلايا العصبية. ومع ذلك، لا يعني هذا أن الذكاء الاصطناعي يفكر بالطريقة نفسها التي يفكر بها الإنسان، بل إن المقارنة بينهما تشبه مقارنة طائرة بطائر، فكلاهما يستطيع الطيران، ولكن بطرق مختلفة تمامًا.
عندما يخدعنا الدماغ.. لغز بسيط يكشف قوة الذكاء الاصطناعي:
تُعدّ الألغاز التي تستهدف نقاط الضعف في التفكير البشري أداة قيمة لاختبار قدرات الذكاء الاصطناعي، وإليك مثالًا بسيطًا: يكلف مضرب البيسبول وكرة البيسبول معًا دولار واحد و10 سنتات، وإذا كان سعر المضرب يفوق سعر الكرة بدولار واحد، فكم يساوي سعر الكرة؟
الإجابة التي تتبادر إلى ذهن معظمنا هي: 10 سنتات، وذلك بطرح سعر المضرب (واحد دولار) من السعر الإجمالي (واحد دولار و10 سنتات). ولكن هذه الإجابة خاطئة. والإجابة الصحيحة هي: سعر الكرة يبلغ 5 سنتات، وسعر المضرب يبلغ واحد دولار و5 سنتات.
ولكن لماذا نقع في هذا الخطأ؟ يشرح شين فريدريك، أستاذ التسويق في كلية ييل للإدارة، أن السبب الرئيسي وراء هذا الخطأ هو الاعتماد المفرط على الحدس. فنحن نميل إلى الاعتماد على الحدس في حياتنا اليومية، وهذا يخدمنا جيدًا في معظم الحالات. ولكن عندما نواجه مشكلة غير بديهية، قد يخدعنا حدسنا ويؤدي بنا إلى إجابات خاطئة.
وقد استطاع الذكاء الاصطناعي حل هذا اللغز، لذلك يُظهر هذا اللغز بوضوح الفروق بين طريقة تفكير البشر والذكاء الاصطناعي، يرى فريدريك أن الذكاء الاصطناعي يتفوق في استخلاص الجوانب الأساسية للمشكلة وتطبيق العمليات الحسابية المناسبة عليها.
ومع ذلك، فهذا اللغز رغم شهرته، لن يكون الاختبار الأمثل لقدرات الذكاء الاصطناعي، وذلك بسبب احتمالية وجود هذا اللغز في بيانات التدريب، لذلك، يجب تطوير اختبارات أكثر تعقيدًا وتنوعًا لتقييم قدرات الذكاء الاصطناعي بدقة.
وفي هذا السياق، لجأ الدكتور فيليب إليفسكي وفريقه في دراسة حديثة إلى بناء مجموعة الألغاز الأصلية، لتقييم مدى قدرة الذكاء الاصطناعي على محاكاة التفكير البشري المنطقي.
فقد طور الباحثون برنامج حاسوبي جديد قادر على ابتكار ألغاز بصرية معقدة، تُعرف باسم ألغاز (Rebus)، وهي ألغاز تستخدم مجموعات من الصور والرموز والحروف لتمثيل الكلمات أو العبارات، مما يتطلب قدرة على التفكير المجرد والربط بين المفاهيم المختلفة.
ثم طرح الباحثون هذه الألغاز الجديدة والمبتكرة على نماذج متقدمة، مثل (GPT-4o) من شركة (OpenAI)، بالإضافة إلى مجموعة من الأشخاص، وقد أظهرت النتائج تفوق البشر، إذ حققوا دقة وصلت إلى 91.5% في حل هذه الألغاز المعقدة، مقارنة بدقة بلغت 84.9% للذكاء الاصطناعي. وتؤكد هذه النتائج أن الإبداع البشري والتفكير النقدي لا يزالان يمثلان نقطة تفوق قوية للبشر أمام الآلات.
ومع ذلك يشير إيليفسكي إلى أن غياب تصنيف موحد للمنطق والاستدلال، يجعل من الصعب تقييم أداء الذكاء الاصطناعي بدقة ومقارنته بالقدرات العقلية البشرية.
لذلك قسمت إحدى الدراسات السابقة الاستدلال إلى بعض الفئات المفيدة، إذ سأل الباحثون نوذج (GPT-4) سلسلة من الأسئلة والألغاز والمسائل اللفظية التي تمثل 21 نوعًا مختلفًا من الاستدلال، بدءًا من الحساب البسيط ووصولًا إلى المفاهيم المكانية المعقدة، وقد فشل نموذج (GPT-4) بشكل ملحوظ في اجتياز معظم هذه الاختبارات.
كما فشل النموذج في لغز (Wason selection task)، هو مثال كلاسيكي على كيفية خداعنا لحواسنا عندما يتعلق الأمر بالتفكير المنطقي. وفي هذا اللغز، يُطلب من المشاركين تحديد البطاقات التي يجب قلبها للتحقق من قاعدة معينة. وبالرغم من بساطة اللغز، يفشل الكثير من البشر في حله، وكذلك فشل نموذج (GPT-4).
ولم يقتصر فشل نموذج (GPT-4) على لغز (Wason selection task)، فقد واجه صعوبات كبيرة في حل مسائل أخرى تتطلب فهمًا للمفاهيم المكانية والزمانية. على سبيل المثال، فشل في تحديد الاتجاه الصحيح لمدينة بوسطن بالنسبة إلى موقع معين في الولايات المتحدة، على الرغم من امتلاكه خلفية معرفية واسعة بالجغرافيا والتاريخ.
وتشير هذه النتائج إلى أن الذكاء الاصطناعي لا يزال يواجه تحديات كبيرة في مجال التفكير المنطقي، فقدرته على التعامل مع اللغة وتوليد النصوص والمواد المرئية لا تعني بالضرورة قدرته على فهم المعنى الكامن وراء الكلمات.
ومع ذلك، يشهد الذكاء الاصطناعي تطورًا متسارعًا، فقد أطلقت شركة (OpenAI) خلال شهر سبتمبر الجاري نموذج (o1) الجديد المُصمم لقضاء المزيد من الوقت في التفكير بطريقة أقرب إلى التفكير البشري قبل الرد على استفسارات المستخدم، وقد نجح هذا النموذج في كل الاختبارات السابقة، التي فشل فيها نموذجي: (GPT-4)، و (GPT-4o).
لذلك، فإن المستقبل يكمن في التكامل بين قدرات الذكاء الاصطناعي والإبداع البشري، وكما يشير إيليفسكي، يمكننا الاستفادة من نقاط قوة كل منهما لتحقيق نتائج أفضل.
ويعني ذلك أن تطوير الذكاء الاصطناعي وعلم الأعصاب يمثلان وجهين لعملة واحدة، فمحاولتنا فهم كيفية تعلم الدماغ وتخزين المعلومات ومعالجتها تدفعنا إلى تطوير خوارزميات وأنظمة ذكاء اصطناعي أكثر كفاءة. وفي الوقت نفسه، فإن دراسة هذه الأنظمة تساعدنا في فهم العمليات العقلية المعقدة، التي تحدث في الدماغ البشري، وتوفر هذه العلاقة التبادلية بين المجالين لنا رؤى قيمة حول طبيعة الذكاء، وتفتح آفاقًا جديدة للبحث والتطوير في مجالات مثل الطب والتعليم والصناعة.
تم نسخ الرابط