أكدت دراسة حديثة أجراها فريق دولي من جامعتي "واشنطن" الأمريكية و"واترلو" الكندية، أن جميع نماذج الذكاء الاصطناعي التوليدي تعاني من الهلوسة، حتى نموذج Gemini من "غوغل"، ونموذج Claude من "أنثروبيك"، وأحدث إصدار من برنامج GPT-4o من "أوبن إيه آي".

وحصلت الدراسة على هذه النتائج، وفقاً لموقع "TechCrunch" التقني، إلى معايرة الهلوسة من خلال التحقق من صحة نماذج مثل GPT-4o ضد مصادر موثوقة حول مواضيع تتراوح من القانون والصحة إلى التاريخ والجغرافيا.

ووجدت أن أياً من هذه النماذج لم يحقق أداءً استثنائياً في جميع المواضيع، وأن النماذج التي تعاني من أقل قدر من الهلوسة فعلت ذلك جزئياً؛ لأنها رفضت الإجابة عن الأسئلة التي كانت لتخطئ فيها لولا ذلك.

ولفتت إلى أن أفضل النماذج يمكنها توليد نص خالٍ من الهلوسة بنسبة 35% فقط، حيث اكتشف الباحثون أن أغلب النماذج تعتمد في إجاباتها على المعلومات التي توفرها موسوعة ويكيبيديا، التي يمكن لأي شخص حول العالم اختراع أي معلومة وإضافتها للمقالات بالموسوعة الأكثر انتشاراً.