وفقًا للورقة البحثية، تعمل معظم نماذج الذكاء الاصطناعي الموجودة حاليًا على أساس التحليل النفسي اللغوي لمحتوى النص الذي تم إنشاؤه بواسطة المستخدم. على الرغم من عرض مستويات عالية من الأداء، تتأثر نماذج التمثيل القائمة على المحتوى بتحيز المجال والموضوع.
يقوم النموذج الجديد باستبعاد هذه التحيزات الخاصة بالموضوع من خلال الاستناد بالكامل إلى الحالات العاطفية. لتدريب النموذج، جمع الباحثون مجموعتين من البيانات بين عامي 2011 و 2019: المجموعة الأولى كانت عبارة عن مجموعة بيانات للمستخدمين الذين يعانون من واحد من ثلاثة اضطرابات عاطفية مثيرة للاهتمام (الاكتئاب والقلق واضطراب ثنائي القطب). أما المجموعة الثانية فكانت عبارة عن مجموعة بيانات للمستخدمين بدون اضطرابات عقلية معروفة، والتي عملت كمجموعة ضابطة.
تم جمع مجموعة البيانات الأولى بناءً على الاضطرابات العقلية المبلغ عنها ذاتيًا، أي، بحث الباحثون عن المستخدمين الذين نشروا مشاركات أو تعليقات تقول شيئًا مشابهًا لـ “تم تشخيصي باضطراب ثنائي القطب / اكتئاب / قلق”.
بعد ذلك، تأكد الباحثون من أن البيانات التي تنتمي إلى الفئات الأربع، لها توزيعات زمنية متشابهة: وهذا يعني أن البيانات في الفئات الأربع لها نفس التوزيع الزمني للوظائف. تمت موازنة مجموعات البيانات أيضًا مع 1،997 مستخدمًا لكل فئة من الفئات.
بعد ذلك، قسم الباحثون البيانات إلى تدريب (70٪)، تحقق (15٪) واختبار (15٪). بعد تدريب النموذج على البيانات ثم اختباره، اكتشف الباحثون أن نموذج التمثيل القائم على العاطفة الذي استخدموه كان أكثر دقة في التنبؤ بالاضطرابات العقلية، وفق ما أوردت صحيفة إنديان إكسبرس.