طور باحثون في كلية دارتموث نموذجًا للذكاء الاصطناعي (AI) يمكن استخدامه للتنبؤ بالاضطرابات العقلية باستخدام بيانات من المحادثات على Reddit ، وفقًا لمقال نشرته الجامعة.
قدم الباحثون Xiaobo Guo و Yaojia Sun و Soroush Vosoughi ورقة بعنوان “النمذجة القائمة على العاطفة للاضطرابات العقلية على وسائل التواصل الاجتماعي” في المؤتمر الدولي العشرين حول ذكاء الويب وتكنولوجيا الوكيل الذكي.
وفقًا للورقة البحثية ، تعمل معظم نماذج الذكاء الاصطناعي الموجودة حاليًا على أساس التحليل النفسي اللغوي لمحتوى النص الذي تم إنشاؤه بواسطة المستخدم. على الرغم من عرض مستويات عالية من الأداء ، تتأثر نماذج التمثيل القائمة على المحتوى بتحيز المجال والموضوع.
أوضح فوسوغي لكاتب علمي في دارتموث من خلال التحدث عن إمكانية كيف إذا تعلم النموذج ربط كلمة “COVID” بـ “الحزن” أو “القلق” ، فسوف يفترض تلقائيًا أن العالم الذي يجري بحثًا حول COVID وينشر عنه يعاني من الاكتئاب والقلق.
يقوم النموذج الجديد بقمع هذه التحيزات الخاصة بالموضوع من خلال الاستناد بالكامل إلى الحالات العاطفية بينما لا يتعلم أي شيء عن الموضوع الموصوف في المنشورات.
لتدريب النموذج ، جمع الباحثون مجموعتين من البيانات بين عامي 2011 و 2019: المجموعة الأولى كانت عبارة عن مجموعة بيانات للمستخدمين الذين يعانون من واحد من ثلاثة اضطرابات عاطفية مثيرة للاهتمام (الاكتئاب الرئيسي والقلق واضطراب ثنائي القطب) والثاني عبارة عن مجموعة بيانات للمستخدمين بدون اضطرابات عقلية معروفة ، والتي عملت كمجموعة ضابطة.
تم جمع مجموعة البيانات الأولى بناءً على الاضطرابات العقلية المبلغ عنها ذاتيًا ، أي ، بحث الباحثون عن المستخدمين الذين نشروا مشاركات أو تعليقات تقول شيئًا مشابهًا لـ “تم تشخيصي باضطراب ثنائي القطب / اكتئاب / قلق”. تم النظر فقط في المشاركات التي تم نشرها قبل التقرير الذاتي للبحث لأن العمل السابق أظهر أن إدراك المستخدمين أنهم يعانون من اضطراب سيغير طريقة تصرفهم عبر الإنترنت ويخلق تحيزًا.
بعد ذلك ، تأكد الباحثون من أن البيانات التي تنتمي إلى الفئات الأربع (واحدة لكل مستخدم مع كل اضطراب في الاهتمام ومجموعة مراقبة واحدة) لها توزيعات زمنية متشابهة: وهذا يعني أن البيانات في الفئات الأربع لها نفس التوزيع الزمني للوظائف. تمت موازنة مجموعات البيانات أيضًا مع 1،997 مستخدمًا لكل فئة من الفئات.
بعد ذلك ، قسم الباحثون البيانات إلى تدريب (70٪) ، تحقق (15٪) واختبار (15٪). بعد تدريب النموذج على البيانات ثم اختبارها ، اكتشف الباحثون أن نموذج التمثيل القائم على العاطفة الذي استخدموه كان أكثر دقة في التنبؤ بالاضطرابات من أسلوب المحتوى المستند إلى TF-IDF (تردد المصطلح – تردد المستند العكسي). يتم استخدام TF-IDF لحساب أهمية الكلمة الأساسية ، بناءً على تواترها وأهمية المنشور.
اكتشاف المزيد من مباشر التقنية
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.