Oct 15,2019 البحث العلمي والدراسات العليا, الهندسة المعلوماتية والاتصالات

تحليل المشاعر في التغريدات العربية باستخدام منهجية التعلم العميق

الباحثون المشاركون

د. ندى غنيم – م. ماسة البعلي

منشور في

Journal of Big Data, volume 6, article number 89, October 2019

 

الملخص

في الوقت الحاضر، أصبحت مشاركة اللحظات على الشبكات الاجتماعية أمرًا واسع الانتشار، حيث يجري تبادل الأفكار والذكريات الجيدة للتعبير عن مشاعرنا من خلال النص دون استخدام الكثير من الكلمات. يُعدّ توتير Twitter، على سبيل المثال، مصدرًا غنيًا للمعطيات التي تمثل هدفًا للمنظمات التي يمكنها استخدامها لتحليل آراء الناس ومشاعرهم وعواطفهم. عادةً ما يعطي تحليلُ العاطفة نظرة أكثر عمقًا لمشاعر المؤلف. ركزت جميع المشاريع البحثية في تحليل وسائل التواصل الاجتماعي العربية تقريبًا على تحليل التعبيرات على أنها إيجابية أو سلبية أو محايدة. نعتزم في هذه الورقة تصنيف التعبيرات على أساس المشاعر، وهي السعادة والغضب والخوف والحزن. جرى تطبيق منهجيات مختلفة في مجال تعرف المشاعر من النصوص في حالة اللغات الأخرى، لكن عددًا محدودًا فقط منها كان يعتمد على التعلم العميق. لهذا، نعرض هنا منهجيتنا المستخدمة لتصنيف العواطف في التغريدات العربية. يعتمد نموذجنا على شبكات عصبية تلافيفية عميقة (CNN) تم تدريبها أعلى أشعة الكلمات المدربة تحديداً على مجموعة معطياتنا لمهام تصنيف الجمل. قمنا بمقارنة نتائج هذه المنهجية مع ثلاث خوارزميات أخرى للتعلم الآلي وهي SVM و NB و MLP. إن بنية منهجية التعلم العميق الخاص بنظامنا هي عبارة عن شبكة عصبية شاملة تتضمن مراحل مختلفة من التمثيل الشعاعي على مستوى الكلمات، الجمل، والوثائق. جرى تقييم منهجية التعلم العميق المقترحة على مجموعة المعطيات التي أتاحتها SemEval لإجراء مهمة EI-oc على التغريدات العربية، وقد كانت النتائج ممتازة مقارنة بمنهجيات التعلم الآلي التقليدية.

الكلمات المفتاحية: التعلم العميق، المعطيات الكبيرة، تحليل المشاعر للنصوص العربية، تصنيف الجمل باستخدام شبكة عصبية تلافيفية، التنقيب في المعطيات، آلات أشعة الدعم SVM ، نايف بايزNB ، المستقبلات متعددة الطبقات MLP.

الرابط لقراءة كامل البحث

https://doi.org/10.1186/s40537-019-0252-x