Aug 20,2022 البحث العلمي والدراسات العليا, الهندسة المعلوماتية والاتصالات

دراسة أثر استخدام نماذج الترميز ثنائية الاتجاه من المحولات (BERT) لتحديد أفعال الحوار باللغة العربية

الباحثون المشاركون

م. آلاء جوخدار – د. ندى غنيم – د. غيداء ربداوي

منشور في

Ingénierie des Systèmes d’Information, volume 26, no. 5, pp. 469-475, October 2021.

 

الملخص

في أنظمة الحوار بين الإنسان والحاسوب، يعد تحديد القصد من كلام المتحدث أمراً بالغ الأهمية لنجاح الحوار. درس العديد من الأبحاث مهمة تصنيف أفعال الحوار Dialogue Act Classification (DAC) لتحديد أفعال الحوار في اللغات المختلفة. في الآونة الأخيرة، أتاح ظهور نماذج BERT الوصول إلى نتائج واعدة في مجموعة متنوعة من مهام معالجة اللغة الطبيعية وبلغات مختلفة. اهتم عدد قليل جداً من الأبحاث في مسألة تحديد أفعال الحوار باللغة العربية، كما لم تجري دراسة نموذج التمثيل BERT بعد في مهمة تحديد أفعال الحوار بالعربية. نقترح، في هذه الورقة، نموذجاً يستخدم التمثيل اللغوي BERT لتحديد أفعال الحوار العربي، حيث نستكشف تأثير استخدام نماذج مختلفة من BERT، وهي AraBERT Original بنسختيه v0.1 وv1، وAraBERT Base بنسختيه v0.2 و v2، و AraBERT Large بنسختيه v0.2 و v2، والتي تم تدريبها مسبقاً على مدونات عربية مختلفة (مختلفة من حيث الحجم، وخوارزميات التجزئة الصرفية، ونافذة نموذج اللغة المعتمد،…). قمنا بإجراء المقارنة على مجموعتي معطيات عربيتين متاحتين، وتفوق نموذج AraBERT Base 0.2 على باقي النماذج الأخرى. إضافة إلى ذلك، قمنا بمقارنة أداء نموذج AraBERT Base 0.2 مع نتائج أفضل الأبحاث المطبقة على مجموعتي المعطيات، فأظهرت المقارنة تفوق أداء نموذج التمثيل هذا على أفضل النماذج المستخدمة.

الكلمات المفتاحية: نماذجAraBERT ، اللغة العربية، تحديد أفعال الحوار، تحديد قصد المستخدم.

الرابط لقراءة كامل البحث

https://doi.org/10.18280/isi.260506