ARNLI: التعرف على الاستدلال النصي وكشف التناقض في النصوص العربية
|
الباحثون المشاركون |
م. خلود الجلاد – د. ندى غنيم |
|
منشور في |
Computer Science, volume 24, NO. 2, March 2023. |
|
الملخص |
الاستدلال النصي الطبيعي (NLI) هو موضوع بحث مثار اهتمام في معالجة اللغات الطبيعية، واكتشاف التناقض بين الجمل هو حالة خاصة من الاستدلال النصي. تعد هذه مهمة صعبة في معالجة اللغات الطبيعية ولها تأثير كبير عند إضافتها كجزء من الحل في العديد من تطبيقات معالجة اللغات الطبيعية، مثل أنظمة الإجابة على الأسئلة وتلخيص النص. اللغة العربية هي واحدة من أكثر اللغات منخفضة الموارد تحدياً في اكتشاف التناقضات بسبب غموضها اللغوي الدلالي. لقد أنشأنا مجموعة بيانات من أكثر من 12 ألف جملة وأطلقنا عليها اسم ArNLI ، والتي ستكون متاحة لعموم الباحثين. إضافة إلى ذلك، قمنا بتطبيق نموذج جديد مستوحى من حلول ستانفورد لاكتشاف التناقض المقترحة على اللغة الإنجليزية. اقترحنا طريقة لاكتشاف التناقضات بين أزواج من الجمل في اللغة العربية باستخدام شعاع سمات التناقض جنباً إلى جنب مع شعاع نموذج اللغة كمدخل لنموذج التعلم الآلي. قمنا بتحليل نتائج مصنفات تعلم الآلة التقليدية المختلفة ومقارنة نتائجها على مجموعة البيانات التي أنشأناها (ArNLI) وعلى الترجمة الآلية لكل من مجموعات بيانات PHEME و SICK الإنجليزية. حصلنا على أفضل النتائج باستخدام مصنف Random Forest بدقة 99٪ و 60٪ و 75٪ على PHEME و SICK و ArNLI على التوالي. الكلمات المفتاحية: الاقتضاء النصي، معالجة اللغة الطبيعية العربية، كشف التناقض، مجموعة البيانات العربية المتناقضة، الاستدلال النصي. |
|
رابط البحث كاملاً |
https://doi.org/10.7494/csci.2023.24.2.4378 |