ربط العرب: سد الفجوة في تعرف الكلام باللهجات العربية
|
الباحثون المشاركون |
أحمد علي – شامور شودهاري – محمد عفيفي – وسيم الحاج – حازم حاج – مراد عباس – أمير حسين – د. ندى غنيم – محمد أبو شريعة – عسال القداح |
|
منشور في |
Communications of the ACM, Volume 64, No. 4, pages 124-129, April 2021. |
|
الملخص |
على عكس اللغة الإنجليزية، يواجه تعرف الكلام في اللغة العربية العديد من التحديات، حتى مع هذه التقنيات المتقدمة. تطرح اللغة العربية مجموعة من التحديات الفريدة نظراً لتنوعها اللغوي الغني باللهجات المختلفة، مع كون اللغة العربية الفصحى الحديثة (MSA) هي اللهجة المعيارية الوحيدة. تعتمد اللغة العربية الفصحى الحديثة من الناحية التركيبية والصرفية والصوتية على اللغة العربية الفصحى الكلاسيكية، لغة القرآن (الكتاب المقدس في الإسلام)، إلا أنها أكثر حداثة من الناحية المفرداتية. يتم تدريس اللغة العربية الفصحى الحديثة في المدارس في جميع أنحاء المنطقة العربية وهي اللغة الرئيسية في نشرات الأخبار والبرلمانات والخطاب الرسمي. هذا هو أحد الأسباب الرئيسية التي جعلت اللغة العربية الفصحى الحديثة هي الخيار الرئيسي لتقانات معالجة الكلام والنصوص على مدى العقدين الماضيين. يبلغ المعدل الحالي للخطأ في تعرف الكلام (على مستوى الكلمات) WER للعربية الفصحى الحديثة حوالي 13٪، وهذا المعدل يصبح أسوأ في حالة تعرف الكلام في اللهجات، حيث يبلغ معدل الخطأ على مستوى الكلمات 30٪. الكلمات المفتاحية: تعرف الكلام آلياً، اللهجات العربية. |
|
الرابط لقراءة كامل البحث |
https://cacm.acm.org/magazines/2021/4/251361-connecting-arabs/fulltext |