Aug 20,2022 البحث العلمي والدراسات العليا, الهندسة المعلوماتية والاتصالات

دراسة تجريبية حول استخدام شبكات CNN المدربة مسبقاً كوحدات لاستخراج السمات في نظم توصيف الصور

الباحثون المشاركون

م. محمد عبد الهادي الملا – د. آصف جعفر – د. ندى غنيم

منشور في

Electronic Letters on Computer Vision and Image Analysis (ELCVIA), volume 21, no 1, February 2022.

 

الملخص

في هذا العمل، نقدم دراسة تجريبية شاملة حول استخراج السمات باستخدام الشبكات العصبية التلافيفية (CNNs) لمهمة توصيف الصور في سياق التعلم العميق. نجري مجموعة من 72 تجربة على 12 شبكة CNN لتصنيف الصور مدربة مسبقاً على مجموعة بيانات ImageNet [29]. يتم استخراج السمات من الطبقة الأخيرة بعد إزالة الطبقة المتصلة كلياً وإدخالها في نموذج توصيف الصور. نستخدم نموذج توصيف موحداً بحجم مفردات ثابت في جميع التجارب لدراسة تأثير تغيير مستخرج السمات باعتماد CNN على جودة توصيف الصور. يتم حساب النتائج باستخدام المقاييس القياسية في توصيف الصور. هناك علاقة بين بنية النموذج ومجموعة بيانات توصيف الصور، كما أن نماذج VGG تعطي نتائج أقل جودة لاستخراج سمات توصيف الصور من بين شبكات CNN التي تم اختبارها. في النهاية، نوصي بمجموعة من شبكات CNN المدربة مسبقاً لكل مقياس من مقاييس تقييم توصيف الصور التي نريد تحسينها، ونقارن بين نتائجنا والأعمال السابقة. على حد علمنا، يعد هذا العمل هو المقارنة الأكثر شمولاً بين أدوات استخراج السمات لتوصيف الصور.

الكلمات المفتاحية: الشبكات العصبونية التلافيفية، استخلاص السمات، توصيف الصور، التعلم العميق.

الرابط لقراءة كامل البحث

https://doi.org/10.5565/rev/elcvia.1436