الشبكات التعارضية التوليدية السيامية المكدسة: طريقة جديدة لتوسيع مجموعة بيانات الصور

03 Jun 2023
الأبحاث المنشورة باسم الجامعة - المعلوماتية والاتصالات

الباحثون المشاركون	Shanlin Liu - Ren Han - د. رامي يارد
منشور في	Electronics, volume 12, issue 3, (This article belongs to the Special Issue Data Analysis in Intelligent Communication Systems (ICS)), January 2023.

الملخص

غالباً ما تحتاج الشبكات العصبونية العميقة إلى التدريب على عدد كبير من العينات في مجموعة البيانات. عندما لا تكون عينات التدريب في مجموعة البيانات كافية، فسوف يتدهور أداء النموذج.

تعتبر Generative Adversarial Network (GAN) فعالة في توليد العينات، وبالتالي في توسيع مجموعات البيانات.

في هذا البحث طورنا طريقة جديدة تسمى Stacked Siamese Generative Adversarial Network (SSGAN) لتوليد صور على نطاق واسع وبجودة عالية.

يتكون SSGAN من Color Mean Segmentation Encoder (CMS-Encoder) والعديد من Siamese Generative Adversarial Networks (SGAN).

يستخرج CMS-Encoder الميزات من الصور باستخدام طريقة قائمة على التجميع. لذلك، لا يلزم أن يكون CMS-Encoder مدرب وخرجه ذو قدرة عالية على تفسير المرئيات البشرية. المولد (SGAN) المقترح يتحكم (SGAN) بفئة العينات المتولدة مع ضمان التنوع من خلال تقديم supervisor إلى WGAN.

يتعلم SSGAN تدريجياً الميزات الموجودة في هرم الميزات. تمت مقارنة Fréchet Inception Distance (FID) للعينات التي تم توليدها من SSGAN مع أعمال سابقة على أربع Datasets. تظهر النتائج أن طريقتنا تتفوق في الأداء على الأعمال السابقة.

بالإضافة إلى ذلك، قمنا بتدريب SSGAN على Dataset CelebA، والتي تتكون من صور بحجم 128× 128. التأثير البصري الجيد يثبت بشكل أكبر الأداء المتميز لتقنيتنا في توليد صور large scale.

الكلمات المفتاحية:

Generative Adversarial Network; SLIC; neural network; data enhancement

رابط البحث كاملاُ

https://doi.org/10.3390/electronics12030654