شناسایی اشیاء از طریق یادگیری عمیق

الگوریتم R_CNN  به عنوان الگوریتم پایه شناسایی اشیا از طریق یادگیری عمیق محسوب می شود.این الگوریتم راه را برای محققان برای ساخت الگوریتم پیچیده تر و بهتر بر روی این الگوریتم فراهم کرد. من سعی می کنم R-CNN و سایر انواع آن را توضیح بدم.

 

شبکه های عصبی کانولوشن بر پایه نواحی (R-CNN) :

R-CNN شامل 3 مرحله ساده است:

  • تصویر ورودی را جهت اشیاء احتمالی  با استفاده از الگوریتم  Selective Search اسکن می کند و پس از آن تقریباً  2000  ناحیه پیشنهادی تولید می کند .
  • اجرای یک شبکه عصبی کانولوشن (CNN) بروی هر یک از این نواحی پیشنهادی .
  • خروجی هر CNN به دو بخش انتقال می دهد اولی  یک SVM برای طبقه بندی ناحیه و دومی  یک رگرسیون خطی برای تنظیم کردن ناحیه  شی، اگر چنین آبجکتی وجود داشته باشد.

شبکه های عصبی کانولوشن سریع بر پایه نواحی ( Fast R-CNN):

روش Fast R-CNN بلافاصله پس از روش R-CNN  ایجاد شد. با توجه به نکات زیر این روش بهتر و سریع تر از روش قبل است :

 

  • انجام عملیات استخراج ویژگی از تصویر قبل از مرحله نواحی پیشنهادی، در نتیجه اجرای فقط یک CNN بروی کل تصویر، به جای اجرای 2000 CNN بروی 2000 نواحی همپوشانی.
  • جایگزینی SVM با یک لایه softmax

 

بدین ترتیب جایگزینی  2000 کانولوشن با یک کانولوشن که تمامی نواحی پیشنهادی توسط آن ایجاد می شود.

 

شبکه های عصبی کانولوشن سریع تر بر پایه نواحی ( Faster R-CNN):

  • یکی از نقاط ضعف Fast R-CNN، الگوریتم کند  selective search بود و Faster R-CNN چیزی به نام Region Proposal network (RPN) معرفی کرد.در اینجا کار RPN است:

    در آخرین لایه CNN اولیه، یک پنجره کشویی 3×3 حرکت می کند که در نقشه ویژگی قرار دارد و آن را به ابعاد پایین تر (مانند 256-d) می دهد. برای هر پنجره مکانی کشویی، چندین ناحیه ممکن را بر اساس k ثابت نسبت جعبه (جعبه محدوده پیش فرض)

    هر ناحیه پیشنهادی شامل اطلاعات زیر است:

  • یک امتیاز برای هر ناحیه.
  • خود ناحیه که متشکل از 4 نقطه است  ما در نقشه ویژگی مجموعه ای از نقاط را استخراج می کنیم و k تا ناحیه مختلف در اطراف این نقطه در نظر می گیریم همانطور که در شکل نشان داده شده یکی مستطیل نرمال ، عمودی ، افقی و بزگ و ….هستش.

برای هر کدام از این نواحی  تصمیم می گیریم که آیا این ناحیه شامل شی مورد نظر ما است یا نه و سپس اگر انتخاب شه نقاط آن را به خروجی می فرستیم .

 

 

 

نظر دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *