پاورپوینت تولید ویژگی تبدیل داده و کاهش بعد (pptx) 33 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 33 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
تولید ویژگی تبدیل داده و کاهش بعد
Feature Generation; Data Transformation and Dimensionality Reduction
رئوس مطالب
1- بردارها و تصاویر پایه
2- تبدیل KL
3- تجزیه مقدار تکین (SVD)
4- تحلیل مولفه مستقل
5- فاکتورگیری ماتریسی نامنفی
6- کاهش بعد غیرخطی
7- تبدیل فوریه گسسته
8- تبدیل هادامارد
9- تبدیل هار
10- تبدیل موجک گسسته
11- درونیابی چندوضوحی
12- بستههای موجک
5-1- مقدمه
رهیافت اساسی تبدیل یک مجموعه از اندازهها به یک مجموعه ویژگی جدید است.
انتخاب مناسب تبدیل میتواند منجر به خواص اطلاعاتی بالا در حوزه تبدیل شود.
با تعداد نسبی کم از ویژگیها اطلاعات وابسته به طبقهبندی با کاهش بعد حفظ میشود.
تولید ویژگی گاهی اوقات بعنوان کاهش بعد شناخته میشود.
هدف اصلی تبدیل داده به فضای ویژگی جدید، کاهش افزونگی در فضای اولیه است.
افزونگی یعنی وجود همبستگی بین برخی از نقاط داده در اطلاعات ثبت شده میباشد.
5-2- بردارها و تصاویر پایه
فرض مجموعهای از نمونههای ورودی و بردار N × 1 باشد:
فرض ماتریس یکتای AN × N وجود داشته و تبدیل زیر از روی آن تعریف شود:
عملگر H به مختلط مزدوج و ترانهاده اشاره دارد. بنابر تعریف ماتریسهای یکتا داریم:
ستونهای را بردارهای پایه مینامند. با ضرب داخلی داریم:
در برخی موارد، مانند تحلیل تصویر، نمونههای ورودی دو بعدی،
بوده یک ماتریس N × N ورودی X داریم. در این موارد، میتوان یک بردار N 2 تعریف کرد (مرتبسازی لغتی، Lexicographic ordering)
اعمال همان ماتریس تبدیل قبلی به این بردار ورودی جدید، ولی روش مناسبی نمیباشد. چونکه مرتبه عملیات با توجه به بعد ماتریس A برابر O (N 4) خواهدبود.
راهحل، استفاده از ماتریسهای پایه یا تصاویر پایه است. فرض U و V ماتریسهای یکتای N × N باشند:
ui بردار ستونی U و vj بردار ستونی V بوده و یک ماتریس N × N داریم:
تبدیل بالا یک نوع تبدیل جداپذیر بوده و هدف در ادامه مطالب جستجوی یک چنین ماتریسهای تبدیلی خواهد بود.
6-3- تبدیل KL
تبدیل KL یا همان تحلیل مولفه اصلی (PCA) یک روش معمول در PR برای تولید ویژگی (استخراج ویژگی) و کاهش بعد با تبدیل خطی میباشد.
فرض x یک بردار از نمونههای ورودی با میانگین صفر باشد (در غیر اینصورت، متوسط را از آن کسر میکنیم)، هدف تولید ویژگیهای جدید با ناهمبستگی متقابل و جلوگیری از افزونگی اطلاعات است.
برای تولید ویژگیهای ناهمبسته متقابل، بازای i # j، داریم:
باتوجه به صفر بودن میانگین x، میانگین y نیز صفر بوده و برای ماتریس همبستگی داریم:
Rx یک ماتریس متقارن است و بردارهای ویژه آن بطور متقابل متعامد هستند.
اگر ماتریس A طوری انتخاب گردد که ستونهایش بردارهای ویژه متعامد یکه از Rx باشند آنگاه Ry قطری خواهدبود:
ماتریس Λ یک ماتریس قطری است که عناصر روی قطرش مقادیر ویژه از ماتریس Rx هستند ( ).
اگر ماتریس همبستگی را معین مثبت فرض کنیم، آنگاه مقادیر ویژه آن مثبت خواهندبود.
تبدیل فوق، تبدیل KL (Karhunen-Loeve) نام دارد و ویژگیهای ناهمبسته متقابل تولید میکند.
تقریب با حداقل مجذور خطا (MSE)
اگر بردار ورودی را با جملات زیر از بردار ویژه ماتریس همبستگیاش تخمین بزنیم:
فرض یک بردار جدید در فضای m بعدی بصورت زیر داریم:
بردار بالا چیزی بجز تصویر x روی زیرفضایی با m بردار ویژه متعامد یکه نیست. برای محاسبه خطا داریم:
هدف انتخاب بردارهای ویژهای خواهدبود که از منظر MSE خطای بالا را کمینه کند:
بنابراین، با انتخاب m بزرگترین مقدار ویژه از ماتریس همبستگی بردار ورودی، خطای MSE کمینه خواهدبود.