پاورپوینت تحلیل خوشه مفاهیم و متدها

پاورپوینت تحلیل خوشه مفاهیم و متدها (pptx) 13 اسلاید


دسته بندی : پاورپوینت

نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )

تعداد اسلاید: 13 اسلاید

قسمتی از متن PowerPoint (.pptx) :

فصل دهم: تحلیل خوشه: مفاهیم و متدها مفاهیم پایه: تحلیل خوشه تحلیل خوشه چیست؟ الزامات تحلیل خوشه متدهای پارتیشن بندی تحلیل خوشه چیست؟ خوشه : مجموعه ای از اشیاء داده شباهت داشتن (یا مربوط بودن) به دیگران درون یک گروه عدم شباهت (یا نامربوط بودن) به اشیاء گروه های دیگر تحلیل خوشه ( یا خوشه بندی، قطعه بندی داده، ...) یافتن شباهت های بین داده ها بر طبق ویژگی های یافت شده در داده ها و گروه بندی کردن اشیاء داده مشابه درون خوشه ها یادگیری غیر نظارتی: کلاس از پیش تعریف شده ای وجود ندارد ( یعنی یادگیری با مشاهدات انجام میگیرد. برخلاف یادگیری با مثال که همان یادگیری نظارتی است) کاربردهای معمول به عنوان یک ابزار منفرد آشکار کردن توزیع داده به عنوان یک گام پیش پردازشی برای دیگر الگوریتم ها خوشه بندی برای درک داده ها و کاربردهای آن بیولوژی: طبقه بندی موجودات زنده: تمدن، کلاس، ترتیب، خانواده، جنس و گونه ها بازیابی اطلاعات: خوشه بندی مستندات بازاریابی: سازماندهی تعداد زیادی از مشتریان درگروه های مختلف که درآن مشتریان هر گروه ازمشخصه های مشترک فراوان برخوردار هستند. جستجوی وب: سازماندهی نتایج جستجو در قالب گروه ها و ارائه نتایج به فرم مختصر و با دسترسی آسانتر تشخیص تصویر: آشکار کردن خوشه ها یا زیرکلاس ها در سیستم های تشخیص کاراکتر دست نوشته. خوشه بندی به عنوان یک ابزار پیش پردازشی خلاصه سازی پیش پردازش برای رگرسیون، تحلیل مولفه های اصلی (PCA)، کلاس بندی و تحلیل های انجمنی فشرده سازی پردازش تصویر تشخیص داده های پرت داده های پرت اغلب بسیار دور از هر خوشه ای مشاهده میشوند. کیفیت: خوشه بندی خوب کدام چیست؟ یک متد خوشه بندی خوب خوشه هایی با کیفیت بالا تولید می کند. شباهت بالای درون کلاسی: انسجام درون خوشه ها شباهت پایین بین کلاسی: تمایز بین خوشه ها کیفیت یک متد خوشه بندی به عوامل زیر بستگی دارد: مقیاس شباهت استفاده شده در متد پیاده سازی آن و توانایی آن در کشف برخی یا همه ی الگوهای پنهان اندازه گیری کیفیت خوشه بندی مقیاس شباهت / عدم شباهت شباهت یا عدم شباهت برپایه مقادیر صفت توصیف کننده اشیاء ارزیابی میشود و غالباً درگیر معیارهای فاصله است. d(i, j) تعاریف تابع فاصله معمولاًً برای انواع مختلف داده ها ( بازه ای، بولین، اسمی، ترتیبی و بردارها) متفاوت است. کیفیت خوشه بندی معمولاً یک تابع «کیفیت» جداگانه برای اندازه گیری «خوب بودن» یک خوشه وجود دارد. تعیین اینکه یک خوشه به اندازه کافی خوب است یا به اندازه کافی شباهت وجود دارد کار سختی است و معمولاً به صورت ذهنی انجام میشود. ملاحظاتی برای تحلیل خوشه بندی ضوابط پارتیشن کردن پارتیشن کردن در یک سطح (مثل پارتیشن کردن مشتریان به گروه های مختلف و سپردن هر گروه به یک مدیر) در مقابل پارتیشن کردن سلسله مراتبی (مثل داده کاوی متن در دو سطح ورزش و سیاست) جدایی خوشه ها انحصاری (مثلاً هر مشتری فقط به یک گروه تعلق دارد ) در مقابل غیرانحصاری(مثلاً یک مستند ممکن است به چندین موضوع ربط داشته باشد.) معیارهای شباهت متد های برپایه فاصله ( مثل فاصله اقلیدسی، شبکه راه، فضای برداری) در مقابل متدهای برپایه اتصال ( مثل چگالی و مجاورت) فضای خوشه بندی کل فضا (غالباً برای داده هایی با ابعاد کم) در مقابل زیرفضا (غالباً برای داده هایی با ابعاد بالا) الزامات خوشه بندی مقیاس پذیری خوشه بندی همه داده ها به جای خوشه بندی تنها نمونه ای از داده ها قابلیت کار با انواع مختلف صفات عددی، باینری، اسمی، ترتیبی و ترکیبی از اینها خوشه بندی مبتنی بر قید کاربر ممکن است محدودیت هایی بر روی ورودی ها قرار دهد الزامات حوزه دانش برای تعیین پارامترهای ورودی قابلیت تفسیر و سودمندی آشکارکردن خوشه ها با شکل اختیاری قابلیت رسیدگی به داده حاوی نویز خوشه بندی افزایشی و غیرحساس بودن به ترتیب ورودی قابلیت خوشه بندی داده با ابعاد بالا فصل دهم: تحلیل خوشه: مفاهیم و متدها مفاهیم پایه: تحلیل خوشه تحلیل خوشه چیست؟ الزامات تحلیل خوشه متدهای پارتیشن بندی

نظرات کاربران

نظرتان را ارسال کنید

captcha

فایل های دیگر این دسته