پاورپوینت اصول و روش های داده کاوی (pptx) 19 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 19 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
اصول و روش های داده کاوی
چرا داده کاوی ؟دو پرسش مهم
1- داده کاوی چیست ؟
انواع داده : داده های جدول یا رابطه ای ، گرافها (مثل وب) و شبکه های اجتماعی (شبکه) ، داده های تصویری ، داده های زمانی ، داده های ویدئویی ، فضایی و .....
چرا داده کاوی ؟دو پرسش مهم
2- ضرورت استفاده از آن در کاربردهای مختلف چیست ؟
* در عصر انفجار اطلاعات هستیم و در حال غرق شدن در اطلاعات ، اما نیازمند به دانش از آن هستیم . با گسترش وب با حجم انبوهی از اطلاعات در حوزه های تجاری ، خبری ، علمی ، اجتماعی و..... روبرو هستیم.
*باید راهی برای پردازش اطلاعات بدست بیاوریم و به دنبال تکنیک های خودکار یا غیر خودکار باشیم.
* بنابراین هر جا که داده هایی در اختیار است و باید بررسی شود ، دانش به دست می آید و ما با داده کاوی مواجه هستیم.
*داده کاوی یک علم میان رشته ای است که در حوزه کامپیوتر ، مدیریت ، آمار ، برق ، اقتصاد و شاخه های دیگر علوم میتوان تکنیک هایی مشاهده نمود.
داده کاوی یک علم میان رشته ای
شماتیک کلی از فرآیند داده کاوی KDD : Knowledge Discovery in Database
مرحله اول :Databases
منابع اولیه از اطلاعات را در اختیار داریم که البته چون لزوما به شکل پایگاه داده نیست ، شاید بهتر باشد که عبارت
Data Sources
کلی تر و جامع باشد که ممکن است به لحاظ ساختاری و قرار گرفتن در موقعیت های فیزیکی متفاوت باشد .
در این حالت بخشهای پراکنده اطلاعات باید شناسایی و جمع آوری شود و حذف اطلاعات غیر ضرور صورت پذیرد که در این حالت
DATA CLEANING
و
DATA INTEGRATION
انجام می شودکه نتیجه آن :
مرحله دوم : Data Warehouse
جمع شدن داده ها با ویژگیهای مورد نیاز جهت پردازشهای چند وجهی اتفاق می شود.
Multi Dimensional
برای مثال : فرض کنید یک فروشگاه زنجیره ای با شعبات مختلف فرآیند فروش را مد نظر دارد و می خواهیم با استفاده از اطلاعات فیش های خروجی تصمیم گیریهای مدیریتی و فعالیت مناسب تجاری انجام دهیم.(تشکیل انبار داده)
در این حالت با انتخاب و انتقال اطلاعات (جدا کردن اطلاعات مطلوب)، سعی داریم به دانشی برسیم که ما را هدایت کند و این منجر به داده کاوی می شود و ایجاد یک پایگاه داده جهت پیدا کردن الگو ها :
مرحله سوم :Data Mining
حال در این اطلاعات جمع شده با توجه به ویژگی های مورد نظر و پردازش آن قصد داریم به الگوهایی برسیم که در اطلاعات وجود دارد.
در این میان استفاده از تکنیک های آماری و آشنایی با روشهای تحلیل آماری بسیار حائز اهمیت است .
چون در واقع با این تکنیک ها ما به الگوهایی دست می بیابیم که بر داده ها حاکم است و جهت کشف دانش مهم است.
با تحلیل این الگوها ما می توانیم موفق به کشف دانش شویم. (مرحله پایانی)