پاورپوینت اسپم و فیلترکردن عمومی آن با استفاده از روش Naïve Bayesian

پاورپوینت اسپم و فیلترکردن عمومی آن با استفاده از روش Naïve Bayesian (pptx) 29 اسلاید


دسته بندی : پاورپوینت

نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )

تعداد اسلاید: 29 اسلاید

قسمتی از متن PowerPoint (.pptx) :

بنام خدا اسپم و فیلترکردن عمومی آن با استفاده از روش Naïve Bayesian رئوس مطالب مروری بر پدیده اسپم روشهای مبتنی بر یادگیری برای فیلترکردن اسپم ها روش Naïve Bayesian برای فیلترکردن اسپم معیارهای ارزیابی بررسی نتایج Spam/junk/bulk Emails پیغامهایی در Inbox شما هستند که شما آن ها را نخواسته و زمانی را برای بیرون انداختن آنها صرف می کنید. در مقابل آن : نامه های الکترونیکی معتبر یا ham 75-80% از حجم نامه های الکترونیکی را اسپم ها (spam) تشکیل می دهند باعث ایجاد ترافیک شده و فضای حافظه و قدرت محاسباتی را از بین می برد باعث ضرر اقتصادی هزینه ای بالغ بر 50 میلیون دلار بر اقتصاد امریکا در سال 2005 وارد ساخته با توجه به شخص و سازمان گیرنده ایمیل، اسپم ها تعریف می گردند ایمیل های در حوزه هنر برای شخصی که علاقه ای به هنر ندارد اسپم تلقی می شود ایمیل های اسپم Subject: AWARD CONFIRMATION We wish to congratulate you over your email success in our computer BALLOTING SWEEPSTAKE held on 16th Nov, 2007. This is a millennium scientific computer game in which email addresses were used. It is a promotional program aimed at encouraging internet users; therefore you do not need to buy ticket to enter for it. “ You have won!!!!“, you are almost winner of $... “Your order”, your item$ have to be $hipped “Lose your weight”, no subscription required “Assistance required”, an amount of million 25 US$ “Download it”, free celebrity wallpapers download نمونه هایی از ایمیل های اسپم بیشتر به منظور اهداف اقتصادی است تبلیغ برای یک کالای خاص، سرویس خاص و یا یک ایده خاص فریب کاربران برای استفاده از اطلاعات محرمانه آنها  phishing انتقال یک نرم افزار خرابکار به کامیپوتر کاربر (مثلاً ویروس) ایجاد یک خرابی به صورت موقتی در Mail-Server ایجاد ترافیک پخش مطالب غیراخلاقی اسپم ها دائما در حال تغییر محتوا و شکل هستند، برای اینکه توسط آنتی اسپم ها شناسایی نشوند. برخی از اهداف ایمیل های اسپم روشهای اقتصادی دریافت وجه برای ارسال ایمیل : مانند پروتکل Zmail روشهای قانون گذاری مانند قانون US-CAN SPAM امن سازی بسترانتقال ایمیل تغییر پروتکلهای انتقال ایمیل (مثل SMTP) و ارانه پروتکل های جایگزین مانند SenderId کنترل ایمیل های خروجی در برابر کنترل ایمیل های ورودی فیلترینگ ایمیل ها تکنیک های مبارزه با اسپم ها و کنترل آنها 1- فیلترینگ براساس یکسری قاعده از پیش تعریف شده: if $SENDER$ contains “schacht” $ACTION$=$INBOX$ [HAM] if $SUBJECT$ contains “Win” $ACTION$=$DELETE$ [SPAM] if $BODY$ contains “%%Money%%” $ACTION$=$DELETE$ [SPAM] مشکلات: قوانین ثابت، وابستگی به زبان، چه تعداد قانون؟، چه کسی باید قوانین را تعریف کند 2- فیلترینگ براساس لیست سیاه و سفید (Black list-white list) 3- فیلترینگ مبتنی بر یادگیری (آماری) و با استفاده از ویژگیهای پیغامها در یادگیری ماشینی برای عمل دسته بندی (Classification) از نمونه داده هایی (ایمیل هایی) که از قبل فراهم شده است(داده آموزش یا training) و هر یک دسته(کلاس،برچسب) مشخص دارد، استفاده کرده و دسته(کلاس) یک نمونه جدید(تست) را تعیین می کنیم. بردار پارامترها( ویژگی ها) θ حاصل آموزش دسته بند با استفاده از یک مجموعه داده است که قبلاً جمع آوری شده است نیز تابع آموزش (Training) می باشد تست داده جدید: m’ یک ایمیل جدید است و دسته آن را می خواهیم (spam or ham?) فیلترینگ مبتنی بر یادگیری (آماری) و با استفاده از ویژگیهای پیغامها مجموعه داده آموزش (training Data): M دو نوع کلاس(برچسب) : اسپم و ایمیل معتبر (ham) یادگیری Offilne داده های آموزش با کلاس(برچسب) مشخص، قبلا جمع آوری شده است و ما در طی دسته بندی از همین داده های ثابت استفاده می کنیم Soha! sorry cannot reach at 18:00 hi, have you thought online credit? .... یادگیری Online کاربر طبقه بندی هایِ غلط دسته بند را تصحیح می کند و برچسب صحیح را معین می کند؛ به این ترتیب حجم داده آموزش به تدریج افزوده می شود و دانش دسته بند افزایش می یابد مثال: در سرویس ایمیل Yahoo! می توان بر روی “spam” و یا “not spam” کلیک کرد و بدین ترتیب Yahoo! از کاربر Feedback می گیرد متدهای یادگیری

نظرات کاربران

نظرتان را ارسال کنید

captcha

فایل های دیگر این دسته