پاورپوینت بررسی تکنولوژي بازشناسي گفتار فارسي با رويکردي به صنعت بانکداري (pptx) 63 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 63 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
Page 1
پاورپوینت بررسی تکنولوژي بازشناسي گفتار فارسي با رويکردي به صنعت بانکداري
Page 2
فهرست
معرفی تکنولوژی بازشناسی گفتار
مروري بر کاربردهاي بازشناسي گفتار
نمايش عملي سامانه تايپ گفتاري فارسي نويسا
نمايش عملي يک سيستم ديالوگ تلفني ويژه بانکداري
پرسش و پاسخ
مروري بر بازشناسي خودکار گفتار (Automatic Speech Recognition- A Review)
Page 4
سيستمهاي بازشناسي خودکار گفتار-معرفي
گفتار سادهترين و کارآمدترين راه ارتباط انسان هاست
هدف بازشناسي خودکار گفتار Automatic Speech Recognition (ASR)
تبديل گفتار انسان به متن يا دستورالعمل معادل
گفتار ميتواند يک فايل صوتي، ورودي با ميکروفون، از طريق خط تلفن و يا فرمان از راه دور باشد.
سيستمهاي بازشناسي خودکار گفتار-معرفي
يک سيستم بازشناسي کامل :
قادر به بازشناسي گفتار پيوسته و محاورهاي باشد.
گفتار افراد مختلف، حتي با لهجههاي متفاوت را بازشناسي نمايد.
در محيطهاي شلوغ و نويزي هم جوابگو باشد.
بصورت بلادرنگ عمل کند.
قادر به فراگيري اطلاعات جديد نظير کلمات، قوانين زباني و . . . باشد.
سيستمهاي کاربردي امروزي:
گفتار بايستي به صورت کتابي باشد.
گفتار بايستي بر اساس حالت استاندارد زبان باشد و تغييرات مربوط به لهجهها منجر به کاهش کارايي ميشود.
استفاده از آنها در محيط و شرايط نويزي منجر به افت کارايي و دقت آنها ميشود.
اغلب سيستم هاي کاربردي امروزي تقريبا بلادرنگ هستند.
سيستمهاي موجود محدود به کلمات موجود در واژگان هستند و از اطلاعات زباني و معنايي به صورت محدود استفاده ميکنند.
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
بازشناسي گفتار کار پيچيده اي است
ارتباط انسان با ماشين امروزه بر پايه دکمه ها و کليدهاست، نه گفتار
اگر شما يک کلمه خاص مانند ”آسمان“ را 10 بار مختلف بيان نماييد، تقريبا در هيچ دو حالتي فايل هاي ضبط شده ديجيتالي آنها دقيقا يکسان نيست!
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
ميزان وابستگي يا استقلال از گوينده
پيوسته يا گسسته بودن گفتار
اندازهي واژگان
محدوديتهاي زباني
کارايي در حضور نويز و در محيطهاي کاربردي مختلف
ابهام آکوستيکي و ميزان اشتباه بين کلمات
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
ميزان وابستگي يا استقلال از گوينده
گوينده هاي مختلف از نظر مشخصات صدا، سن، لهجه، جنس، نحوه صحبت کردن و ... با هم متفاوتند
وابسته به گوينده (SD: Speaker Dependent): به يک و يا چند گوينده خاص پاسخ ميدهد
مستقل از گوينده (SI: Speaker Independent) به تمام گويندگان يک زبان پاسخ ميدهند
بيشتر روشهاي بازشناسي گفتار امروزي قادرند به هر دو صورت عمل کنند. وابستگي يا استقلال از گوينده در مورد يک سيستم بازشناسي گفتار، در مرحلهي آموزش مشخص ميشود.
دقت بازشناسي در حالت وابسته به گوينده (بعلت محدوديت و تنوع کمتر) بالاتر از حالت مستقل از گوينده (بعلت پيچيدگي بيشتر) است ولي نياز به آموزش سيستم به صداي آن کاربر خاص را دارد.
در کاربردهاي واقعي که گوينده از ابتدا مشخص نيست سيستم را مستقل از گوينده آموزش داده ميشود و سپس هنگام استفاده به کمک برخي رويکردها مانند تطبيق (Adaptation)، سيستم براي يک گوينده خاص تطبيق ميشود.
در برخي کاربردهاي ديگر مانند بازشناسي از پشت خط تلفن وابسته به گوينده بودن چندان معني خاصي ندارد چون گوينده از ابتدا مشخص نيست.
سيستمهاي بازشناسي خودکار گفتار-پيچيدگيها
پيچيدگيهاي مطرح در سيستمهاي بازشناسي گفتار
پيوسته يا گسسته بودن گفتار
محدوديت بر نحوة اداي کلمات توسط گوينده ميزان پيوستگي يا گسستگي کلمات
بازشناسي کلمات مجزا (IWR: Isolated Word Recognition)
گفتار کلمه به کلمه و کاملاً مجزا – هر فايل صوتي يک کلمه
بازشناسي گفتار متصل (Connected Word Recognition)
دنبالهاي از کلمات که به وسيلة سکوتي کوتاه از هم جدا شوند – هر فايل چند کلمه با سکوت در بين کلمات
بازشناسي گفتار پيوسته کتابي (CSR: Continuous Speech Recognition)
گفتار به صورت ديکته کتابي و روان
بازشناسي گفتار پيوسته محاوره اي (Spontaneous Speech)
گفتار به صورت کاملاً طبيعي بيان ميشود، شامل جملات ناقص، سرفه، تپق، مکثهاي طولاني و ... است.
پيچيدگي بازشناسي گفتار پيوسته و فيالبداهه بسيار زياد است (مشکلات ناشي از اثر بافت مانند مشخص نبودن مرز کلمات متوالي و ادغام شدن ابتداي يک کلمه با انتهاي کلمة قبلي)
سيستمهاي امروزي فقط براي خواندن کتابي کاربردي هستند و تشخيص گفتار فيالبداهه يکي از زمينههاي فعال تحقيقات ميباشد.