مقاله مشکلات خط فارسی

مقاله مشکلات خط فارسی (docx) 15 صفحه


دسته بندی : تحقیق

نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )

تعداد صفحات: 15 صفحه

قسمتی از متن Word (.docx) :

مشکلات خط فارسی نقص‌هايي اساسی كه براي زبان فارسي شمرده‌اند به شرح زيراست (راثی ساربانقلی، 1384): ● عدم اعراب گذاری: به عنوان مثال کلمات (مَلَک، مِلک، مَلِک، مُلک) همه به یک شکل نوشته می شوند. ● وجود چند علامت برای یک حرف: مانند (ز، ذ، ظ، ض) ● استفاده از یک علامت برای چند حرف: مانند "و" که پنج مورد نوشتن دارد یکی برای بیان ضمه در کلمات "خوش" و "تو". ديگر بيان مصوت ممدود يا "واو ماقبل مضموم" مانند "شور" و "او". سوم بيان حرف صامت "واو" در كلماتي چون "آواز" و "والي" و "عفو" . چهارم بيان حرف مصوت مركبي كه در كلمات "نو" و "جوشن" و مانند آن‌هاست. پنجم حرفي كه در زبان كنوني خوانده نمي‌شود مانند "واو معدوله" در كلمات "خواهر" و "خواستن" و "واو" در كلمه "عمرو"[27] ● حرفهایی که در نوشتار حذف می شوند: مانند "الف" در کلمات "اسمعیل" و "الله" ● نقطه گذاری: نقطه‌هايي متعدد در بالا و پائين حرف كه هم سبب دشواري و هم موجب اشتباه در خواندن مي‌شود. اهميت بيش از حد نقطه درخط فارسي هنگام تشخيص نوري كاراكترها توليد اشكال اساسي مي‌كند. به عنوان مثال كلمات زير را در نظر بگيريد كه با يك يا چند نقطه عوض مي‌شوند (بُر، بَر، پُر، پَر، تَر، پُز، پَز، بُز، تِز).  - از راست به چپ نوشته شدن: برای این مورد دلایل مختلفی ذکر شده است از جمله عدم هماهنگی و ایجاد مشكل در نوشتن متون رياضي و شيمي و نت‌هاي موسيقي و دستورات شطرنج و اين‌ كه خط تصويري يعني علائم گرافيكي كه در كل جهان استفاده مي‌شود مانند علائم راهنمائي و رانندگي تماماً از چپ خوانده مي‌شوند. ● پیوسته نویسی و جدا نویسی: مانند تنوع استفاده از ‹مي› چسبان و غير چسبان و يا تنوع نحوه به كار بردن «علامت‌هاي جمع ‹ها، ان، جات› ، هم، هيچ، كه، (ضماير شخصي متصل مان، تان، شان)، شناسي، را، چه، چون، تر، ترين، بي (پيشوند نفي)، به، اي (نشانه ندا)، آن و اين» در كلمات به صورت پيوسته و يا جدا گانه: (آنچه ، آن چه)؛ (همچنانكه، همچنان‌كه) ؛ (جنابعالي، جناب‌عالي)؛ (هيچكس، هيچ‌كس)‏‎؛ (ميتواند، مي‌تواند)؛ (آن ها، آنها) در اين مورد كلماتي كه پيشوند و يا پسوند دارند نيز در شكل‌هاي مختلف نوشته مي‌شوند. برخي از كلمات در دو شكل متصل‌نويسي و منفصل‌نويسي به دو شكل مختلف ظاهر مي‌شوند، مانند «علاقمند و علاقه‌مند؛ انديشمند و انديشه‌مند». مصدرها و فعل‌هاي مركب و اسم‌هاي مشتق از آنها نيز به دو صورت متصل و منفصل نوشته مي‌شوند مانند «نگه‌داشتن و نگهداشتن». در جستجوي مطالب از اينترنت اين مورد توليد اشكال مي‌كند چنانكه جستجوي «هيچ‌كس» نتايج متفاوتي را با جستجوي «هيچكس» مي‌آورد و يا جستجوي «كتاب‌شناسي» و «كتابشناسي» در موتور جستجوي گوگل نتايج متفاوتي را ارائه مي‌كند. اين گونه كلمات با اين كه در خواندن متن اشكال كمي به وجود مي‌آورند و هر آشناي به زبان فارسي به راحتي مي‌تواند آن را بخواند اما در فن‌آوري امروزه و تجزيه و تحليل كلمات به كمك رايانه اشكال اساسي توليد مي‌كند و شايد اگر قاعده‌اي جامع و مانع براي آن وضع گردد، بتوان گفت بزرگ‌ترين مشكل خط فارسي حل شده است. منظور اين كه، براي مثال خواندن سه كلمه «بي‌حوصلگي، بيحوصلگي، بي‌حوصله‌گي» مشكلي ايجاد نمي‌كند. اما در محيط الكترونيكي و شبكه اينترنت براي بازيابي اين كلمه بايستي براي تمام اشكال اين كلمه، جستجو را انجام دهيم، البته اگر آگاهي از تمام اشكال نوشتاري آن داشته باشيم. ● نوشته شدن حروف به اشکال متعدد: مثلاً نوشتن ك و گ (كـ گـ ك گ) در اشكال مختلف نيز باعث سردرگمي و عدم جستجوي صحيح مي‌شود. ●بوجود آمدن معنای متفاوت با اضافه کردن یک فاصله: مثل مادر ، ما در ● تعداد سطرها در هر صفحه: سه كرسي مختلف براي حرف‌هاي مختلف الفبا باعث مي شود كه در مقايسه با اكثر زبان‌ها تعداد سطرهاي هر صفحه به مراتب بيش‌تر گردد چون برخي حروف روي خط كرسي قرار مي‌گيرند و برخي پائين خط كرسي و برخي بالاي خط كرسي مثل (ا ب م ) ● پیوسته نویسی حروف: از آنجائيكه حروف در نوشتن غالباً به صورت چسبيده و پيوسته نوشته مي‌شوند و اين امر تشخيص حرف به حرف نوشته به وسيله رايانه را، دچار مشكل مي‌كند. ● عدد صفر در فارسی: در او. سي. آر. فارسي هم چنين اعداد نيز مشكل ساز هستند چنانچه صفر در فارسي يك نقطه كوچك است كه مي‌تواند رايانه را به اشتباه بياندازد و نيز اعداد 1 و 2 و 3 بسيار شبيه هم هستند و تفاوت‌شان در يك دندانه كوچك است. ● تنوع در رسم الخط: مانند ( اتاق و اطاق) و يا (امپراتور و امپراطور). و كلماتي كه فقط يك شكل آنها صحيح مي‌باشد ولي شكل ناصحيح آن نيز زياد استفاده مي‌شود مانند «ذغال و زغال؛ خوشنود و خشنود». البته اين جداي از تنوع در مفهوم كلمات است كه در ديگر زبان‌ها نيز وجود دارد، يعني براي بعضي از مفاهيم ممكن است كلمات متنوعي استفاده بشود. مانند كامپيوتر و رايانه. ● شکل های مختلف ضبط نام های بیگانه: واژه‌هاي بيگانه اغلب براي پر كردن خلاء واژه‌هاي علمي و يا ارتباطي سودمند هستند، اما وجود آن‌ها مسائلي از قبيل چگونگي ضبط آن‌ها در زبان قرض‌گيرنده را به‌ وجود مي‌آورد. براي ضبط واژه‌هاي قرضي به سبب اختلاف فاحش نشانه‌هاي الفباي فارسي با نشانه‌هاي الفباي خارجي مشكلات جدي وجود دارد. از جمله اين كه الفباي فارسي آوانگار نيست و به همين جهت در ضبط دقيق تلفظ واژه‌هاي زبان فارسي نيز ناتوان است و اين ناتواني در ضبط واژه‌هاي بيگانه به مراتب بيش‌تر است و اين كه در مورد برگردان اسامي خارجي به خط فارسي قاعده خاصي وجود ندارد و هر كس بنا بر سليقه و ذوق خود اين كار را انجام مي‌دهد كه در نتيجه يك كلمه واحد به صورت‌هاي مختلف نوشته مي‌شود. براي مثال (كلسيم، كلسيوم، كالسيوم) و يا اسم Franklin به صورت (فرانكلين، فرانكلن، فرنكلين، فرنكلن) ضبط شده است. خانم صديق بهزادي اين مشكلات را به سه دسته تقسيم كرده است: ” 1- نام‌هايي كه در برگردان آن‌ها هم‌خوان‌ها ايجاد مشكل مي‌كنند. 2 – نام‌هايي كه در برگردان آن‌ها واكه‌هاي ساده مشكلاتي را به‌ وجود مي‌آورند . 3 – و سوم نام‌هايي كه در برگردان آن‌ها مشكل اصلي مربوط به واژه‌هاي مركب است. (نقل در راثی ساربانقلی، 1384) ● انواع مختلف جمع بستن: به عنوان مثال جمع بستن يك واژه با علايم جمع فارسي وعلايم جمع عربي و نيز جمع بستن بي قاعده (جمع مكسر)، استفاده ازجمع جمع، مانند (معلم، معلمين، معلمان، معلم‌ها). ● تنوین های زبان عربی: از جمله دشواري‌هاي رعايت اصل هم‌خواني نوشتاري و گفتاري هستند. ● وجود دندانه های متعدد: به خصوص در  او.سي.آر. فارسي ايجاد اشكال مي‌كند مانند كلمات: نشستن و استشهاد. ابزارهاي كاوش با واسط فارسي برخي از ابزارهاي كاوش با امكانات جستجوي فارسي عبارتند از: ایران کلیکIranclick، Open Directory، ايران‌هوIranhoo  ، ايران‌مهرIranMehre ، پارسيك Parseek ، گوگل Google. تنها موتور كاوش Google داراي برنامه روبات مي باشد و قادر است صفحات فارسي را در قالب يوني كد[28] شناسايي و در پايگاه خود نمايه كند. Parseek نيز از آنجايي كه از پايگاهGoogle استفاده مي كند، يك موتور كاوش وابسته به پايگاه ديگر ابزارهاي كاوش به حساب مي آيد.4 ابزاركاوش ديگرراهنماي موضوعي به شمارمي آيند و انسان فرايند شناسايي،بررسي و نمايه سازي سايتها يا صفحات وب رابرعهده دارد. (کوشا، 1382)  اضافه کردن يك واسط هوشمند به موتورهاي كاوش يا خزنده ها، كيفيت نتايج كاوش در وب هاي فارسي زبان را ارتقاء می دهد. اين واسط در واقع نقش يك پردازشگر پرس وجو[29] را ايفاء مي كند. (صدیقی؛ زمانی فر، 1385) نتیجه گیری نقایص ومشکلات خط فارسی که اجمالاً ذکر شد، بازیابی اطلاعات توسط موتورهای جستجو را که در حال حاضر تنها موتور جستجوی Google امکان جستجو به زبان فارسی را دارد و سایر موتورهای کاوش مانند Parseek هم موتور کاوش Google  را برای جستجوی اطلاعات فارسی به کار می برند، دشوار می کند و همین نقایص، باعث عدم دسترسی کاربران به همۀ صفحات وب موجود به زبان فارسی می شود که این همان وب نامرئی است (صفحاتی در وب وجود دارد اما با موتور کاوش نمی توان آن را بازیابی کرد). طبق مطالعات انجام شده در این زمینه، به نظر می رسد که حجم وب نامرئی در زبان فارسی نسبت به حجم کل وب فارسی بیشتر از حجم کل وب نامرئی نسبت به حجم کل وب است. چرا که از میان صفحات وب فارسی، صفحات وب بسیاری وجود دارد که به دلایلی که قبلاً اشاره شد از جمله عدم وجود رسم الخط ثابت و نیز عدم رعایت آن توسط تولیدکننگان صفحات وب از دید کاربران پنهان می ماند. در این راستا آگاهی از وجود وب نامرئی توسط کتابداران، اولین و مهمترین گام است.    ساده و روشن بنويسيم «آیا باید برای آن‌لاین-نویس دستورها و هنجارهای ویژه‌ای داشت؟» به این پرسش داریوش آشوری، نویسنده و زبان‌شناس پرآوازه‌ پاسخ می‌دهد. دویچه وله: آقای آشوری، عنوان پروژه‌ی شما در قلمرو زبان، پروژه‌ی زبان باز است. اینترنت را برای باز شدن زبان فارسی یک فرصت می‌بینید، یا به خاطر آسیبهایی که به زبان می‌رساند، یک تهدید؟

نظرات کاربران

نظرتان را ارسال کنید

captcha

فایل های دیگر این دسته