مقاله مشکلات خط فارسی (docx) 15 صفحه
دسته بندی : تحقیق
نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )
تعداد صفحات: 15 صفحه
قسمتی از متن Word (.docx) :
مشکلات خط فارسینقصهايي اساسی كه براي زبان فارسي شمردهاند به شرح زيراست (راثی ساربانقلی، 1384):● عدم اعراب گذاری: به عنوان مثال کلمات (مَلَک، مِلک، مَلِک، مُلک) همه به یک شکل نوشته می شوند.● وجود چند علامت برای یک حرف: مانند (ز، ذ، ظ، ض)● استفاده از یک علامت برای چند حرف: مانند "و" که پنج مورد نوشتن دارد یکی برای بیان ضمه در کلمات "خوش" و "تو". ديگر بيان مصوت ممدود يا "واو ماقبل مضموم" مانند "شور" و "او". سوم بيان حرف صامت "واو" در كلماتي چون "آواز" و "والي" و "عفو" . چهارم بيان حرف مصوت مركبي كه در كلمات "نو" و "جوشن" و مانند آنهاست. پنجم حرفي كه در زبان كنوني خوانده نميشود مانند "واو معدوله" در كلمات "خواهر" و "خواستن" و "واو" در كلمه "عمرو"[27]● حرفهایی که در نوشتار حذف می شوند: مانند "الف" در کلمات "اسمعیل" و "الله"● نقطه گذاری: نقطههايي متعدد در بالا و پائين حرف كه هم سبب دشواري و هم موجب اشتباه در خواندن ميشود. اهميت بيش از حد نقطه درخط فارسي هنگام تشخيص نوري كاراكترها توليد اشكال اساسي ميكند. به عنوان مثال كلمات زير را در نظر بگيريد كه با يك يا چند نقطه عوض ميشوند (بُر، بَر، پُر، پَر، تَر، پُز، پَز، بُز، تِز). - از راست به چپ نوشته شدن: برای این مورد دلایل مختلفی ذکر شده است از جمله عدم هماهنگی و ایجاد مشكل در نوشتن متون رياضي و شيمي و نتهاي موسيقي و دستورات شطرنج و اين كه خط تصويري يعني علائم گرافيكي كه در كل جهان استفاده ميشود مانند علائم راهنمائي و رانندگي تماماً از چپ خوانده ميشوند.● پیوسته نویسی و جدا نویسی: مانند تنوع استفاده از ‹مي› چسبان و غير چسبان و يا تنوع نحوه به كار بردن «علامتهاي جمع ‹ها، ان، جات› ، هم، هيچ، كه، (ضماير شخصي متصل مان، تان، شان)، شناسي، را، چه، چون، تر، ترين، بي (پيشوند نفي)، به، اي (نشانه ندا)، آن و اين» در كلمات به صورت پيوسته و يا جدا گانه: (آنچه ، آن چه)؛ (همچنانكه، همچنانكه) ؛ (جنابعالي، جنابعالي)؛ (هيچكس، هيچكس)؛ (ميتواند، ميتواند)؛ (آن ها، آنها) در اين مورد كلماتي كه پيشوند و يا پسوند دارند نيز در شكلهاي مختلف نوشته ميشوند. برخي از كلمات در دو شكل متصلنويسي و منفصلنويسي به دو شكل مختلف ظاهر ميشوند، مانند «علاقمند و علاقهمند؛ انديشمند و انديشهمند». مصدرها و فعلهاي مركب و اسمهاي مشتق از آنها نيز به دو صورت متصل و منفصل نوشته ميشوند مانند «نگهداشتن و نگهداشتن». در جستجوي مطالب از اينترنت اين مورد توليد اشكال ميكند چنانكه جستجوي «هيچكس» نتايج متفاوتي را با جستجوي «هيچكس» ميآورد و يا جستجوي «كتابشناسي» و «كتابشناسي» در موتور جستجوي گوگل نتايج متفاوتي را ارائه ميكند. اين گونه كلمات با اين كه در خواندن متن اشكال كمي به وجود ميآورند و هر آشناي به زبان فارسي به راحتي ميتواند آن را بخواند اما در فنآوري امروزه و تجزيه و تحليل كلمات به كمك رايانه اشكال اساسي توليد ميكند و شايد اگر قاعدهاي جامع و مانع براي آن وضع گردد، بتوان گفت بزرگترين مشكل خط فارسي حل شده است. منظور اين كه، براي مثال خواندن سه كلمه «بيحوصلگي، بيحوصلگي، بيحوصلهگي» مشكلي ايجاد نميكند. اما در محيط الكترونيكي و شبكه اينترنت براي بازيابي اين كلمه بايستي براي تمام اشكال اين كلمه، جستجو را انجام دهيم، البته اگر آگاهي از تمام اشكال نوشتاري آن داشته باشيم. ● نوشته شدن حروف به اشکال متعدد: مثلاً نوشتن ك و گ (كـ گـ ك گ) در اشكال مختلف نيز باعث سردرگمي و عدم جستجوي صحيح ميشود.●بوجود آمدن معنای متفاوت با اضافه کردن یک فاصله: مثل مادر ، ما در● تعداد سطرها در هر صفحه: سه كرسي مختلف براي حرفهاي مختلف الفبا باعث مي شود كه در مقايسه با اكثر زبانها تعداد سطرهاي هر صفحه به مراتب بيشتر گردد چون برخي حروف روي خط كرسي قرار ميگيرند و برخي پائين خط كرسي و برخي بالاي خط كرسي مثل (ا ب م )● پیوسته نویسی حروف: از آنجائيكه حروف در نوشتن غالباً به صورت چسبيده و پيوسته نوشته ميشوند و اين امر تشخيص حرف به حرف نوشته به وسيله رايانه را، دچار مشكل ميكند.● عدد صفر در فارسی: در او. سي. آر. فارسي هم چنين اعداد نيز مشكل ساز هستند چنانچه صفر در فارسي يك نقطه كوچك است كه ميتواند رايانه را به اشتباه بياندازد و نيز اعداد 1 و 2 و 3 بسيار شبيه هم هستند و تفاوتشان در يك دندانه كوچك است.● تنوع در رسم الخط: مانند ( اتاق و اطاق) و يا (امپراتور و امپراطور). و كلماتي كه فقط يك شكل آنها صحيح ميباشد ولي شكل ناصحيح آن نيز زياد استفاده ميشود مانند «ذغال و زغال؛ خوشنود و خشنود». البته اين جداي از تنوع در مفهوم كلمات است كه در ديگر زبانها نيز وجود دارد، يعني براي بعضي از مفاهيم ممكن است كلمات متنوعي استفاده بشود. مانند كامپيوتر و رايانه.● شکل های مختلف ضبط نام های بیگانه: واژههاي بيگانه اغلب براي پر كردن خلاء واژههاي علمي و يا ارتباطي سودمند هستند، اما وجود آنها مسائلي از قبيل چگونگي ضبط آنها در زبان قرضگيرنده را به وجود ميآورد. براي ضبط واژههاي قرضي به سبب اختلاف فاحش نشانههاي الفباي فارسي با نشانههاي الفباي خارجي مشكلات جدي وجود دارد. از جمله اين كه الفباي فارسي آوانگار نيست و به همين جهت در ضبط دقيق تلفظ واژههاي زبان فارسي نيز ناتوان است و اين ناتواني در ضبط واژههاي بيگانه به مراتب بيشتر است و اين كه در مورد برگردان اسامي خارجي به خط فارسي قاعده خاصي وجود ندارد و هر كس بنا بر سليقه و ذوق خود اين كار را انجام ميدهد كه در نتيجه يك كلمه واحد به صورتهاي مختلف نوشته ميشود. براي مثال (كلسيم، كلسيوم، كالسيوم) و يا اسم Franklin به صورت (فرانكلين، فرانكلن، فرنكلين، فرنكلن) ضبط شده است. خانم صديق بهزادي اين مشكلات را به سه دسته تقسيم كرده است: ” 1- نامهايي كه در برگردان آنها همخوانها ايجاد مشكل ميكنند. 2 – نامهايي كه در برگردان آنها واكههاي ساده مشكلاتي را به وجود ميآورند . 3 – و سوم نامهايي كه در برگردان آنها مشكل اصلي مربوط به واژههاي مركب است. (نقل در راثی ساربانقلی، 1384) ● انواع مختلف جمع بستن: به عنوان مثال جمع بستن يك واژه با علايم جمع فارسي وعلايم جمع عربي و نيز جمع بستن بي قاعده (جمع مكسر)، استفاده ازجمع جمع، مانند (معلم، معلمين، معلمان، معلمها).● تنوین های زبان عربی: از جمله دشواريهاي رعايت اصل همخواني نوشتاري و گفتاري هستند.● وجود دندانه های متعدد: به خصوص در او.سي.آر. فارسي ايجاد اشكال ميكند مانند كلمات: نشستن و استشهاد.ابزارهاي كاوش با واسط فارسيبرخي از ابزارهاي كاوش با امكانات جستجوي فارسي عبارتند از: ایران کلیکIranclick، Open Directory، ايرانهوIranhoo ، ايرانمهرIranMehre ، پارسيك Parseek ، گوگل Google. تنها موتور كاوش Google داراي برنامه روبات مي باشد و قادر است صفحات فارسي را در قالب يوني كد[28] شناسايي و در پايگاه خود نمايه كند. Parseek نيز از آنجايي كه از پايگاهGoogle استفاده مي كند، يك موتور كاوش وابسته به پايگاه ديگر ابزارهاي كاوش به حساب مي آيد.4 ابزاركاوش ديگرراهنماي موضوعي به شمارمي آيند و انسان فرايند شناسايي،بررسي و نمايه سازي سايتها يا صفحات وب رابرعهده دارد. (کوشا، 1382) اضافه کردن يك واسط هوشمند به موتورهاي كاوش يا خزنده ها، كيفيت نتايج كاوش در وب هاي فارسي زبان را ارتقاء می دهد. اين واسط در واقع نقش يك پردازشگر پرس وجو[29] را ايفاء مي كند. (صدیقی؛ زمانی فر، 1385)
نتیجه گیرینقایص ومشکلات خط فارسی که اجمالاً ذکر شد، بازیابی اطلاعات توسط موتورهای جستجو را که در حال حاضر تنها موتور جستجوی Google امکان جستجو به زبان فارسی را دارد و سایر موتورهای کاوش مانند Parseek هم موتور کاوش Google را برای جستجوی اطلاعات فارسی به کار می برند، دشوار می کند و همین نقایص، باعث عدم دسترسی کاربران به همۀ صفحات وب موجود به زبان فارسی می شود که این همان وب نامرئی است (صفحاتی در وب وجود دارد اما با موتور کاوش نمی توان آن را بازیابی کرد).طبق مطالعات انجام شده در این زمینه، به نظر می رسد که حجم وب نامرئی در زبان فارسی نسبت به حجم کل وب فارسی بیشتر از حجم کل وب نامرئی نسبت به حجم کل وب است. چرا که از میان صفحات وب فارسی، صفحات وب بسیاری وجود دارد که به دلایلی که قبلاً اشاره شد از جمله عدم وجود رسم الخط ثابت و نیز عدم رعایت آن توسط تولیدکننگان صفحات وب از دید کاربران پنهان می ماند. در این راستا آگاهی از وجود وب نامرئی توسط کتابداران، اولین و مهمترین گام است. ساده و روشن بنويسيم
«آیا باید برای آنلاین-نویس دستورها و هنجارهای ویژهای داشت؟» به این پرسش داریوش آشوری، نویسنده و زبانشناس پرآوازه پاسخ میدهد.
دویچه وله: آقای آشوری، عنوان پروژهی شما در قلمرو زبان، پروژهی زبان باز است. اینترنت را برای باز شدن زبان فارسی یک فرصت میبینید، یا به خاطر آسیبهایی که به زبان میرساند، یک تهدید؟