زبان عربی و مشکلی به نام «گاف»

Gafاستفاده از گوگل‌ریدر و مترجم گوگل به طور همزمان باعث شده تا دایره مطالعات خودم رو توی وبلاگ‌ها به زبان‌های دیگه هم گسترش بدهم. هر چند دانسته‌های ما از زبان عربی محدود به هفت سالی می‌شه که در راهنمایی و دبیرستان خوندیمش و برای فهم وبلاگ‌های عربی چندان نیازی به جر واجر کردن مخمون نداریم (البته آموزش زبان عربی هم در سیستم آموزشی ایران تعریفی نداشت). به هر حال در یکی از وبلاگ‌های عربی که توسط «اشرف احسان فقیه» نویسنده داستان‌های علمی‌-تخیلی و دانشجوی دکترای دانشگاه کویینز کانادا نوشته می‌شه، به مطلب جالبی برخوردم. شاید بد نباشه بخش آغازین این مطلب رو بخونیم:

واژه Google را به عربی چطور می‌نویسید؟ من آن را به اشکال مختلفی دیده‌ام: این طور «جوجل» و «غوغل» و «قوقل» و حتى «کوکل»! ما دچار بحران صدای G هستیم. برای یک صوت که وجود دارد، در عربی صورت‌های گوناگون داریم. مصری‌ها و یمنی‌ها به آن «جیم» می‌گویند. ما در عربستان سعودی آن را «قاف» تلفظ می‌کنیم. اما اوضاع نوشتن چطور است؟ یک توافقی بین ناشران و نویسندگان عرب برای حل این مشکل موجود است: «قاف» و «جیم» معادل G است. همچنین سابقه‌ای طولانی برای استفاده از حرف «غین» وجود دارد. من درک نمی‌کنم دقیقاً بر چه پایه‌ای؟!

در ادامه مطلب، این بلاگر درباره زبان و خط فارسی و اردو و کردی صحبت می‌کنه و در کنار این که به زبان و خط عربی افتخار می‌کنه، پیشنهاد می‌ده همون طور که حرف «ﭬ» رو به جای V به کار بردن (اعراب «و» رو مشابه W تلفظ می‌کنن)، از «گ» به جای G استفاده کنن. از قرار معلوم قبلاً هم بنیاد پیشرفت علم کویت، توی ترجمه عربی مجله آمریکایی ساینتیفیک از گاف استفاده می‌کرد.
ادامه مقاله هم باز پیشنهاد می‌ده که از «پ» به جای P استفاده کنن تا به فرم استاندارد نزدیک‌تر بشن و کمبودها جبران بشه.
به انتهای مقاله هم عکس‌هایی ضمیمه شده از قبیل عبدالله گل، حرف یونانی گاما، آرم شرکت مخابراتی گو، تایگر وودز و آرم گوگل و غیره که تلفظ و نوشتنشون در عربی همیشه مشکل‌ساز بوده.
از قرار معلوم برای حل مشکل ازدیاد واژه‌های بیگانه در زبان عربی، باید کاری کنن تا زودتر به یک حالت استاندارد برسن و پیشنهادی که آقای اشرف احسان فقیه داده، یکی از بحث‌های جدی دانش‌آموختگان حوزه رسانه و فناوری دنیای عربه.

خدمات نویسه‌گردانی گوگل به زبان فارسی

یک سایت ایرانی هست به نام به‌نویس که کارش اینه که پینگلیش می‌گیره و تبدیلش می‌کنه به فارسی. کارش هم کم و بیش خوبه. قبلاً درباره‌اش چیزکی نوشته بودم. حالا گوگل هم سرویس نویسه‌گردانی خودش به زبان فارسی رو راه‌اندازی کرده که به نظر می‌رسه چندان رعایت قوانین پینگلیش‌نویسیش سخت نیست. درست و حسابی کار می‌کنه. یک بار دیگر هم می‌گم که این ابزار بسیار به درد می خوره. مخصوصاً اگه در سفر باشین و بخواین وبلاگتون رو به‌روز کنین، به خاطر فعال نبودن صفحه‌کلید فارسی در جاهایی مثل کافی‌نت، به راحتی نمی‌شه فارسی نوشت. اما با استفاده از این ابزار گوگل می‌تونین، پینگلیش بنویسین و حاصلش رو کپی کنین توی ویرایشگر وبلاگتون.
این ابزار تا پیش از این برای یازده زبان دیگه از جمله بنگالی، گجراتی، هندی، اردو و پنجابی فعال بوده و از قرار معلوم تازگی برای زبان فارسی هم فعال شده. هر چند لینک مستقیم زبان فارسی توی صفحه اصلی مشاهده نمی‌شه.

Google Transliterate Persian 

ادامه

خیمه‌شب‌بازی با تصاویر زمینی!

میدان ترافلگار، یکی از مشهورترین جاهای دیدنی لندن با ده‌ها مجسمه از شخصیت‌های معروف انگلیسی است که می‌توانید توضیحات کاملش را در ویکی‌پدیا بخوانید.
این میدان سال‌هاست که محل برگزاری انواع جشن‌ها و تجمعات از مراسم سال نوی یهودیان و جشن‌های خیریه تا عید فطر و تورنمنت فوتبال پلی‌استیشن شده است. تقریباً روز و شبی نیست که بروید اینجا و چیز تازه‌ای نبینید. اگر خیلی کنجکاوید می‌توانید سری به دوربین‌های پخش زنده در ترافلگار بزنید.
دیشب که داشتم همین‌طور بی‌هدف در بخش مرکزی و شلوغ این شهر قدم می‌زدم، رسیدم به این میدان. طبق معمول یک پروژه‌ای دیدنی را در آنجا راه انداخته بودند با عنوان Under Scan. در این پروژه با استفاده از پروژکتورهایی خاص که روی ارتفاع نصب شده‌اند، ویدئوهایی را روی زمین می‌اندازند از آدم‌های که در حالت عادی بی‌حرکتند اما نسبت به سایه‌های رهگذران واکنش نشان می‌دهند. در واقع Interactive Video Art یا هنر ویدئوهای تعاملی بهترین توضیحی است که می‌شود درباره این پروژه داد. برای مثال شما با تصویری یک مرد روی زمین روبه‌رو می‌شوید که در حالت جنینی به خواب رفته و وقتی سایه شما رویش می‌افتد، بیدار شده و متناسب با رفتار سایه‌تان، حرکاتی را انجام می‌دهد. برای درک بهتر از آنچه که گفتم، ویدئوی زیر را ببینید. بدیهی است که تمام این پروژه زمانی معنا دارد که هوا تاریک باشد. یعنی شب. سیگارتان را که برداشته‌اید؟

ادامه

نمایشگاه کتاب؛ هیاهوی بسیار برای هیچ

The 20th Tehran International Book Fairزیگزاگنمایشگاه کتاب پس از مناقشه‌ای طولانی بر سر مکان آن با حال و هوایی متفاوت از سال‌های گذشته برگزار شد.
اردیبهشت ماه در تهران، همیشه همراه بوده است با نمایشگاه بین‌المللی کتاب و مطبوعات. سال‌های قبل محل برگزاری این دو نمایشگاه که تقریباً همزمان برگزار می‌شدند، جایی به غیر از محل دائمی نمایشگاه‌های بین‌المللی تهران نبود. اما امسال، مکان برگزاری مناقشه‌ای را برانگیخت که حتی پیش از افتتاح این رویداد فرهنگی، رسانه‌ها را تحت تأثیر قرار داد و خبرساز شد. وزارت ارشاد اسلامی، اصرار داشت که نمایشگاه بیستم کتاب در مصلای تهران برگزار شود. حال آن که بسیاری دیگر با این امر موافق نبودند و این مسأله در کنار اعتراض به وضعیت صدور مجوز برای کتاب‌ها، باعث تحریم نمایشگاه از سوی تعدادی از ناشران شد.
ضیافت شام وزارت ارشاد و دعوت از ناشران عصیان‌گر، عاقبت باعث شد تا آنها در نمایشگاه شرکت کنند. اما حتی با وجود این تفاهم دیر هنگام، حال و هوای نمایشگاه امسال حکایتی متفاوت از دوره‌های پیشین داشت. نمایشگاه بیستم کتاب سرانجام، چنان که مسؤولان وزارت ارشاد می‌خواستند، در مصلی تهران افتتاح شد؛ فضای بازی که جابه جا با حفاظ‌های پلاستیکی و پارچه‌ای پوشانده شده است. در همان آغاز کار، باران بهاری باعث شد تا بخش‌هایی از نمایشگاه زیر آب برود و خسارت‌هایی به تعدادی از ناشران وارد شود.

ادامه

محتوای پارسی در وب و مترجم آنلاین گوگل

Persian Content Webدر خبرها آمده که زبان پارسی در میان زبان‌های رایج در اینترنت رتبه قابل توجهی ندارد و سهم زبان پارسی از محتوای روی اینترنت بسیار ناچیز است. این در حالی است که تا پیش از این تبلیغات و مانور زیادی درباره رتبه سوم زبان پارسی در میان زبان‌های وبلاگی داده می‌شد کما این که در یکی از نوشته‌های قبلیم به سقوط زبان پارسی در میان زبان‌های رایج در اینترنت اشاره کرده بودم.
باید بپذیرم که ما پارسی‌زبانان جزیره‌ای دور افتاده و ایزوله در میان اینترنت هستم. قوانین مخصوص به خودمان را داریم و در اغلب موارد نسخه خاص و واکنش‌های ویژه خودمان را در قبال کنش‌ها و اتفاقات پیرامون خود نشان می‌دهیم که بعضاً متفاوت از سایرین است. تنها نقطه ارتباطی ما با دنیای بیرون معدود وبلاگ‌هایی هستند که تعداد بیشترشان را ایرانیان خارج از کشور تشکیل می‌دهند و طبیعی است که روایت خودشان را از اتفاقات بیوسفر ایرانی دارند و درصد اعظم بلاگرهای ایرانی و داخل کشور محتوای خود را کمتر به زبان‌های رایج تولید می‌کنند. این مشکل دلایل متعددی دارد. یکی از این دلایل که در خور تأمل بسیاری است، عدم آشنای نسلی از وبلاگ‌نوسان با زبان انگلیسی یا سایر زبان‌های رایج در دنیا است. این نسل، نسل دهه چهل و پنجاه است. نسلی که در زمان جنگ رشد و نمو کرده است و بدیهی است که در زمان رشد، ملزومات و دغدغه‌های بزرگ‌تری داشته به جای این که به تقویت زبان خود بپردازد و نه خود بلکه خانواده‌اش هم نتوانسته‌اند در آن زمان مقدمه رشد زبانی او را فراهم آورند. اما نسلی که هم‌اکنون به وبلاگ روی آورده، با این محدودیت‌ها رو به رو نیست. بیشتر زبان می‌داند و اگر بخواهد روان‌تر می‌نویسد. پس شاید بهتر باشد منتظر بمانیم تا این گروه تولید محتوا را جدی‌تر بگیرند.
هم اکنون برای پر شدن این خلاء به شدت نیاز مترجم‌های آنلاین و روبوت‌های خودکار ترجمه‌گر حس می‌شود. برنامه‌هایی که به طور خودکار محتوای یک زبان را به زبان مقصد ترجمه می‌کنند و طیف وسیع‌تری از بازدیدکنندگان را برای یک محتوا فراهم می‌سازند. در صورت به انجام رسیدن چنین پروژه‌هایی بلاگرهای پارسی‌نویس می‌توانند مخاطبانی به زبان‌های دیگر داشته باشند چرا که نوشته‌هایشان با کلیک روی یک لینک خود به خود به زبان‌هایی چون انگلیسی، فرانسوی، آلمانی، پرتغالی، چینی و ژاپنی ترجمه می‌شود. در خبرها آمده است که گوگل در حال تولید مترجمی برای ترجمه زبان پارسی به سایر زبان‌ها و در درجه اول انگلیسی است. پروژه‌ای که هنوز ناقص است و فعلاً می‌تواند پارسی را به پنگلیش و تعدادی از کلمات را به انگلیسی ترجمه کند. هنوز راه درازی تا یک مترجم آنلاین کاربردی در پیش است. با کمی دقت می‌توانیم مشکلات در پیش راه این مترجم‌ها را ببینیم. مترجم آنلاین برای ارائه یک ترجمه درست از زبان پارسی باید با مشکلات زیاد و متعددی دست و پنجه نرم کند. یکی از این مشکلات تفاوت نگارشی در زبان پارسی است. مشکلی که در نگارش زبان‌های دیگر به علت وجود فاصله میان حروف کلمات وجود ندارد. در زبان‌های دیگر هر کلمه از حروف مجزا تشکیل شده است در حالی که نگارش در زبان پارسی به علت وجود فاصله‌ها، نیم‌فاصله‌ها، پسوندهایی مانند «تر، ترین، ها و…»، ک پارسی و ک عربی ی آخر پارسی و ی آخر عربی و قوانین دیگر نگارشی مترجم‌ها برای تشخص کلمات پارسی نیاز به الگوریتمی به مراتب پیشرفته‌تر و پیچیده‌تر دارند. ضمن این که نباید از نظر دور داشت این نکته را که زبان حجم اعظم محتوای پارسی که وبلاگ‌ها باشند، نثر شکسته است و ترجمه این متون نیز دردسری مضاعف برای زبان پارسی است. مسلما‍ً متخصصان هوش مصنوعی می‌توانند در این زمینه توضیحاتی مفصل و علمی بنویسند.
به نظر من از هم اکنون باید به فکر باشیم. شاید لازم باشد حداقل این نکته را به بحث بگذاریم. به نظر من لازم است که بدانیم که آیا باید شیوه‌ای مناسب را برای نوشتن انتخاب کنیم یا این که تمام بار را بر دوش مترجم منتقل کنیم. مترجمی که هنوز طفل شیرخواره‌ای است که ناتوان است. بیندیشیم، بنویسیم و بحث کنیم. شاد نتیجه‌ای حاصل شد.

ادامه

جایگزینی الفبای پارسی با لاتین

مقاله های مربوط به جایگزینی الفبای پارسی با لاتین در سایت گویا رو خوندید؟ ۱ و ۲
به نظر من الفبای پیشنهادی نویسنده محترم عملاً امکان اجرایی نداره. بحثی رو که ایشون درباره کاستی‌های خط و الفبای موجود بیان کردند در بسیاری از موارد درسته اما به اعتقاد بنده اجرای اون به این شیوه که ایشون گفتند حاصلی جز نابودی خط و الفبای فارسی که در حال حاضر یکی از معدود هنرهای زنده ایران محسوب می‌شه، نخواهد داشت. من به عنوان یکی از کسانی که با کامپیوتر سر و کار زیادی دارم، بارها به دلایل عدیده‌ای مانند چسبیدگی حروف پارسی و مشکلاتی از این قبیل به نقاط ضعف اون پی بردم و با مشکلاتش دست به گریبان شدم اما باید به این توجه داشته باشیم که خط پارسی برای ما ایرانیان صرفاً مجموعه‌ای از خطوط برای مکتوب کردن سخن‌هامون نیست بلکه باید به جنبه هنری اون هم که مسلماً یکی از جنبه‌های اصلیشه توجه کنیم. خط ایرانی دارای دو هویته. یکی هویت خط بودن اون که وظیفه انتقال مطالب رو بر عهده داره و دیگری هویت هنری اون که وظیفه مهمی در انتقال مفهوم مطلب و حتی ذات و روحیه نویسنده اون مطالب رو داره.
به نظر من پیشنهاد نویسنده محترم این مقاله تنها از یه نظر قابل تعمقه و اون هم استاندارد کردن خط به اصطلاح پینگلیش که برای ما گریزی از اون وجود نداره. بعلت رشد روز افزون اینترنت و ارتباطات ما ناگزیریم که از رسم‌الخط پینگلیش استفاده کنیم پس بهتره که حداقل اون رو به صورت استاندارد و واحد استفاده کنیم. اما به نظر من هرگونه تعرض به الفبای فارسی ضربه جبران‌ناپذیری به هنر پارسی‌نویسی و زبان پارسی خواهد بود.