ترجمه ماشینی – بخش سوم

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

در سال 1372، در آزمايشگاه پردازش زبان طبيعي داشنگاه صنعتي شريف، مهرنوش شمس فرد ( 1373 ) سامانه اي به نام دنا طراحي و پياده نمود. در اين سامانه با به كارگيري نظريه وابستگي مفهومي شنك ( 1975 )، جمله هاي فارسي به شبكه اي از مفهوم ها و روابط ميان آنها تبديل مي شوند.
پس از آن پروژه های متعدد دیگری در حیطه¬ی زبان فارسی در موضوعات ذیل به انجام رسیدند:
پردازش نحوی جمله ها از جمله گروه های اسمی و جمله های مرکب، طراحی و پیاده سازي بخش واژگان و نيز اركان ساختواژي، تقویت بخش استنتاج گر پروژه دنا، بررسي شيوه هاي بازنمايي معنا و انتخاب يك شيوه مناسب براي سامانه دنا 2 و پروژه های دیگری که بر روی واكافت واژه اي، واكافت ساختواژي، واكافت نحوي و واكافت معنايي متمرکز شده بودند.
در يك تحقيق ديگر نیز ماشيني كردن عمل ترجمه از يك زبان محاوره اي به زبان محاوره اي ديگر با قابلیت يادگيري ماشين به صورت خودکار مورد بررسی قرار گرفت. از آنجا كه در اين روش ترجمه، براي طراحي الگوريتم هاي ارائه شده جهت ايجاد پايگاه دانش و استنتاج دانش از آن از هيچ گونه اطلاعات پيش فرضي در زمينه چگونگي ساختار جملات زبان هاي مبدا و مقصد و نقش كلمات در جمله استفاده نشده است، مترجم حاضر مستقل از زبان هاي مبدا و مقصد، توانايي انجام عمل ترجمه از هر زبان به زبان ديگر را دارد. [7] در حال حاضر دكتر عبدالحسن صراف زاده (رئيس دانشكده كامپيوتر و فناوري اطلاعات دانشگاه يونيتك نيوزيلند) با بهره گیری از روشهای آماری، چندین سال است که بحث ترجمه ماشینی را در دانشگاه خود همراه با یک تیم تحقیقاتی دنبال می نمایند و به نتایج تقریبا قابل قبول و رضایت بخشی نیز نائل گردیده اند. موفقیت اصلی گروهی پژوهشی- تحقیقاتی ایشان بیشتر در بخش ترجمه ماشینی انگلیسی به فارسی بوده است چرا که پیکره بسیار عظیمی را مشتمل بر 13 میلیون جمله در بخش پیکره تک زبانه خود به زبان فارسی یعنی در بخش نهایی (Persian monolingual corpuse) دارا می باشند و این امر باعث کسب نتایج بهتر آنان نسبت به ترجمه های گوگل میگردد. این در حالیست که گوگل دقیقا وضعیتی عکس این حالت دارد و متقابلا در ترجمه فارسی به انگلیسی بسیار قوی عمل می نماید. در حال حاضر در بخش (English-Persian parallel corpuse) تنها یک میلیون جمله وجود دارد که توسط نرم افزار Microsoft Aligner جمله به جمله و نظیر به نظیر align میشوند و افزایش هر چه بیشتر این پیکره نیز هر چند کاری دشوار و زمانبر است، باعث افزایش دقت ترجمه ماشینی ما خواهد شد. [8] لذا مجددا روش ترجمه ماشینی با بهره گیری از روشهای آماری به طور کامل تشریح می گردد:
ترجمه ی ماشینی آماری یکی از راه‌های ترجمه ی ماشینی است که در آن فرآیند ترجمه با مدل‌های آماری انجام می‌شود. این مدل‌های آماری با کمک آنالیز عبارات متنی دوزبانه است. روش آماری با روش ترجمه بر پایه دستور و ترجمه بر پایه نمونه در تضاد است. نخستین ایده ی ترجمه ی ماشینی آماری را وارن ویور در سال 1949 ارائه کرد که در آن نظریه اطلاعات کلود شانون را به کار بست. در سال 1991 این ایده توسط پژوهشگران ای بی ام در مرکز پژوهشی جی واتسون بازتعریف شد و سبب محبوبیت ترجمه ماشینی در سال‌های اخیر شده است. امروزه این روش بهترین و گسترده‌ترین روش ترجمه ی ماشینی است.
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکره‌های متنی دوزبانی استفاده می کنند. همانند پیکره کانادایی هانسارد (Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آی‌بی‌ام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر 2007 به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیله دادن 200 میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمه‌ها بهبود یافته است.[9] اصول
ایده ترجمه ماشینی از نظریه اطلاعات سر برآورده است. سند (متن خواهان ترجمه) بر پایه احتمال(p(e|f ترجمه می‌شود که رشته ی e در زبان بومی (برای نمونه انگلیسی) ترجمه ی رشته ی f در زبان بیگانه (برای نمونه فرانسوی) است. معمولا، این احتمالات با استفاده از تکنیک‌های برآورد پارامتر برآورد می‌شوند.
مزیت‌ها
مهمترین مزیت‌های ترجمه ی ماشینی آماری در برابر روش‌های سنتی عبارتند از:
 بهره‌گیری بهتر از منابع
 حجم بسیاری از قالب ماشین خوان که در زبان طبیعی گفته می‌شود وجود دارد.
 معمولاً سامانه‌های ترجمه آماری مختص جفت زبان خاصی نیستند و بر هر جفت زبانی سازگارند.
 سامانه‌های ترجمه بر پایه دستور نیازمند توسعه دستی دستورهای زبان‌شناسی است که می‌تواند پرهزینه باشد و اغلب بر دیگر زبان‌ها سازگار نیست.
 ترجمه طبیعی‌تر (روان‌تر و نزدیک‌تر به گفتار)
موانع و مشکلات ترجمه ماشيني در زبان فارسي
مشکلات زبان فارسی که باعث ابهام در این زمینه ترجمه ماشینی می شود به ۳ دسته تقسیم می شود. ۱-مشکلات رسم الخط فارسی: چون زبان فارسی از رسم الخط عربی استفاده می کند دارای مشکلاتی فراوان از جمله نداشتن حرکت یا آوای کوتاه(a,e,o) می باشد. همچنین رسم الخط فارسی به دلیل چسبیده بودن حروف به سختی قابل پارس کردن است. ۲- مشکلات نحوی زبان فارسی: نظیر مشکلات افعال و… ۳- استثناها: نظیر اصطلاحات و light verb و ….
در حقیقت در همة ترجمه‌ها ـ چه وقتی که از فارسی به انگلیسی و چه وقتي كه از انگلیسی به فارسی صورت می‎گیرند ـ مشکلات وجود دارند. مثلاً اغلب می‎گویند تسلط به زبان مبداء و مقصد و موضوع ترجمه برای ترجمه کفایت می‎کند. به عبارتی ديگر تسلط زبانی کافی است. در حالي كه اينگونه نيست و شرايط ديگري مورد نياز هستند، شما باید تسلط فرهنگی و اجتماعی هم در كنار آن تسلط زباني داشته‌ باشيد. بنابراين مشکلات زبانی در همه جا خودشان را نشان می‎دهند. در انتخاب واژگان و معادل‎سازی نیز ما با مشکلات متعددی روبرو هستیم. اما اینکه این مشکلات و بعضاً ضعفها محسوس یا نامحسوس هستند، یک سخن دیگر است و در این باره هم نگرشهای مختلفی وجود دارند. وقتی که شما از انگلیسی به فارسی ترجمه می کنید یک گرته‎برداری به صورت بسیار رایج و انتقال ساختهای نحوی نارایج به زبان فارسی صورت می گیرد. بنابراین لازم است در ابتدا با اجزای اصلی مورد نیاز در تجزیه و تحلیل جملات برای ترجمه ماشینی آشنا شویم.
همان طور كه در بالا توضيح داده شد،‌ مهمترين بخش يك سامانه مترجم ماشيني، تشخيص نقش كلمات در جمله و تشخيص معناي صحيح آنها با توجه به متني است كه آن كلمه در آن قرار گرفته است. براي تشخيص معنا ي صحيح كلمات از سه روش مي توان استفاده نمود: در روش اول براي آموزش سامانه به يك مجموعه كلمات فارسي ابهام زدايي شده نياز مي باشد تا از روي آن بتوان عمل رفع ابهام براي كلمات جديد را در متن هاي مختلف انجام داد كه متأسفانه هنوز اين مجموعه به صورت يك فرهنگ فارسي قابل خواندن براي ماشين تهيه و تدوين نگرديده است. يعني اين اطلاعات به صورت دستي وجود دارند، اما نسخه رايانه اي از آنها با يك استاندارد معين براي تعريف هر كلمه و معني و نقش هاي مختلف آن وجود ندارد. بديهي است براي اين كار ابتدا با يد با يك مركز زبان شناسي معتبر، استاندارد ذخيره سازي اطلاعات و انواع آن را تدوين نمايد و سپس نسخه اي رايانه اي از اين اطلاعات جهت استفاده هاي بعدي تهيه شود.

در روش دوم نيز سامانه مستقيما از يك فرهنگ لغت استفاده مي كند، باز هم در مورد زبان فارسي اين مشكل وجود دارد كه هنوز فرهنگ هاي لغت فارسي رايانه اي با يك استاندارد مشخص تهيه نشده اند. اين در حالي است كه در زبان انگليسي فرهنگ هاي متعددي مانند net LDOCE, Word يا Roget’s International Thesaurus به صورت MRD يا نسخ قابل خواندن توسط رايانه وجود دارند كه سامانه هاي مختلف مترجم ماشيني از آنها با يكي از روش هاي رفع ابهام مذكور بهره مي جويند.

از روش سوم رفع ابهام نيز همان طور كه ديده شد صرفا براي لغات خاص و محدود فني يا پزشكي استفاده مي شود، نه براي كليه لغات فارسي و چون متأسفانه هنوز استفاده از اصطلاحات فني فارسي متداول و رايج نشده است، اين روش رفع ابهام در زبان فارسي زياد موفق نخواهد بود. از اين رو براي اينكه بتوان از يك مترجم قوي وبدون مشكل فارسي بهره مند شد، ابتدا بايد مقدمات بر شمرده را فراهم نمود و اين خود تلاش گروهي متشكل از زبان شناسان، مترجمان، اديبان و متخصان رايانه را مي طلبد كه سرآغازي خواهد شد براي رسيدن به اين هدف ملي.

آینده ترجمه ماشینی
اکنون بسیاری از صاحب نظران برآ نند که ارائه ترجمه خوب ، تنها با داشتن اشراف کامل به واژگان و قواعد نگارشی زبان های مبدأ و مقصد میسر نمی شود، بلکه نیازمند ادراک انسانی از مفاهیم گوناگونی می باشد که ماشین هرگز قادر به فهم آن نیست و نخواهد بود. از نظر برخی افراد، ماشین های ترجمه شفاهی، نرم افزارهای تبدیل کلام به آدمک های گرافیکی که به زبان اشاره صحبت می کنند و یا موبایل هایی که صحبت های شخص آن طرف خط را به زبان دیگر برمی گردانند شاید فقط در حد سرگرمی جلوه کند؛ لیکن از یاد نبریم که بسیاری از امکانات پیش پا افتاده و کاملا بدیهی زندگی امروزی ما یکصد سال پیش حتی به مخیله دانشمندان نیز راه پیدا نمی کرد.
همان طور که گفته شد منظور از ترجمه متن توسط ماشین ترجمه – به پشتوانه پیشرفت هایی که به ویژه در دهه اخیر در تحقق بخشیدن به این رؤیای پنجاه ساله به دست آمده است- فقط برگردان متن نوشتاری نیست، بلکه ترجمة نوشته به صوت، برگردان نوشته به نمایش گرافیکی زبان اشاره ، ترجمه صوت به صوت و یا ترجمه صوت به متن نیز- چه در داخل یک سیستم زبانی و چه به زبان دیگر- و وظایف دیگری از این دست نیز قرار است به عهده ماشین های مترجم گذاشته شود. به عنوان نمونه می توان به نوعی سیستم تلفن همراه طراحی شده توسط شرکت NEC اشاره کرد که برای ترجمه مکالمات تلفنی ژاپنی به انگلیسی طراحی شده است؛ یا از نرم افزارهایی یاد کرد(digital avatars) که برای کمک به ناشنوایان و یا کم شنوایان طراحی شده و مراحل تکمیلی خود را می گذراند و قرار است بتواند آنچه را که میشنود با استفاده از تصویر آدمکی که با زبان اشاره صحبت می کند، به ناشنواها منتقل نماید.
جمع بندی و نتیجه گیری
فراگيري ترجمه ماشيني عبارت اند از: واكافت واژه اي، واكافت ساختواژي، واكافت نحوي، واكافت معنايي، تشخيص نقش كلمات در جمله، تشخيص معناي صحيح كلمات ( با توجه به جمله حاوي و رفع ابهام از كلمات داراي معني مشابه و يافتن معني معادل كلمه در زبان مقصد و تبديل جمله زبان مبدا به جمله زبان مقصد با توجه به دستور زبان مقصد و در صورت نياز اعمال گشتارهاي مناسب براي تبديل جملات مقصد به شكل روساختي آن ). در اين راستا مهمترين بخش يك مترجم كه دقت در آن باعث بالا رفتن دقت كل عمل ترجمه مي گردد،‌ رفع ابهام معنايي از كلمات جملات زبان مبدا ونيز رفع ابهام از ترجمه آنها به زبان مقصد مي باشد. براي رفع ابهام معنايي كلمات سه روش كلي وجود دارد كه عبارت اند از: ( الف ) رفع ابهام با مربي، (‌ب ) رفع ابهام بر مبناي فرهنگ لغت، و ( ج ) رفع ابهام بدون مربي.
اما مشكل اصلي بر سر راه رفع ابهام از كلمات فارسي اين است كه اگر از دو روش اول استفاده شود، به يك نسخه رايانه اي از مجموعه لغات همراه بانقش هاي مختلفي كه مي توانند به خود بگيرند و معاني مختلفي كه باتوجه به نقش هاي مختلف و يا همنشيني با كلمات مختلف به خود مي گيرند، نياز مي باشد كه متأسفانه اين نسخه رايانه اي و همچنين استاندارد ذخيره سازي اين دسته اطلاعات وجود ندارد كه بايد با كار گروهي متشكل از زبان شناسان، اديبان و متخصصان رايانه ايجاد و جهت سيستم هاي مترجم زبان فارسي صورت بگيرد. استفاده از روش سوم رفع ابهام نيز خاص لغات فني است كه در زبان فارسي هنوز كاملا جا نيفتاده است . بنابراين با توجه به اين كه دقت در رفع ابهام از معناي كلمات، دقت مترجم را بالا مي برد،‌ هنوز نمي توان سامانه هاي مترجم فارسي مناسب را تهيه و از آنها بهره برداري نمود.
پیشنهادات
اولا که بایستی واژگان معنایی (WordNet) بسیار عظیمی در اختیار داشته باشیم و همچنین با توجه به اضافه شدن لغات جدید در گذر زمان به هر زبان بایستی واژگان معنایی ما بروزرسانی شود و دائما گسترش داده شود.
بایستی توجه داشت که اگر حوزه ی موضوعی متن محدود و کنترل شده باشد، کیفیت ترجمه ماشینی اساساً بهتر خواهد شد.
علاوه بر اين‌ وجود خطاهای‌ تايپی و يا املايی‌ و همچنین خطاهای نحوی و نگارشی در متن‌ می‌تواند در کار ترجمه ماشينی‌ ايجاد اختلال‌ كند. مترجمين‌ ورزيده‌ در رويارويی‌ با كلمات‌ ناشناخته‌ يا ساختارهای‌ پيچيده جملات‌، با مراجعه‌ به‌ منابع‌ معتبر و با بکارگيری تجربيات‌ و دانش‌ فردی و يا از طرق ديگر به‌ حل‌ مشكل‌ و مسأله‌ می ‌پردازند. در ترجمه‌ ماشينی نيز بايد در مقابل‌اين‌ گونه‌ پديده‌ها ساز و كار مناسبی طراحی نمود تا سيستم‌ به‌ ابزار‌ خاصی‌ مجهز باشد تا اختلالی در امر ترجمه‌ بوجود نيايد. بنابراین بایستی ابزارهای پیش پردازش و پس پردازش بسیار قدرتمندی طراحی گردد که متن را قبل از ورود به فاز ترجمه و همچنین خروجی نهایی را بهینه سازی و استاندارد نماید.

نام مقاله: انسان مترجم و ترجمة ماشيني: بررسي موردي مشكلات ماشين ترجمة انگليسي به فارسي «پديده»
نام نشريه: فصلنامه كتابداري و اطلاع رساني

شماره نشريه: 26 _ شماره دوم، جلد 7
پديدآور: محمدرضا فلاحتي، آزاده نعمتي

چكيده
هدف از نگارش اين مقاله آن بود تا دست‌كم بخشي از مشكلات ترجمه ماشيني، مشخص و ريشه‌يابي گردد. يافته‌ها حاكي از آن بود كه «پديده» در حال حاضر داراي مشكلات فراواني است كه ريشة آن‌ها را در سه چيز مي‌توان جستجو كرد: 1) نبود زبانشناسان مجرب در گروه برنامه‌نويسان؛ 2) نحوـ‌ محوربودن تئوري زباني؛ 3) نبود قدرت تعقل و تفكر در ماشين‌هاي ترجمه. ضمناً مشخص گرديد كه مشكلات نوع اول را مي‌توان با به‌كارگيري نيروي متخصص رفع نمود. مشكلات نوع دوم با تجديدنظر در تئوري زباني و توجه به معنا قابل رفع است، اما- دست‌كم در شرايط كنوني- نمي‌توان قدرت تعقل و تفكر را به ماشين داد و بنابراين مشكلات مربوط به مورد 3 قابل حل نيستند. با وجود اين، نتيجه‌گيري شد كه براي ترجمة متون اينترنتي و حجم زيادي از اطلاعات، بويژه وقتي هدف درك كليات متن باشد، استفاده از ماشين به جاي انسان هم راحت‌تر است و هم سريع‌تر و معقول‌تر.
كليدواژه‌ها: ماشين ترجمه، ترجمة ماشيني، ترجمة انساني، شيوة ميان زباني در ترجمة ماشيني، شيوة انتقال در ترجمة ماشيني، ماشين ترجمة «پديده»، ترجمة انگليسي‌ـ فارسي
مقدمه
در آغاز اجازه دهيد ديدگاه‌هاي مختلفي را كه دربارة بخش آغازين عنوان اين مقاله وجود دارد، باهم مرور كنيم. در يك نگاه كلي سه ديدگاه مختلف درخصوص عنوان اين مقاله هست: 1) طرفداران نظرية نبود تفاوت بين انسان مترجم و ماشين ترجمه، 2) طرفداران تفوق انسان مترجم بر ماشين ترجمه، و 3) طرفداران تفوق ماشين ترجمه بر انسان مترجم.

برخي از صاحب‌نظران بر اين باورند كه در ترجمه، بين انسان و ماشين تفاوت چنداني وجود ندارد. آنان ضمن اقرار به مشكلات موجود در كار ماشين ترجمه و قبول عملكرد ضعيف آن نسبت به عملكرد مترجمان متخصص، اظهار مي‌دارند كه در آينده ماشين ترجمه از عملكردي بهتر برخوردار خواهد شد و در توجيه ادعاي خود مي‌گويند كه در شرايط فعلي، رايانه‌ها در انجام امور محاسباتي و رياضيات، نسبت به انسان از سرعت عمل بيشتري برخوردارند و به بيان ديگر انسان ابداً در اين زمينه‌‍‌ها قادر نيست با ماشين رقابت كند. مثلاً تصور كنيد كه بخواهيم دو عدد 12394765 و 8945630 را در هم ضرب، حاصل را از 443954 كسر و نتيجه را بر 12459 تقسيم كنيم. مسلماً حتي با استفاده از كاغذ، انجام چنين كاري براي انسان چندين دقيقه به‌طول خواهد انجاميد، درحالي كه تمام اين محاسبات را يك ماشين حساب ساده مي‌تواند با دقت لازم و تنها در چند ثانيه به انجام برساند. اين گروه از محققان، يادگيري رياضيات را دشوارتر از يادگيري زبان مي‌دانند و بر اين نكته تأكيد مي‌كنند كه در آينده‌اي نزديك، رايانة جديدي را خلق خواهند نمود كه در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتي چون انسان برخوردار باشد.

طرفداران تفوق انسان مترجم بر ماشين ترجمه بر اين باورند كه چون عملكرد ذهن انسان با ماشين متفاوت است و ماشين از قدرت تصميم‌گيري و انتخابي كه انسان دارد، برخوردار نيست، هيچ‌گاه نخواهد توانست بهتر از انسان يا حتي مانند انسان به ترجمه و امور مربوط به آن بپردازد.

طرفداران تفوق ماشين ترجمه بر انسان مترجم نيز بر اين باورند كه مشكلات ماشين ترجمه سال‌ها پيش مرتفع‌شده و هم‌اكنون اين‌گونه ماشين‌ها در ترجمة متون مختلف ـ يا دست‌كم انواعي از آن ـ با مشكلي مواجه نيستند و در آينده‌اي نزديك خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.

در اين مقاله و با ارائة مثال‌ها و بحث‌هاي مختلف نشان خواهيم داد كه با توجه به پيشرفت‌هاي به‌دست آمدة كنوني در علوم، ماشين قادر نيست مانند انسان به ترجمه بپردازد. توجه داشته باشيد كه اين گفته بدان معنان نيست كه ماشين قادر به ترجمه نيست، بلكه بر كيفيت پايين‌تر ترجمة ماشيني در مقايسه با ترجمة انساني تأكيد دارد.

حال نگاهي گذرا به تاريخچة كارهاي انجام‌گرفته در خصوص ماشين ترجمه داشته باشيم.

نگاهي كوتاه به تاريخچة ماشين ترجمه
امروزه در كتاب‌ها و مجلات معتبر دنيا مطالب فراواني به چاپ مي‌رسد كه به موضوع ترجمه و ترجمة ماشيني مربوط است. «هاچينز» (Huchins, W.J. 1986) و «مل باي» و «تري» (Melby. Alan & Terry, Varner C., 1995) از جمله افرادي‌اند كه به بررسي تاريخچة ماشين ترجمه پرداخته‌اند. «نيرنبرگ»(Nirenburg, S. 1986) موضوعات روش‌شناختي و نظري مرتبط با ماشين ترجمه را به تفصيل شرح مي‌دهد. «كي»(kay, Martin) و «گربر» (Gerber, Laurie)مي‌كوشند راه‌هايي را ارائه كنند كه باعث بهبود كيفيت ترجمة ماشيني شود. «دور» (Dorr, B.J. 1993) نقش و مشكلات مربوط به واژگان را در ترجمة ماشيني موردبحث و بررسي قرار مي‌دهد، «دري فاس» (Dreyfus, Hubert, 1992) به ناتواني‌هاي رايانه در انجام برخي امور اشاره مي‌كند، و…

كار بر روي ماشين ترجمه همزمان با اختراع رايانه در دهة 1940 آغاز شد. ماشين‌هاي ترجمة اوليه به‌اين‌صورت طراحي شده بودند كه براي ترجمة متون مختلف، مستقماً از يك واژه‌نامة دوزبانه استفاده مي‌كردند. ترجمه نيز تنها به ترجمة واژگاني محدود مي‌شد و از ترجمة ساختار نحوي زبان مبدأ يا مقصد نيز خبري نبود. اين نوع روش ترجمه را مستقيم مي‌ناميدند. با اين همه در دهه 1980 چندين سامانة ترجمه به بازار عرضه شد كه در ترجمه از روش غيرمستقيم استفاده مي‌كردند. علت استفاده از لفظ غيرمستقيم صرفاً بدان علت است كه اين‌گونه ماشين‌ها متن را مستقيماً از زبان مبدأ به زبان مقصد ترجمه نمي‌كنند، بلكه ابتدا متن از زبان مبدأ به يك «ميان‌زبان»[3] و سپس به زبان مقصد ترجمه مي‌شود؛ بنابراين، ترجمه در دو مرحله به انجام مي‌رسد. در اين‌گونه سيستم‌ها برنامه‌هايي تعبيه شده تا به شناسايي ساختار واژه و جمله، و واژه‌ها و عبارات مبهم بپردازند.

روش غيرمستقيم داراي انواعي است كه از آن جمله مي‌توان به دو شيوة «ميان‌زباني» و «انتقال»[4] اشاره كرد. در ادامه به صورت اجمالي به معرفي اين دو روش مي‌پردازيم.

1. روش‌هاي ترجمة ميان‌زباني و انتقال
1ـ1. روش انتقال: متن مبدأ ـ ـ تجزيه ـ ـ ساختار بينابيني متن مبدأ ـ ـ انتقال ـ ـ ساختار بينابيني متن مقصد ـ ـ تركيب ـ ـ متن مقصد

1ـ2. روش ميان‌زباني: متن مبدأ ـ ـ تجزيه ـ ـ ميان‌زبان ـ ـ تركيب ـ ـ متن مقصد

در روش انتقال، ساختار بينابيني معمولاً كار تجزيه و تحليل دستوري متن را برعهده دارد و هربار مي‌تواند تنها يك جمله را بررسي كند. از سويي ديگر، روش ميان‌زباني، متن را بدون توجه به زباني خاص مورد تجزيه و تحليل قرار دهد. مزيت روش ميان‌زباني اين است كه مي‌توان با صرف هزينه‌هاي نسبتاً پايين، زبان‌هاي جديدي را نيز به ماشين ترجمه اضافه كرد. اين كار صرفاً با استفاده از قوانيني تحقق مي‌يابد كه بين زبان جديد و «ميان‌زبان» برقرار است.

اما در ديدگاه انتقال، حيطة كار اين قوانين و قواعد، زبان جديد و ديگر زبان‌هاي موجود در ماشين ترجمه مي‌باشد. در روش انتقال، تنها بين دو زبان مبدأ و مقصد مقايسه به عمل مي‌آيد. در اين مقايسه، واحدهاي واژگاني و ساختارهاي نحوي دو زبان با هم مقايسه مي‌شوند؛ سپس با استفاده از قواعد انطباقي سعي مي‌شود ساختار بينابيني زبان مبدأ به ساختاري مشابه در زبان مقصد تبديل شود (Tusjii, 1990). اين قواعد همراه با ديگر اطلاعات معنايي و …، در لغتنامه‌ها يا پايگاه‌هاي دانش ذخيره مي‌شوند. در شيوة انتقال، عمق و ميزان تجزيه و تحليل از پيش مشخص نيست، بلكه به ميزان قرابت و نزديك‌بودن دو زبان بستگي دارد: هرچه دو زبان به هم نزديك‌تر باشند، از عمق تجزيه و تحليل نيز به همان ميزان كاسته خواهد شد.

اما براي اين كه بتوانيم به ترجمه‌اي كيفي دست يابيم، بايد پا را از تجزيه و تحليل نحوي يا تجزيه و تحليل معنايي سطحي فراتر بگذاريم. براي انجام ترجمة كيفي، سيستم بايد بتواند معناي واقعي جمله را نيز درك كند. مثلاً جملات ساده‌اي چون «دانش‌آموز امتحان داد» و «معلم امتحان گرفت» را در دو زبان فارسي و انگليسي در نظر بگيريد. معادل اين دو جمله در انگليسي بدين قرارند:

The student took the test. The teacher gave the test

ماشين ترجمه بايد بتواند اين‌گونه جملات را نيز به خوبي درك كند و براي درك آن‌ها لازم است كه درباة امتحان‌دادن و امتحان‌گرفتن در انگليسي و فارسي اطلاعاتي داشته باشد. غالباً چنين اطلاعاتي در بخشي از سيستم به نام قالب‌هاي حالت[5] ذخيره مي‌شود. در اين مرحله سيستم ترجمه براي شناسايي عناصر جمله به تجزيه و تحليل معنايي، قواعد انتقال معنايي، و قواعد ديگري نيازمند است. تجزيه‌گر معنايي با استفاده از نمودار نحوي، قالب حالت را توليد مي‌كند و مرحلة انتقال نيز «قالب حالت» استخراج شده از جمله در زبان مبدأ را به «قالب حالت» معادل در زبان مقصد تبديل مي‌كند.

اما در روش «ميان‌زباني» به تجزيه و تحليل مفصل‌تري نيازمنديم. نتيجة اين تجزيه و تحليل يك بازنمود انتزاعي است كه مستقل از زبان مبدأ است. مزيت اين استقلال آن است كه تركيب اجزا و شكل‌گيري جملة معادل در زبان مقصد مي‌تواند بدون شناخت زبان مبدأ صورت پذيرد. بنابراين در اين روش، اطلاعاتي ممكن است به جمله اضافه شود كه به صورت واضح و آشكار در جملة مبدأ وجود ندارد. البته افزودن اطلاعات بويژه اطلاعات معنايي و فرازباني، كاري بس دشوار و وقتگير است. اطلاعات معنايي غالباً در يك «پايگاه دانش» يا «واژه‌نامة مفهومي» ذخيره مي‌شود. «نيرنبرگ» و ديگران (Nirenberg, J., Garbonell, J.c., Tomita, M; &Goodman, K., 1992) بر اين باورند كه از اين نوع اطلاعات معنايي، در سيستم ترجمة «كي‌بي‌ام‌تي ـ 89»[6] و براي رسيدن به بازنمودي ميان‌زباني كه عاري از ابهام نيز باشد استفاده شده است. براي رسيدن به اين بازنمود ميان‌زباني، بايد از چند مرحله گذشت: «كي‌بي‌ام‌تي ـ 89» ابتدا و با استفاده از يك دستور نقش‌گراي واژگاني، تجزيه و تحليل نحوي را آغاز مي‌كند، سپس با استفاده از يك لغتنامة مفهومي، مدخل‌هاي واژگاني را به معادل‌هاي ميان‌زباني‌شان ترجمه مي‌كند. در مرحلة بعد، پس از اعمال تغييرات ساختاري، ساختارهاي ميان‌زباني حاصل مي‌شوند و در پايان با تركيب اجزا، بازسازي جمله در زبان مقصد محقق مي‌شود.

همان‌گونه كه پيشتر ذكر شد در روش ميان‌زباني، افزودن زبان جديد به ماشين ترجمه بسيار راحت‌تر از روش انتقال است. با اين همه، تاكنون هيچ سيستم ميان‌زباني مطلوبي به بازار عرضه نشده و تمامي سيستم‌هاي ترجمة ماشيني ميان‌زباني كه تاكنون طراحي شده‌اند، مراحل آزمايشي خود را سپري مي‌كنند و از اين رو حيطة كار آن‌ها از چند صد واژه يا چندهزار پيش‌نمونه، فراتر نمي‌رود. هرچند تحقيقات انجام گرفته در خصوص ميان‌زبان اندك نبوده، اما هنوز روش مشخصي ارائه نشده تا با استفاده از آن بتوان به يك بازنمود معنايي مستقل از زبان دست يافت. البته، درخصوص امكان دست‌يابي به چنين بازنمودي نيز شك و ترديد بسيار وجود دارد (Whorf, B.L., 1956; Nirenbuerg, S.et al., 1992; Hovy, E.H. & Nirenburg, J., 1992).

در سيستم‌هاي علمي، از روش انتقال بيشتر استفاده مي‌شود، چون هم ساده‌تر است و هم نيازي به ميان‌زبان ندارد. همين امر سبب گرديده تا اين روش در مقايسه با روش ميان‌زباني از كارآيي بيشتري برخوردار باشد. به تازگي سعي شده با تلفيق روش‌ها و ديدگاه‌هاي مختلف موجود، سيستمي واحد و چندموتوره ارائه گردد. به نظر مي‌رسد انجام اين كار بسيار ساده باشد: جملات موردنظر براي ترجمه به چندين موتور ترجمة موازي فرستاده مي‌شوند و در پايان، بروندادهاي موتورهاي مختلف با هم تركيب مي‌گردند و درنهايت، بهترين و مناسب‌ترين بخش‌ها انتخاب، و سپس در قالب جملات زبان مقصد، بازسازي و بازنويسي مي‌شوند.

امروزه تقريباً تمام ماشين‌هاي ترجمه از يكي از سه روش گفته شده ـ مستقيم، غيرمستقيم (ميان‌زباني) يا انتقال ـ استفاده مي‌كنند. مثلاً در ماشين‌هاي ترجمه «آريان»[7] و «يوروترا»[8] كه توسط كميسيون مجامع اروپايي» طراحي شده‌اند از روش انتقال استفاده شده است. در اواخر دهه 1980 در ژاپن براي زبان‌هاي آسيايي ماشين ترجمه‌اي ساخته شد كه از روش ميان‌زباني استفاده مي‌كرد، اما اين پروژه با شكست مواجه شد و شايد دليل عمدة اين شكست را بتوان ساختار خاص و پيچيدگي‌هاي نوشتاري زبان‌هايي چون ژاپني، چيني، و… دانست.

تا دهه 1990 چنين تصور مي‌شد كه ماشين‌هاي ترجمه بايد در نهايت جايگزين انسان مترجم شوند و ترجمه‌هايي را توليد كنند كه از قابليت چاپ برخوردار باشند، اما چنين تصوري هم‌اكنون دچار تغيير و تحول شده است. امروزه ديگر هدف اصلي از ساخت ماشين‌هاي ترجمه، جايگزيني آن‌ها به‌جاي انسان مترجم نيست، بلكه رسيدن به ترجمه‌هاي ارزان‌تر و سريعتر (آن‌هم در حجم بسيار زياد)، هدف نهايي اين‌گونه ماشين‌ها است.

در بخش بعدي به بررسي يكي از ماشين‌هاي ترجمة انگليسي به فارسي خواهيم پرداخت كه مدعي است در ترجمه، واحد «جمله» را مدنظر قرار مي‌دهد و بنابراين از بسياري از مشكلات ترجمة واژه‌به‌واژه به‌دور است.

ماشين ترجمه «پديده»
ماشين‌هاي ترجمه‌اي كه در بخش پيشين اين مقاله دربارة آن‌ها صحبت كرديم، قادر نبودند متون انگليسي را به فارسي ترجمه كنند، اما ماشين ترجمه «پديده» از چنين قابليتي برخوردار است. اين ماشين ترجمه مدعي است كه قادر است جملات را به‌گونه‌اي مطلوب ترجمه نمايد. علاوه بر تايپ جملات يا متون موردنظر، مي‌توان فايلي را كه به فرمت «پي‌دي‌اف» يا متن[9] باشد به ماشين داد و منتظر پاسخ ماند. اين ماشين ترجمه ضمن بهره‌گيري از آخرين دستاوردهاي هوش مصنوعي، قادر است 400 صفحه را تنها در يك دقيقه ترجمه كند.

«پديده» در بانك اطلاعاتي خود براي واژه‌ها و عبارات، 000,500,1 مدخل دارد. هر مدخل معناي فارسي واژه، مفاهيم دستوري و چند عنصر ديگر را شامل مي‌گردد. براي ترجمة يك جمله، اين ماشين نخست آن را به واژه‌هاي تشكيل‌دهنده، عبارات و نمادها تقسيم و سپس نتايج به‌دست آمده را به واحدهاي دستوري، واژگاني و واژه‌سازي ارسال مي‌كند؛ سپس نتايج حاصله به يك موتور برونداد فرستاده مي‌شوند. اين موتور نهايي، مسئول توليد و ارائة ترجمة فارسي است.

سازندگان اين ماشين مي‌گويند در آينده‌اي نزديك «پديده» خواهد توانست متون مختلف را از فارسي به انگليسي يا از زبان‌هاي ديگر به فارسي برگرداند.

عملكرد ماشين ترجمه «پديده»
براي پي‌بردن به چگونگي عملكرد اين ماشين ترجمه، محققان 18 نوع مختلف از جملات انگليسي را به عنوان نمونه وارد ماشين كردند و سپس به بررسي ترجمه‌هاي فارسي توليدشده پرداختند.

در ادامه به بررسي گروه‌هاي هجده‌گانة جملات انگليسي و ترجمه‌هاي حاصله مي‌پردازيم.

گروه 1. جملات ساده: جملات 1 تا 5 همگي جملات ساده‌اند. اين جملات را ساده مي‌ناميم چون در ساختارشان، اصطلاح ضرب‌المثل، استعاره، و … وجود ندارد و در ضمن داراي ساختار دستوري پيچيده‌اي نيستند، تنها داراي يك فعل‌اند، و…

من به سينما اين آخر هفته خواهم‌رفت.
1. I will go to the cinema this weekend.

او چه مژه‌هاي بلندي را دارد!
2. What long eyelashes she has!

من به خدا ايمان دارم.
3. I believe in God.

او روي ميز رفت.
4. He went on the table.

پدرش چه سني است؟
5. How old is his father

با نگاهي به جملات انگليسي 1 تا 5 و ترجمه‌هاي فارسي توليدشده به نتايج زير مي‌رسيم: ترجمة جمله 1 كاملاً قابل‌فهم است، با اين همه ترتيب اجزاي جمله درست نيست. معمولاً در زبان فارسي قيد زمان را در آغاز جمله مي‌آورند و بنابراين بيشتر سخنوران فارسي به‌جاي «من به سينما اين آخر هفته خواهم رفت» مي‌گويند «من اين آخر هفته به سينما خواهم رفت» يا در گونه‌هاي محاوره‌اي «اين آخر هفته مي‌رم سينما». ترجمة ارائه‌شده براي جمله 2 نيز كاملاً قابل درك است. اشكال اين ترجمه وجود حرف «را» پس از واژه «بلندي» است كه بايد آن را حذف نمود (او چه مژه‌هاي بلندي دارد!). جملات 3و4 از نظر معنايي و دستوري كاملاً درست‌اند و نياز به هيچ تغيير يا اصلاحي نيست. جمله 5 نيز كاملاً قابل درك و دستوري است؛ با اين همه، ساختار به‌كار گرفته‌شده در ترجمه، ساختاري كاملاً رايج به شمار نمي‌رود. معمولاً به‌جاي «پدرش چه سني است؟» مي‌گوييم «پدرش چند ساله است» يا درگونه‌هاي محاوره‌اي «پدرش چند سالشه؟».

نگاهي دوباره به ترجمه‌هاي ارائه‌شده براي جملات 1 تا 5 نشان مي‌دهد كه اين ماشين قادر است جملات ساده را با موفقيت ترجمه كند و اشكالات موجود، بيشتر اشكالاتي ساختاري‌اند و نه معنايي و بنابراين در امر ارتباط خللي ايجاد نمي‌كنند.

گروه 2. اصطلاحات، ضرب‌المثل‌ها، و…: هريك از جملات 6 تا 13 در ساختار خود داراي نوعي اصطلاح، ضرب‌المثل، يا ساختاري مشابه‌اند. براي رسيدن به معناي درست اين‌گونه جملات، انسان مترجم بايد از پيش با چگونگي كاربرد آن‌ها آشنايي داشته باشد، چون معناي چنين جملاتي را نمي‌توان از جمع عددي معاني واژه‌هاي تشكيل‌دهندة آن‌ها مشخص كرد. مثلاً در جمله 12 منظور نويسنده اين نبوده كه فردي دماغ بزرگ دارد، چرا كه در آن صورت بايست از فعل has استفاده مي‌كرد، بلكه منظور او اين بوده كه بگويد «او فرد بسيار مهمي است» يا «از آن كله‌گنده‌ها است».

من به ستون فقرات را خسته بودم.
6. I was tired to the backbone.

پهناي اجازه دادن به پاهايمان.
7. Let’s stretch our legs.

او يك پتوي خيس است.
8. He is wet blanket.

او اين روزهاي بدهكار است.
9. He is in the red These days.

او به سطل لگد زد.
10. He kicked the bucket.

در حال بازي tennis فنجان چايي‌ام است.
11. Playing tennis is my cup of tea.

او يك دماغ بزرگ است.
12. He is a big nose.

او جيم شد.
13. He took French leave.

در اين گروه، ترجمه‌هاي ارائه‌شده براي جملات 6، 7 و 11 كاملاً بي‌معنا و غيردستوري‌اند. ترجمه درست و البته پيشنهادي اين سه جمله به ترتيب عبارت‌اند از:

6. كاملا ًخسته بودم.

7. بياييد كمي خستگي در كنيم يا كمي راه برويم.

11. تنيس ورزش مورد علاقه‌ام است.

«پديده» در ترجمه‌اي كه براي جمله 11 ارائه داده واژه tennis را ترجمه نكرده (كه دليل آن مي‌تواند نبود معادل فارسي براي اين واژه در واژگان ماشين ترجمه باشد). ضمناً نتوانسته اسم مصدر بودن playing را تشخيص دهد. از اين‌رو، آن را به اشتباه فعل استمراري درنظر گرفته. علت بروز چنين اشكالي را بايد در نقص برنامه‌هاي دستوري تعريف شده براي ماشين جستجو كرد.

جملات8 ، 10 و 12 همگي دستوري‌اند، اما منظور اصلي گوينده يا نويسنده را نمي‌رسانند. جملات كاملاً تحت‌اللفظي ترجمه شده‌اند. به بيان ديگر، «پديده» به معناي اصطلاحي اين‌گونه جملات توجهي نكرده است. ترجمة پيشنهادي سه جملة بالا به قرار زير هستند:

8 . هميشه آية يأس مي‌خواند/ هميشه ضدحال مي‌زند.

10. او به درك واصل شد/ سقط شده.

12. او فرد مهمي است/ از آن كله‌گنده‌ها است.

جملات 9 و 13 به درستي ترجمه شده‌اند، هرچند در جملة 9 «ي» بايد از آخر «روزها» حذف گردد (او اين روزها بدهكار است).

بررسي ترجمه‌هاي ارائه‌شده در گروه 2 نشان مي‌دهد كه «پديده» در ترجمة تركيبات اصطلاحي داري اشكال است، چرا كه به‌جاي معناي اصطلاحي، جز در جملة 13 به معناي تحت‌اللفظي واژه‌ها توجه مي‌كند.

گروه 3. one: مي‌دانيم كه ضمير جانشين اسم مي‌شود. معمولاً در نوشتار يا گفتار براي جلوگيري از تكرار يك اسم، مي‌توان از ضمير مناسب استفاده كرد. در انگليسي، يكي از موارد كاربرد one آن است كه جلوي تكرار اسم را مي‌گيرد، مانند جملة 14. ضمناً one مي‌تواند نقش ضمير نامشخص را نيز بازي كند. مثلاً در جملة 15، one را مي‌توان «آدم» ترجمه كرد (كه ممكن است به هر فردي اشاره داشته باشد). ترجمه‌هاي ارائه‌شده توسط ماشين براي اين دو جمله عبارت‌اند از:

قدم اول مشكل‌ترين يك است.
14. The first step is the most difficult one.

يك با دقت هميشه بايد باشد.
15. One should always be careful

در اين مورد نيز مي‌بينيم كه «پديده»،one را به‌صورت تحت‌اللفظي ترجمه كرده و نتوانسته كاربرد اين واژه را در دو جمله تميز دهد. براي اين دو جمله ترجمه‌هاي زير پيشنهاد مي‌شوند:

14. قدم اول مشكل‌ترين قدم است.

15. آدم هميشه بايد مواظب باشد.

One در جملة 14 به «قدم» و در جملة 15 به «تمام انسان‌ها» اشاره دارد.

گروه 4. علائم اختصاري و اختصارات: جملات 16 و17 هر دو داراي علائم اختصاري‌اند (U.S. در جملة 16 و US در جملة 17). «پديده» توانسته جملة 16 را به درستي ترجمه كند، ولي در ترجمة جملة 17 ناموفق بوده.

حكومت آمريكا
16. The U.S. government

محرك غيرشرطي حكومت
17. The US government

در اينجا املاي كلمات نقش مهمي را ايفا مي‌كند. از نظر «پديده» «.U.S»، وقتي پس از هر حرف بزرگ نقطه‌اي وجود داشته باشد، به معناي آمريكا است، ولي «US» بدون نقطه به معناي «محرك غيرشرطي» (Unstimulated) است كه به حوزة روانشناسي مربوط مي‌شود. بنابراين در واردكردن اطلاعات به ماشين و رعايت املاي درست كلمات بايد دقت كنيم، چرا كه برخلاف انسان، ماشين قادر نيست خطاهاي املايي كلمات را تشخيص دهد. ضمناً ماشين به بافت و متن حساس نيست و از اين‌رو متوجه نمي‌شود كه «محرك غيرشرطي»، آن هم در جمله‌اي كه به اخبار يا سياست مربوط مي‌شود، ترجمة درستي براي «US» نيست. ضمناً ماشين بين «US» كه با حروف بزرگ نوشته شده و «us» (ضمير مفعولي «We» تمايز قائل‌شده، و به همين دليل به‌جاي «محرك غيرشرطي» از ضمير «ما» استفاده نكرده است.

گروه 5. اسم مصدر و مصدر با to از فعل: دو جملة 18 و 19 هر دو دستوري‌اند، اما از نظر معنايي تنها جملة 18 درست است.

او به ياد آورد در را قفل كند.
18. He remembered to lock the door.

او در قفل‌شدني را به ياد آورد.
19. He remembered locking the door

جمله 18 بدين معنا است كه فرد، قبلاً در را قفل نكرده بوده، پس رفت ودر را قفل كرد. اما معناي جملة 19 آن است كه او قبلاً در را قفل كرده بوده و قفل‌كردن در را به‌خاطر آورده است. در جملة 19 ماشين نتوانسته تحليل نحوي درستي از جمله ارائه دهد. ماشين عبارت «locking the door» را با «the locking door» كه يك گروه اسمي است يكي فرض كرده و چون اين گروه اسمي پس از فعل آمده، آن را مفعول مستقيم دانسته. پس، از نظر ماشين «locking» صفت است و نه صورت «ing»دار فعل «lock». ترجمة درست جملة 19 از اين قرار است:

او به ياد آورد كه در را قفل كرده بود.

گروه 6. ضماير: جملات 20 و 21، هر دو دستوري و بامعنايند. اين بدان معنا است كه «پديده» مي‌تواند بدرستي بين انواع مختلف ضماير، از جمله ضماير مفعولي و انعكاسي تمايز قائل شود.

او او را شست.
20. He washed him.

او خودش را شست.
.21. He washed himself

هرچند ترجمة ارائه‌شده توسط «پديده» براي جملة 20 درست است، با ترجمة ارائه‌شده توسط انسان مترجم يكي نيست؛ به‌اين معنا كه مترجمان غالباً به جاي آن‌كه ضمير «او» را دوبار پشت سرهم بياورند، به جاي يكي از ضميرها از طريق جستجوي در متن، اسم مناسب را جايگزين مي‌كنند ـ مثلاً «علي او را شست» يا «او علي را شست». بنابراين مي‌توان گفت كه ماشين ترجمه قادر نيست از امكانات متن استفاده كند، يا به بيان ديگر، از حد جمله فراتر رود.

گروه 7. واژه‌هاي هم‌آوا ـ هم‌نوشت: واژه‌هاي هم‌آوا ـ هم‌نوشت واژه‌هايي‌اند كه داراي تلفظ و صورت نوشتاري يكساني مي‌باشند، مثل «شانه» كه به وسيله‌اي براي مرتب‌كردن مو، عضوي از بدن، شانة تخم‌مرغ، قسمت خاكي جاده، و… اشاره مي‌كند. بديهي است بين معاني مختلف واژة هم‌آوا ـ هم‌نوشت ارتباطي وجود ندارد.

بانك يك رودخانه.
22. The Bank of a river.

براي پي‌بردن به معناي موردنظر از واژة هم‌آوا ـ هم‌نوشت، توجه به متن و بافت ضروري است. ترجمة ارائه‌شده براي جملة 22 نادرست است، چون «پديده» قادر نيست از حد جمله فراتر رود. همين امر سبب شده تا به جاي «حاشية يك رودخانه»، «بانك يك رودخانه» را به عنوان معادل فارسي جملة 22 ارائه دهد.

گروه 8 . املا و فاصلة بين كلمات: ترجمة جملة 23 و 24 غيردستوري است. ترجمة 24 بي‌معنا، و ترجمة جملة 23 معنادار است، هرچند نياز به اصلاحات ساختاري و واژگاني نيز دارد.

آيا رقص فرانسوي نشاط‌آور مي‌توانيد؟
23. Can you cancan?

آيا مي‌توانيد كنسرو بكنيد كنسرو بكنيد؟
24. Can you can can?

ماشين ترجمه براي اين‌كه بتواند براي جملات فوق ترجمة درستي ارائه دهد بايد بتواند بين معاني مختلف «can» تمايز قائل شود. در جملة 23 «can» در آغاز جمله فعل كمكي است، در حالي كه «cancan» در آخر جمله به نوعي رقص اشاره دارد و فعل است. (توجه داشته باشيد كه در اين مورد «cancan» بدون فاصله نوشته مي‌شود. البته مي‌توان به جاي آن از «can the can» نيز استفاده كرد). نكتة جالب آن است كه وقتي «cancan» را با فاصله و به صورت «can can» بنويسيم، ديگر ماشين ترجمه قادر نيست اين عبارت را به صورت «رقص فرانسوي نشاط‌آور» ترجمه كند، بلكه هر يك از دو can موجود پس از you را جدا فرض مي‌نمايد و به كنسرو ترجمه مي‌كند. بنابراين نگارش درست جملات در هنگام ورود اطلاعات به ماشين از اهميت بسياري برخوردار است. انسان‌هاي مترجم مي‌توانند از طريق بررسي متن و بافت، اشكالات تايپي و املايي احتمالي را تشخيص دهند، منظور اصلي نويسنده را درك و ترجمه كنند، ولي ماشين از چنين قابليتي برخوردار نيست.

گروه 9. مقولة دستوري: در زبان، واژه‌هاي بسياري وجود دارند كه بسته به بافت و جايگاه، به مقوله‌هاي دستوري مختلفي تعلق دارند.

25. Like you I don’t like him.

به شما علاقه‌ داشته باشيد من تي ـ را مي‌پوشانم به او علاقه داشته باشد.

در اين جمله «like» قبل از you به معناي «مثل و مانند» است، درحالي‌كه «like» پيش از him فعل است و به‌معناي «دوست‌داشتن». مشخص است كه «پديده» در تشخيص مقولة دستوري واژه‌هايي كه به بيش از يك مقوله تعلق دارند، موفق نيست.

گروه 10. اسامي ساده و مركب: در انگليسي به شيوه‌هاي مختلف مي‌توان اسم مركب ساخت. يكي از اين شيوه‌ها آن است كه اسم را با فعل تركيب كنيم، يا دو اسم را به‌هم بپيونديم.

ميوه علاقه داشتن را هلو پرواز مي‌كند.
26. Fruit flies like peach.

در جملة 26، «fruit flies» اسم مركب است و به «مگس ميوه» يا «حشرات ميوه» اشاره دارد، بنابراين بايد آن را اسم به حساب آوريم. از سويي ديگر، بدون نگاه‌كردن به بخش دوم يعني «like peach» و محدوديت‌هاي معنايي در كاربرد يك واژه‌، ممكن است تصور كنيم كه «fruit» فاعل است و مفرد، و «flies» فعل سوم‌شخص مفرد. اما وقتي بخش دوم جمله را نيز مدنظر قرار دهيم به اين نتيجه مي‌رسيم كه فعل اصلي جمله «like» است و نه «flies» و درواقع آنچه پيش از «like» آمده اسم مركب است و نه فاعل و فعل. «پديده» به جاي آن‌كه «fruit flies» را اسم مركب درنظر بگيرد، «fruit» را فاعل و «flies» را فعل اصلي درنظر گرفته است، از اين‌رو «like» را كه پس از «flies» آمده مفعول مستقيم و «peach» را متمم فرض كرده. بنابراين «پديده» در زمينة اسامي مركب نيز عاري از خطا نيست. ترجمة پيشنهادي جمله 26 از اين قرار است: مگس‌هاي ميوه هلو را دوست دارند.

گروه 11. جملات سببي: جمله‌هاي 27 و 28 هردو دستوري‌اند، با وجود اين مي‌توان معناي جمله و منظور اصلي گوينده را فهميد.

من ماشينم را داشتم شسته شده.
27. I had my car washed.

ديروز من كوتاه‌كردن مويم را داشتم.
28. I had my hair cut yesterday.

به نظر مي‌رسد ساختار جملات سببي به خوبي براي «پديده» تعريف نشده و فعل have و نقش آن در جملة سببي به درستي درك نشده است. از اين‌رو به جاي ترجمه‌هايي چون «ماشينم را دادم بشويند» و «ديروز رفتم سلماني» يا «ديروز مويم را كوتاه كردم»، ترجمه‌هاي فوق توليدشده است.

گروه 12. توالي صفات: در گروه‌هاي اسمي مي‌توان چندين صفت را پيش از اسم قرار داد كه البته در مورد ترتيب قرار گرفتن آن‌ها قواعد خاصي وجود دارد. ضمناً در انگليسي، فعل و فاعل از نظر عدد و شخص با هم مطابقت دارند.

دو بطري‌هاي چوبي قرمز بزرگ
29. Two large red wooden bottles.

ترجمة جملة 29 غيردستوري، اما قابل درك است. به راستي ترتيب واقعي صفات در زبان فارسي چگونه است؟ «پديده» ترتيب صفات را از انگليسي به فارسي كاملاً برعكس كرده، يعني «large red wooden» را به «چوبي قرمز بزرگ» تبديل نموده. نكتة ديگر اين‌كه «پديده» مطابقت عدد با اسم را بدون تغيير، از انگليسي وارد فارسي كرده است: برخلاف انگليسي كه در آن عدد با اسم مطابقت دارد، در فارسي اسم همواره مفرد است (يك سيب، دو سيب، سه سيب، و …)، و به نظر مي‌رسد در اين زمينه برنامة دستوري مناسب به ماشين داده نشده.

گروه13. جملات امري: ترجمة جملة 30، دستوري است، اما معناي موردنظر گوينده يا نويسنده را منتقل نمي‌كند.

همانجا به من كتاب را بدهيد.
30. Give me the book over there!

«پديده» در ترجمة عبارت پايان (يعني «over there» دچار اشتباه شده و آن را به جاي «كه آنجاست» به «همان‌جا» ترجمه كرده. ترجمة پيشنهادي اين جمله از اين قرار است: «كتابي را كه آنجا است به من بدهيد». ضمناً در فارسي معمولاً مفعول مستقيم پيش از متمم يا مفعول غيرمستقيم مي‌آيد. «پديده» مفعول غيرمستقيم را پيش از مفعول مستقيم آورده است. با اين همه، ماشين در ترجمة جملة امري ساده‌اي مثل: «Give me the book» با مشكل چنداني مواجه نبوده و آن‌را به صورت «به من كتاب را بدهيد» ترجمه مي‌كند، هرچند در اين مورد هم بايد جاي «كتاب را» و «به من» عوض شود.

گروه 14. Nor در آغاز جملات، علامت تخفيف: احتمالاً به اين برنامه، اطلاعات دستوري مناسب دربارة «nor» داده نشده است. ضمناً بايد كلمات را به صورت كامل تايپ كرد و از تخفيف[10] پرهيز نمود.

31. I don’t like him, nor do I know him.

من تي ـ را مي‌پوشانم به او علاقه داشته باشد، همچنين من او را حتماً بشناسم.

«پديده» «don’t» را دو واژه به شمار مي‌آورد؛ «don» را فعل و «t» را مفعول مي‌داند و از اين‌رو در ترجمه‌اش عبارت «تي ـ را» مشاهده مي‌شود. ضمناً نتوانسته درك كند كه علت وارونه‌شدن توالي فاعل و فعل كمكي در «do I» تأكيد نيست، بلكه به خاطر وجود «nor» است. براي جملة 31 ترجمة زير پيشنهاد مي‌شود:

نه از او خوشم مي‌آيد و نه او را مي‌شناسم.

گروه 15. حروف تعريف معين و نامعين: يكي از كاربردهاي حرف تعريف نامعين (a يا an) عام[11]‌بودن آن‌ است، يعني به تمامي اعضاي يك طبقه يا گروه دلالت مي‌كنند.

يك بچه بايد با ادب باشد.
32. A child should be polite.

مجبوربودن كهنه بزرگ است.
33. The old should be honored.

جملة 32 دستوري است، اما كاربرد «يك» در آغاز جمله، غيرعادي است؛ يعني ماشين ترجمه اين نكته را ناديده گرفته كه «a child» يعني «تمام بچه‌ها» و نه «يك بچه». در جملة 33 نيز مي‌بينيم كه ترجمه ارائه‌شده كاملاً اشتباه، غيردستوري و بي‌معنا است. شايد عامل اين خطا، نبود اسم پس از صفت «old» باشد. درحقيقت «the old» يعني «the old people»، ولي ماشين نتوانسته اين قسمت حذف شده را ترميم كند.

گروه 16. نقل‌قول غيرمستقيم: جملة 35 در انگليسي نقل‌قول غيرمستقيم اخباري ناميده مي‌شود. ترجمة ارائه‌شده توسط «پديده» براي اين جمله، غيردستوري و بي‌معنا است.

32. He said that he had gone to the cinema the day before.

او گفت او به سينما روز رفته بود قبلاً.

به نظر مي‌رسد عامل اصلي بروز چنين مشكلي وجود عبارت «the day before» باشد. مي‌دانيم كه در تبديل جملة خبري از مستقيم به غيرمستقيم واژة «yesterday» به «the day before» تبديل مي‌شود، ولي «پديده» نتوانسته بين اين دو ساختار متفاوت، رابطه‌اي برقرار كند و درنتيجه ترجمة نادرستي را توليد كرده است.

گروه 17. جملات شرطي بدون if : مي‌دانيم كه در جملات شرطي انگليسي مي‌توان if را حذف كرد. در اين حالت جاي فعل كمكي و فاعل عوض مي‌شود. مثلاً
«if I were you» به «were I you» تبديل مي‌شود و…

من ثروتمند بودم، من يك ماشين مي‌خرم.
36. Were I rich, I would buy a car.

ترجمة «پديده» براي جملة فوق، غيردستوري و بي‌معنا است. به نظر مي‌رسد عامل بخشي از اين اشكال، حذف if و جابه‌جايي فاعل (I) و فعل كمكي (were) باشد. ضمناً پديده «would buy» را «مي‌خرم» ترجمه كرده كه نادرست است. درواقع جملة فوق جملة شرطي نوع دوم است و دربارة چيزي خلاف واقعيت صحبت مي‌كند. مثلاً در جملة فوق، فرد ثروتمند نيست و بنابراين نمي‌تواند ماشين بخرد. براي جملة 36 ترجمة زير پيشنهاد مي‌گردد: اگر ثروتمند بودم ماشين مي‌خريدم.

گروه 18. مالكيت: همان‌گونه كه در گروه 14 و مثال 31 مشاهده گرديد، «پديده» don’t را دو واژه فرض كرد و بنابراين آن را به صورت فعل «don» و مفعول مستقيم «t» درنظر گرفت. در جملة 37 نيز پديده چنين اشتباهي را تكرار كرده است.

من به علي رفتم؟
37. I went to Ali’s.

مشاهده مي‌شود كه «پديده» نتوانسته بين «Ali’s» و «Ali’s house» رابطه‌اي برقرار كند و بنابراين «to Ali» را عبارت «حرف اضافه‌اي» فرض كرده و نتوانسته هويت «s» را مشخص سازد. براي جملة 37 معادل زير پيشنهاد مي‌گردد: من به خانة علي رفتم.

مشكلات ماشين ترجمة «پديده»
از جمله مهم‌ترين دلايل بروز مشكلات ذكرشده براي «پديده»، مي‌توان به موارد زير اشاره كرد:

1. اين ماشين ترجمه نسبت به مخاطبان حساس نيست. گاهي مخاطبان يك متن را افراد عادي تشكيل مي‌دهند و گاه افرادي متخصص و حرفه‌اي. پديده براي هر دو گروه به يك شكل ترجمه مي‌كند؛

2. «پديده» در ترجمة متون تخصصي و محدود كه موضوع و سبك خاصي را داشته باشند، موفق است، ولي در ترجمة متون عام‌تر دچار مشكل مي‌باشد؛

3. با گذشت زمان معناي واژه‌ها تغيير مي‌كند. به همين خاطر اصلاح مداوم برنامه و واژگان ماشين ترجمه ضروري است كه البته نيازمند صرف هزينه‌هاي بسيار مي‌باشد؛

4. ماشين ترجمة «پديده»، سخنگوي بومي يك زبان خاص نيست، از اين‌رو در برخورد با موقعيت‌هاي جديد موفق نيست؛

5 . تقسيم‌بندي و تحول واژه‌ها در زبان‌هاي مختلف يكسان نيست. مثلاً ممكن است دو مفهوم در يك زبان با يك واژه بيان شوند و در زبان ديگر با دو واژه. مثلاً واژة bank در زبان فارسي به معناي «حاشية رودخانه» و «يك مركز مالي» است، ولي در انگليسي هر دو مفهوم توسط bank نشان داده مي‌شود. يا در فارسي «ماهي» هم به معناي «موجودي زنده در آب» است و هم «نام يك غذا، مثل ماهي با پلو» و… ولي اين دو مفهوم در اسپانيايي با دو واژة pez (ماهي زنده) و pescado (خوراك ماهي) نشان داده مي‌شود.

ماشين ترجمة «پديده» در تفكيك و تشخيص معاني مختلف يك واژه، بويژه واژه‌هاي هم‌آوا ـ هم‌نگاشت[12] مشكل دارد.

سه اشكال عمده كه اكثر ماشين‌هاي ترجمه از جمله «پديده» با آن مواجه‌اند عبارت‌اند از:

الف) ناتواني اين‌گونه ماشين‌ها در تميز بين كاربردهاي عام و تخصصي يك واژه. مثلاً bus در متون عام به معناي «اتوبوس» است، ولي در متون تخصصي مربوط به رايانه، به «بخشي از رايانه» اشاره دارد.

ب) ناتواني در تميز بين كاربردها و مفاهيم مختلف واژه‌هاي عام. مثلاً جملة «The pen is in the box» و «The box is in the pen» را درنظر بگيريد. Pen در جملة اول هم به معناي «وسيله‌اي براي نوشتن» (قلم داخل جعبه است) و هم به معناي «تخت بازي بچه كه دور آن حصار چوبي يا … نيز كشيده مي‌شود» (تخت بچه در جعبه است/ داخل بسته‌بندي مي‌باشد). اما در جملة دوم يكي از اين دو معنا نامربوط است. يعني نمي‌توانيم بگوييم «جعبه در خودكار است»، بلكه فقط مي‌توانيم بگوييم «جعبه روي تخت بچه است». ماشين ترجمه تنها در صورتي مي‌تواند چنين جملاتي را درست ترجمه كندكه از اندازة نسبي اشيا نيز باخبر باشد.

ج) حساس‌نبودن به بافت و مخاطب.

اما ريشة اين‌گونه مشكلات در چيست؟ آيا به تئوري زباني اشكالي وارد است؟

تئوري زباني
تئوري زباني غالب، بر روابط دستوري در جمله و نحو تأكيد مي‌كند. حتي در دستور جهاني، «چامسكي» نحو را خودكفا و مستقل از معنا مي‌داند و بحث دربارة معنا را در حاشيه قرار مي‌دهد. به نظر مي‌رسد اين نوع تئوري مبتني بر نحو، عامل بخشي از مشكلات ماشين‌هاي ترجمه باشد.

تئوري زباني به بافت توجهي نمي‌كند و جملة منفرد را كه توسط گوينده در محيط زبان آرماني توليد مي‌گردد و توسط شنونده درك مي‌شود مبناي مطالعه قرار مي‌دهد. بايد اذعان كرد كه دستور و نحو به تنهايي نمي‌توانند رايانه را به توليد ترجمه‌اي چون انسان مترجم وادارند. درواقع، به برنامه‌اي نياز است كه همزمان به نحو و معنا بپردازد. ماشين ترجمه بايد نسبت به معنا حساس باشد.

اما چگونه مي‌توان در ماشين ترجمه، نسبت به معنا حساسيت ايجاد كرد؟ براي انجام اين كار لازم است در تئوري‌هاي زباني موجود و برنامة تعريف‌شده براي ماشين‌‌هاي ترجمه، قدرت تعقل و تفكر را وارد كنيم. قدرت انتخاب و تعقل همان موهبتي است كه انسان از آن برخوردار است. رايانه در انتخاب كاري كه انجام مي‌دهد آزاد نيست. اين برنامه است كه به ماشين مي‌گويد چه كاري را انجام دهد و چه كاري را انجام ندهد. مهم‌تر از همه آ‌ن‌كه ماشين از درك كاري كه انجام مي‌دهد عاجز است. ويژگي مهم ديگر تعقل و تفكر آن است كه همزمان مي‌تواند در بيش از يك حوزه كار كند و فرد داراي قدرت تعقل بر اين نكته واقف است كه در مورد يك پديده يا واقعيت، بيش از يك تفسير ممكن است وجود داشته باشد.

نتيجه‌گيري
تعقل و تفكر اساس كار زبان انسان را تشكيل مي‌دهد و ماشين فاقد آن است.

ريشة مشكلات امروزي ماشين‌هاي ترجمه را بايد در سه چيز جستجو كرد:

1. برنامه‌هاي نادرست كه به ماشين داده مي‌شود و بيشتر آن‌ها ناشي از كم‌اطلاعي يا بي‌اطلاعي برنامه‌نويسان مي‌باشد. ضمناً ضروري است براي داشتن برنامه‌هاي مناسب، در گروه برنامه‌نويسان، زبانشناسي مجرب نيز گنجانده شود تا با تحليل ساختارهاي مختلف زبان، الگوهاي مناسب را براي تهية برنامه در اختيار برنامه‌نويسان قرار دهد.

2. با ضعف موجود در تئوري زباني، طبيعي است كه نمي‌توان زبان را جداي از معنا بررسي كرد. حتي وقتي دربارة آواهاي زباني صحبت مي‌كنيم، به معنا نيازمنديم (مثلاً جفت‌هاي كمينه را براي تعيين واج‌هاي زبان به‌كار مي‌بريم). بنابراين چنانچه تئوري زباني به گونه‌اي اصلاح گردد كه معنا را نيز لحاظ كند مي‌توان بخش ديگري از مشكلات ماشين‌هاي ترجمه را حل كرد. البته انجام چنين كاري بسيار دشوار، اما شدني است.

3. اگر بتوانيم به شكلي فقدان چنين قدرتي را ـ يعني همان نعمتي را كه خدا به ما عطا كرده ـ در اختيار ماشين قرار دهيم، (كه البته دستيابي به اين هدف بسيار بعيد به نظر مي‌رسد) مشكلات ماشين‌هاي ترجمه را مي‌توان رفع نمود. بنابراين بايد انتظار داشته باشيم كه با توجه به دانش كنوني بشر، حتي در صورتي كه مشكلات دستة اول و دوم رفع گردند، مشكلات دستة سوم به قوت خود باقي بمانند.

سؤالي كه در اينجا مي‌توان مطرح كرد آن است كه اگر به فرض بتوانيم چنين قدرتي را به ماشين بدهيم آيا خواهيم توانست هروقت كه بخواهيم آن را از ماشين بازپس بگيريم؟ يا از ماشين بخواهيم كه برخلاف ميل و ارادة خود (كه به خاطر داشتن قدرت تعقل، پيدا نموده) هر كاري را كه ما بخواهيم، به انجام برساند؟ چنين وضعيتي را «رابينسون» (Robinson, Douglas, 1992) به خوبي به تصوير كشيده است. او مي‌نويسد: اگر ماشين ترجمه بتواند مثل انسان ترجمه كند و از قدرت تعقل و تفكر برخوردار باشد، آيا ترجيح نخواهد داد صبح كه از خواب برمي‌خيزد، به جاي ترجمة متن تجاري يا … پاي تلويزيون بنشيند و فيلم چارلي را تماشا كند؟!».

منابع

Borr, B. J. (1993). Machine Translation: a View from the Lexicon. Cambridge, Mass: MIT Press.

Dorr, B. J. (1994). “Machine Translation Divergences: A Formal Descriptipn and Proposed Solution”. Computational Linguistics 20 (4). PP 597-634.

Dreyfus, Hubert L. (1992). What Computers Still Can’t Do. Cambridge, MA: MIT Press.

Gerber, Laurie. Working toward Success in Machine Translation. http://www.elsnet.org/mt2010/gerber.pdf.

Hovy, E. H. and Nirenburg (1992). “Approximating an Interlingua in a principle Way”. Proceedings of the DARPA Speech and Natural Language Workshop. Arden House , NY.

Huchins, W.J. (1986). Machine Translation: past, Present, Future. Chichester: Ellis Horwood Publishing.

Kay, Martin. Machine Translation

http://www.isadc.org/kay.html.

Melby, Alan and C. Terry warner (1995). The possibility of Language: a discussion of the Nature of Language, with Implications for Human and Machine Translation. (in Press) Ams

[7] امامی م . بررسی مسایل درك متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه كارشناسی ارشد، دانشكده مهندسی كامپیوتر، دانشگاه صنعتی شریف.،1376.
[8] صراف زاده ع. سمینار علمی ، آمفي تئاتر دانشكده مهندسي، 1389 .

[9] Milestones in machine translation – No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com