ترجمه ماشینی _ کارهای فعلی در زبان فارسی
در سال ۱۳۷۲، در آزمایشگاه پردازش زبان طبیعی داشنگاه صنعتی شریف، مهرنوش شمس فرد ( ۱۳۷۳ ) سامانه ای به نام دنا طراحی و پیاده نمود. در این سامانه با به کارگیری نظریه وابستگی مفهومی شنک ( ۱۹۷۵ )، جمله های فارسی به شبکه ای از مفهوم ها و روابط میان آنها تبدیل می شوند.
پس از آن پروژه های متعدد دیگری در حیطه¬ی زبان فارسی در موضوعات ذیل به انجام رسیدند:
پردازش نحوی جمله ها از جمله گروه های اسمی و جمله های مرکب، طراحی و پیاده سازی بخش واژگان و نیز ارکان ساختواژی، تقویت بخش استنتاج گر پروژه دنا، بررسی شیوه های بازنمایی معنا و انتخاب یک شیوه مناسب برای سامانه دنا ۲ و پروژه های دیگری که بر روی واکافت واژه ای، واکافت ساختواژی، واکافت نحوی و واکافت معنایی متمرکز شده بودند.
در یک تحقیق دیگر نیز ماشینی کردن عمل ترجمه از یک زبان محاوره ای به زبان محاوره ای دیگر با قابلیت یادگیری ماشین به صورت خودکار مورد بررسی قرار گرفت. از آنجا که در این روش ترجمه، برای طراحی الگوریتم های ارائه شده جهت ایجاد پایگاه دانش و استنتاج دانش از آن از هیچ گونه اطلاعات پیش فرضی در زمینه چگونگی ساختار جملات زبان های مبدا و مقصد و نقش کلمات در جمله استفاده نشده است، مترجم حاضر مستقل از زبان های مبدا و مقصد، توانایی انجام عمل ترجمه از هر زبان به زبان دیگر را دارد. [۷]
در حال حاضر دکتر عبدالحسن صراف زاده (رئیس دانشکده کامپیوتر و فناوری اطلاعات دانشگاه یونیتک نیوزیلند) با بهره گیری از روشهای آماری، چندین سال است که بحث ترجمه ماشینی را در دانشگاه خود همراه با یک تیم تحقیقاتی دنبال می نمایند و به نتایج تقریبا قابل قبول و رضایت بخشی نیز نائل گردیده اند. موفقیت اصلی گروهی پژوهشی- تحقیقاتی ایشان بیشتر در بخش ترجمه ماشینی انگلیسی به فارسی بوده است چرا که پیکره بسیار عظیمی را مشتمل بر ۱۳ میلیون جمله در بخش پیکره تک زبانه خود به زبان فارسی یعنی در بخش نهایی (Persian monolingual corpuse) دارا می باشند و این امر باعث کسب نتایج بهتر آنان نسبت به ترجمه های گوگل میگردد. این در حالیست که گوگل دقیقا وضعیتی عکس این حالت دارد و متقابلا در ترجمه فارسی به انگلیسی بسیار قوی عمل می نماید. در حال حاضر در بخش (English-Persian parallel corpuse) تنها یک میلیون جمله وجود دارد که توسط نرم افزار Microsoft Aligner جمله به جمله و نظیر به نظیر align میشوند و افزایش هر چه بیشتر این پیکره نیز هر چند کاری دشوار و زمانبر است، باعث افزایش دقت ترجمه ماشینی ما خواهد شد. [۸] لذا مجددا روش ترجمه ماشینی با بهره گیری از روشهای آماری به طور کامل تشریح می گردد:
ترجمه ی ماشینی آماری یکی از راههای ترجمه ی ماشینی است که در آن فرآیند ترجمه با مدلهای آماری انجام میشود. این مدلهای آماری با کمک آنالیز عبارات متنی دوزبانه است. روش آماری با روش ترجمه بر پایه دستور و ترجمه بر پایه نمونه در تضاد است. نخستین ایده ی ترجمه ی ماشینی آماری را وارن ویور در سال ۱۹۴۹ ارائه کرد که در آن نظریه اطلاعات کلود شانون را به کار بست. در سال ۱۹۹۱ این ایده توسط پژوهشگران ای بی ام در مرکز پژوهشی جی واتسون بازتعریف شد و سبب محبوبیت ترجمه ماشینی در سالهای اخیر شده است. امروزه این روش بهترین و گستردهترین روش ترجمه ی ماشینی است.
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکرههای متنی دوزبانی استفاده می کنند. همانند پیکره کانادایی هانسارد (Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرمافزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آیبیام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر ۲۰۰۷ به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیتهای ترجمه خود را بوسیله دادن ۲۰۰ میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمهها بهبود یافته است.[۹]
اصول
ایده ترجمه ماشینی از نظریه اطلاعات سر برآورده است. سند (متن خواهان ترجمه) بر پایه احتمال(p(e|f ترجمه میشود که رشته ی e در زبان بومی (برای نمونه انگلیسی) ترجمه ی رشته ی f در زبان بیگانه (برای نمونه فرانسوی) است. معمولا، این احتمالات با استفاده از تکنیکهای برآورد پارامتر برآورد میشوند.
مزیتها
مهمترین مزیتهای ترجمه ی ماشینی آماری در برابر روشهای سنتی عبارتند از:
بهرهگیری بهتر از منابع
حجم بسیاری از قالب ماشین خوان که در زبان طبیعی گفته میشود وجود دارد.
معمولاً سامانههای ترجمه آماری مختص جفت زبان خاصی نیستند و بر هر جفت زبانی سازگارند.
سامانههای ترجمه بر پایه دستور نیازمند توسعه دستی دستورهای زبانشناسی است که میتواند پرهزینه باشد و اغلب بر دیگر زبانها سازگار نیست.
ترجمه طبیعیتر (روانتر و نزدیکتر به گفتار)
موانع و مشکلات ترجمه ماشینی در زبان فارسی
مشکلات زبان فارسی که باعث ابهام در این زمینه ترجمه ماشینی می شود به ۳ دسته تقسیم می شود. ۱-مشکلات رسم الخط فارسی: چون زبان فارسی از رسم الخط عربی استفاده می کند دارای مشکلاتی فراوان از جمله نداشتن حرکت یا آوای کوتاه(a,e,o) می باشد. همچنین رسم الخط فارسی به دلیل چسبیده بودن حروف به سختی قابل پارس کردن است. ۲- مشکلات نحوی زبان فارسی: نظیر مشکلات افعال و… ۳- استثناها: نظیر اصطلاحات و light verb و ….
در حقیقت در همة ترجمهها ـ چه وقتی که از فارسی به انگلیسی و چه وقتی که از انگلیسی به فارسی صورت میگیرند ـ مشکلات وجود دارند. مثلاً اغلب میگویند تسلط به زبان مبداء و مقصد و موضوع ترجمه برای ترجمه کفایت میکند. به عبارتی دیگر تسلط زبانی کافی است. در حالی که اینگونه نیست و شرایط دیگری مورد نیاز هستند، شما باید تسلط فرهنگی و اجتماعی هم در کنار آن تسلط زبانی داشته باشید. بنابراین مشکلات زبانی در همه جا خودشان را نشان میدهند. در انتخاب واژگان و معادلسازی نیز ما با مشکلات متعددی روبرو هستیم. اما اینکه این مشکلات و بعضاً ضعفها محسوس یا نامحسوس هستند، یک سخن دیگر است و در این باره هم نگرشهای مختلفی وجود دارند. وقتی که شما از انگلیسی به فارسی ترجمه می کنید یک گرتهبرداری به صورت بسیار رایج و انتقال ساختهای نحوی نارایج به زبان فارسی صورت می گیرد. بنابراین لازم است در ابتدا با اجزای اصلی مورد نیاز در تجزیه و تحلیل جملات برای ترجمه ماشینی آشنا شویم.
همان طور که در بالا توضیح داده شد، مهمترین بخش یک سامانه مترجم ماشینی، تشخیص نقش کلمات در جمله و تشخیص معنای صحیح آنها با توجه به متنی است که آن کلمه در آن قرار گرفته است. برای تشخیص معنا ی صحیح کلمات از سه روش می توان استفاده نمود: در روش اول برای آموزش سامانه به یک مجموعه کلمات فارسی ابهام زدایی شده نیاز می باشد تا از روی آن بتوان عمل رفع ابهام برای کلمات جدید را در متن های مختلف انجام داد که متأسفانه هنوز این مجموعه به صورت یک فرهنگ فارسی قابل خواندن برای ماشین تهیه و تدوین نگردیده است. یعنی این اطلاعات به صورت دستی وجود دارند، اما نسخه رایانه ای از آنها با یک استاندارد معین برای تعریف هر کلمه و معنی و نقش های مختلف آن وجود ندارد. بدیهی است برای این کار ابتدا با ید با یک مرکز زبان شناسی معتبر، استاندارد ذخیره سازی اطلاعات و انواع آن را تدوین نماید و سپس نسخه ای رایانه ای از این اطلاعات جهت استفاده های بعدی تهیه شود.
در روش دوم نیز سامانه مستقیما از یک فرهنگ لغت استفاده می کند، باز هم در مورد زبان فارسی این مشکل وجود دارد که هنوز فرهنگ های لغت فارسی رایانه ای با یک استاندارد مشخص تهیه نشده اند. این در حالی است که در زبان انگلیسی فرهنگ های متعددی مانند net LDOCE, Word یا Roget’s International Thesaurus به صورت MRD یا نسخ قابل خواندن توسط رایانه وجود دارند که سامانه های مختلف مترجم ماشینی از آنها با یکی از روش های رفع ابهام مذکور بهره می جویند.
از روش سوم رفع ابهام نیز همان طور که دیده شد صرفا برای لغات خاص و محدود فنی یا پزشکی استفاده می شود، نه برای کلیه لغات فارسی و چون متأسفانه هنوز استفاده از اصطلاحات فنی فارسی متداول و رایج نشده است، این روش رفع ابهام در زبان فارسی زیاد موفق نخواهد بود. از این رو برای اینکه بتوان از یک مترجم قوی وبدون مشکل فارسی بهره مند شد، ابتدا باید مقدمات بر شمرده را فراهم نمود و این خود تلاش گروهی متشکل از زبان شناسان، مترجمان، ادیبان و متخصان رایانه را می طلبد که سرآغازی خواهد شد برای رسیدن به این هدف ملی.
آینده ترجمه ماشینی
اکنون بسیاری از صاحب نظران برآ نند که ارائه ترجمه خوب ، تنها با داشتن اشراف کامل به واژگان و قواعد نگارشی زبان های مبدأ و مقصد میسر نمی شود، بلکه نیازمند ادراک انسانی از مفاهیم گوناگونی می باشد که ماشین هرگز قادر به فهم آن نیست و نخواهد بود. از نظر برخی افراد، ماشین های ترجمه شفاهی، نرم افزارهای تبدیل کلام به آدمک های گرافیکی که به زبان اشاره صحبت می کنند و یا موبایل هایی که صحبت های شخص آن طرف خط را به زبان دیگر برمی گردانند شاید فقط در حد سرگرمی جلوه کند؛ لیکن از یاد نبریم که بسیاری از امکانات پیش پا افتاده و کاملا بدیهی زندگی امروزی ما یکصد سال پیش حتی به مخیله دانشمندان نیز راه پیدا نمی کرد.
همان طور که گفته شد منظور از ترجمه متن توسط ماشین ترجمه – به پشتوانه پیشرفت هایی که به ویژه در دهه اخیر در تحقق بخشیدن به این رؤیای پنجاه ساله به دست آمده است- فقط برگردان متن نوشتاری نیست، بلکه ترجمة نوشته به صوت، برگردان نوشته به نمایش گرافیکی زبان اشاره ، ترجمه صوت به صوت و یا ترجمه صوت به متن نیز- چه در داخل یک سیستم زبانی و چه به زبان دیگر- و وظایف دیگری از این دست نیز قرار است به عهده ماشین های مترجم گذاشته شود. به عنوان نمونه می توان به نوعی سیستم تلفن همراه طراحی شده توسط شرکت NEC اشاره کرد که برای ترجمه مکالمات تلفنی ژاپنی به انگلیسی طراحی شده است؛ یا از نرم افزارهایی یاد کرد(digital avatars) که برای کمک به ناشنوایان و یا کم شنوایان طراحی شده و مراحل تکمیلی خود را می گذراند و قرار است بتواند آنچه را که میشنود با استفاده از تصویر آدمکی که با زبان اشاره صحبت می کند، به ناشنواها منتقل نماید.
جمع بندی و نتیجه گیری
فراگیری ترجمه ماشینی عبارت اند از: واکافت واژه ای، واکافت ساختواژی، واکافت نحوی، واکافت معنایی، تشخیص نقش کلمات در جمله، تشخیص معنای صحیح کلمات ( با توجه به جمله حاوی و رفع ابهام از کلمات دارای معنی مشابه و یافتن معنی معادل کلمه در زبان مقصد و تبدیل جمله زبان مبدا به جمله زبان مقصد با توجه به دستور زبان مقصد و در صورت نیاز اعمال گشتارهای مناسب برای تبدیل جملات مقصد به شکل روساختی آن ). در این راستا مهمترین بخش یک مترجم که دقت در آن باعث بالا رفتن دقت کل عمل ترجمه می گردد، رفع ابهام معنایی از کلمات جملات زبان مبدا ونیز رفع ابهام از ترجمه آنها به زبان مقصد می باشد. برای رفع ابهام معنایی کلمات سه روش کلی وجود دارد که عبارت اند از: ( الف ) رفع ابهام با مربی، (ب ) رفع ابهام بر مبنای فرهنگ لغت، و ( ج ) رفع ابهام بدون مربی.
اما مشکل اصلی بر سر راه رفع ابهام از کلمات فارسی این است که اگر از دو روش اول استفاده شود، به یک نسخه رایانه ای از مجموعه لغات همراه بانقش های مختلفی که می توانند به خود بگیرند و معانی مختلفی که باتوجه به نقش های مختلف و یا همنشینی با کلمات مختلف به خود می گیرند، نیاز می باشد که متأسفانه این نسخه رایانه ای و همچنین استاندارد ذخیره سازی این دسته اطلاعات وجود ندارد که باید با کار گروهی متشکل از زبان شناسان، ادیبان و متخصصان رایانه ایجاد و جهت سیستم های مترجم زبان فارسی صورت بگیرد. استفاده از روش سوم رفع ابهام نیز خاص لغات فنی است که در زبان فارسی هنوز کاملا جا نیفتاده است . بنابراین با توجه به این که دقت در رفع ابهام از معنای کلمات، دقت مترجم را بالا می برد، هنوز نمی توان سامانه های مترجم فارسی مناسب را تهیه و از آنها بهره برداری نمود.
پیشنهادات
اولا که بایستی واژگان معنایی (WordNet) بسیار عظیمی در اختیار داشته باشیم و همچنین با توجه به اضافه شدن لغات جدید در گذر زمان به هر زبان بایستی واژگان معنایی ما بروزرسانی شود و دائما گسترش داده شود.
بایستی توجه داشت که اگر حوزه ی موضوعی متن محدود و کنترل شده باشد، کیفیت ترجمه ماشینی اساساً بهتر خواهد شد.
علاوه بر این وجود خطاهای تایپی و یا املایی و همچنین خطاهای نحوی و نگارشی در متن میتواند در کار ترجمه ماشینی ایجاد اختلال کند. مترجمین ورزیده در رویارویی با کلمات ناشناخته یا ساختارهای پیچیده جملات، با مراجعه به منابع معتبر و با بکارگیری تجربیات و دانش فردی و یا از طرق دیگر به حل مشکل و مسأله می پردازند. در ترجمه ماشینی نیز باید در مقابلاین گونه پدیدهها ساز و کار مناسبی طراحی نمود تا سیستم به ابزار خاصی مجهز باشد تا اختلالی در امر ترجمه بوجود نیاید. بنابراین بایستی ابزارهای پیش پردازش و پس پردازش بسیار قدرتمندی طراحی گردد که متن را قبل از ورود به فاز ترجمه و همچنین خروجی نهایی را بهینه سازی و استاندارد نماید.
نام مقاله: انسان مترجم و ترجمة ماشینی: بررسی موردی مشکلات ماشین ترجمة انگلیسی به فارسی «پدیده»
نام نشریه: فصلنامه کتابداری و اطلاع رسانی
شماره نشریه: ۲۶ _ شماره دوم، جلد ۷
پدیدآور: محمدرضا فلاحتی، آزاده نعمتی
چکیده
هدف از نگارش این مقاله آن بود تا دستکم بخشی از مشکلات ترجمه ماشینی، مشخص و ریشهیابی گردد. یافتهها حاکی از آن بود که «پدیده» در حال حاضر دارای مشکلات فراوانی است که ریشة آنها را در سه چیز میتوان جستجو کرد: ۱) نبود زبانشناسان مجرب در گروه برنامهنویسان؛ ۲) نحوـ محوربودن تئوری زبانی؛ ۳) نبود قدرت تعقل و تفکر در ماشینهای ترجمه. ضمناً مشخص گردید که مشکلات نوع اول را میتوان با بهکارگیری نیروی متخصص رفع نمود. مشکلات نوع دوم با تجدیدنظر در تئوری زبانی و توجه به معنا قابل رفع است، اما- دستکم در شرایط کنونی- نمیتوان قدرت تعقل و تفکر را به ماشین داد و بنابراین مشکلات مربوط به مورد ۳ قابل حل نیستند. با وجود این، نتیجهگیری شد که برای ترجمة متون اینترنتی و حجم زیادی از اطلاعات، بویژه وقتی هدف درک کلیات متن باشد، استفاده از ماشین به جای انسان هم راحتتر است و هم سریعتر و معقولتر.
کلیدواژهها: ماشین ترجمه، ترجمة ماشینی، ترجمة انسانی، شیوة میان زبانی در ترجمة ماشینی، شیوة انتقال در ترجمة ماشینی، ماشین ترجمة «پدیده»، ترجمة انگلیسیـ فارسی
مقدمه
در آغاز اجازه دهید دیدگاههای مختلفی را که دربارة بخش آغازین عنوان این مقاله وجود دارد، باهم مرور کنیم. در یک نگاه کلی سه دیدگاه مختلف درخصوص عنوان این مقاله هست: ۱) طرفداران نظریة نبود تفاوت بین انسان مترجم و ماشین ترجمه، ۲) طرفداران تفوق انسان مترجم بر ماشین ترجمه، و ۳) طرفداران تفوق ماشین ترجمه بر انسان مترجم.
برخی از صاحبنظران بر این باورند که در ترجمه، بین انسان و ماشین تفاوت چندانی وجود ندارد. آنان ضمن اقرار به مشکلات موجود در کار ماشین ترجمه و قبول عملکرد ضعیف آن نسبت به عملکرد مترجمان متخصص، اظهار میدارند که در آینده ماشین ترجمه از عملکردی بهتر برخوردار خواهد شد و در توجیه ادعای خود میگویند که در شرایط فعلی، رایانهها در انجام امور محاسباتی و ریاضیات، نسبت به انسان از سرعت عمل بیشتری برخوردارند و به بیان دیگر انسان ابداً در این زمینهها قادر نیست با ماشین رقابت کند. مثلاً تصور کنید که بخواهیم دو عدد ۱۲۳۹۴۷۶۵ و ۸۹۴۵۶۳۰ را در هم ضرب، حاصل را از ۴۴۳۹۵۴ کسر و نتیجه را بر ۱۲۴۵۹ تقسیم کنیم. مسلماً حتی با استفاده از کاغذ، انجام چنین کاری برای انسان چندین دقیقه بهطول خواهد انجامید، درحالی که تمام این محاسبات را یک ماشین حساب ساده میتواند با دقت لازم و تنها در چند ثانیه به انجام برساند. این گروه از محققان، یادگیری ریاضیات را دشوارتر از یادگیری زبان میدانند و بر این نکته تأکید میکنند که در آیندهای نزدیک، رایانة جدیدی را خلق خواهند نمود که در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتی چون انسان برخوردار باشد.
طرفداران تفوق انسان مترجم بر ماشین ترجمه بر این باورند که چون عملکرد ذهن انسان با ماشین متفاوت است و ماشین از قدرت تصمیمگیری و انتخابی که انسان دارد، برخوردار نیست، هیچگاه نخواهد توانست بهتر از انسان یا حتی مانند انسان به ترجمه و امور مربوط به آن بپردازد.
طرفداران تفوق ماشین ترجمه بر انسان مترجم نیز بر این باورند که مشکلات ماشین ترجمه سالها پیش مرتفعشده و هماکنون اینگونه ماشینها در ترجمة متون مختلف ـ یا دستکم انواعی از آن ـ با مشکلی مواجه نیستند و در آیندهای نزدیک خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.
در این مقاله و با ارائة مثالها و بحثهای مختلف نشان خواهیم داد که با توجه به پیشرفتهای بهدست آمدة کنونی در علوم، ماشین قادر نیست مانند انسان به ترجمه بپردازد. توجه داشته باشید که این گفته بدان معنان نیست که ماشین قادر به ترجمه نیست، بلکه بر کیفیت پایینتر ترجمة ماشینی در مقایسه با ترجمة انسانی تأکید دارد.
حال نگاهی گذرا به تاریخچة کارهای انجامگرفته در خصوص ماشین ترجمه داشته باشیم.
نگاهی کوتاه به تاریخچة ماشین ترجمه
امروزه در کتابها و مجلات معتبر دنیا مطالب فراوانی به چاپ میرسد که به موضوع ترجمه و ترجمة ماشینی مربوط است. «هاچینز» (Huchins, W.J. 1986) و «مل بای» و «تری» (Melby. Alan & Terry, Varner C., 1995) از جمله افرادیاند که به بررسی تاریخچة ماشین ترجمه پرداختهاند. «نیرنبرگ»(Nirenburg, S. 1986) موضوعات روششناختی و نظری مرتبط با ماشین ترجمه را به تفصیل شرح میدهد. «کی»(kay, Martin) و «گربر» (Gerber, Laurie)میکوشند راههایی را ارائه کنند که باعث بهبود کیفیت ترجمة ماشینی شود. «دور» (Dorr, B.J. 1993) نقش و مشکلات مربوط به واژگان را در ترجمة ماشینی موردبحث و بررسی قرار میدهد، «دری فاس» (Dreyfus, Hubert, 1992) به ناتوانیهای رایانه در انجام برخی امور اشاره میکند، و…
کار بر روی ماشین ترجمه همزمان با اختراع رایانه در دهة ۱۹۴۰ آغاز شد. ماشینهای ترجمة اولیه بهاینصورت طراحی شده بودند که برای ترجمة متون مختلف، مستقماً از یک واژهنامة دوزبانه استفاده میکردند. ترجمه نیز تنها به ترجمة واژگانی محدود میشد و از ترجمة ساختار نحوی زبان مبدأ یا مقصد نیز خبری نبود. این نوع روش ترجمه را مستقیم مینامیدند. با این همه در دهه ۱۹۸۰ چندین سامانة ترجمه به بازار عرضه شد که در ترجمه از روش غیرمستقیم استفاده میکردند. علت استفاده از لفظ غیرمستقیم صرفاً بدان علت است که اینگونه ماشینها متن را مستقیماً از زبان مبدأ به زبان مقصد ترجمه نمیکنند، بلکه ابتدا متن از زبان مبدأ به یک «میانزبان»[۳] و سپس به زبان مقصد ترجمه میشود؛ بنابراین، ترجمه در دو مرحله به انجام میرسد. در اینگونه سیستمها برنامههایی تعبیه شده تا به شناسایی ساختار واژه و جمله، و واژهها و عبارات مبهم بپردازند.
روش غیرمستقیم دارای انواعی است که از آن جمله میتوان به دو شیوة «میانزبانی» و «انتقال»[۴] اشاره کرد. در ادامه به صورت اجمالی به معرفی این دو روش میپردازیم.
۱. روشهای ترجمة میانزبانی و انتقال
۱ـ۱. روش انتقال: متن مبدأ ـ ـ تجزیه ـ ـ ساختار بینابینی متن مبدأ ـ ـ انتقال ـ ـ ساختار بینابینی متن مقصد ـ ـ ترکیب ـ ـ متن مقصد
۱ـ۲. روش میانزبانی: متن مبدأ ـ ـ تجزیه ـ ـ میانزبان ـ ـ ترکیب ـ ـ متن مقصد
در روش انتقال، ساختار بینابینی معمولاً کار تجزیه و تحلیل دستوری متن را برعهده دارد و هربار میتواند تنها یک جمله را بررسی کند. از سویی دیگر، روش میانزبانی، متن را بدون توجه به زبانی خاص مورد تجزیه و تحلیل قرار دهد. مزیت روش میانزبانی این است که میتوان با صرف هزینههای نسبتاً پایین، زبانهای جدیدی را نیز به ماشین ترجمه اضافه کرد. این کار صرفاً با استفاده از قوانینی تحقق مییابد که بین زبان جدید و «میانزبان» برقرار است.
اما در دیدگاه انتقال، حیطة کار این قوانین و قواعد، زبان جدید و دیگر زبانهای موجود در ماشین ترجمه میباشد. در روش انتقال، تنها بین دو زبان مبدأ و مقصد مقایسه به عمل میآید. در این مقایسه، واحدهای واژگانی و ساختارهای نحوی دو زبان با هم مقایسه میشوند؛ سپس با استفاده از قواعد انطباقی سعی میشود ساختار بینابینی زبان مبدأ به ساختاری مشابه در زبان مقصد تبدیل شود (Tusjii, 1990). این قواعد همراه با دیگر اطلاعات معنایی و …، در لغتنامهها یا پایگاههای دانش ذخیره میشوند. در شیوة انتقال، عمق و میزان تجزیه و تحلیل از پیش مشخص نیست، بلکه به میزان قرابت و نزدیکبودن دو زبان بستگی دارد: هرچه دو زبان به هم نزدیکتر باشند، از عمق تجزیه و تحلیل نیز به همان میزان کاسته خواهد شد.
اما برای این که بتوانیم به ترجمهای کیفی دست یابیم، باید پا را از تجزیه و تحلیل نحوی یا تجزیه و تحلیل معنایی سطحی فراتر بگذاریم. برای انجام ترجمة کیفی، سیستم باید بتواند معنای واقعی جمله را نیز درک کند. مثلاً جملات سادهای چون «دانشآموز امتحان داد» و «معلم امتحان گرفت» را در دو زبان فارسی و انگلیسی در نظر بگیرید. معادل این دو جمله در انگلیسی بدین قرارند:
The student took the test. The teacher gave the test
ماشین ترجمه باید بتواند اینگونه جملات را نیز به خوبی درک کند و برای درک آنها لازم است که درباة امتحاندادن و امتحانگرفتن در انگلیسی و فارسی اطلاعاتی داشته باشد. غالباً چنین اطلاعاتی در بخشی از سیستم به نام قالبهای حالت[۵] ذخیره میشود. در این مرحله سیستم ترجمه برای شناسایی عناصر جمله به تجزیه و تحلیل معنایی، قواعد انتقال معنایی، و قواعد دیگری نیازمند است. تجزیهگر معنایی با استفاده از نمودار نحوی، قالب حالت را تولید میکند و مرحلة انتقال نیز «قالب حالت» استخراج شده از جمله در زبان مبدأ را به «قالب حالت» معادل در زبان مقصد تبدیل میکند.
اما در روش «میانزبانی» به تجزیه و تحلیل مفصلتری نیازمندیم. نتیجة این تجزیه و تحلیل یک بازنمود انتزاعی است که مستقل از زبان مبدأ است. مزیت این استقلال آن است که ترکیب اجزا و شکلگیری جملة معادل در زبان مقصد میتواند بدون شناخت زبان مبدأ صورت پذیرد. بنابراین در این روش، اطلاعاتی ممکن است به جمله اضافه شود که به صورت واضح و آشکار در جملة مبدأ وجود ندارد. البته افزودن اطلاعات بویژه اطلاعات معنایی و فرازبانی، کاری بس دشوار و وقتگیر است. اطلاعات معنایی غالباً در یک «پایگاه دانش» یا «واژهنامة مفهومی» ذخیره میشود. «نیرنبرگ» و دیگران (Nirenberg, J., Garbonell, J.c., Tomita, M; &Goodman, K., 1992) بر این باورند که از این نوع اطلاعات معنایی، در سیستم ترجمة «کیبیامتی ـ ۸۹»[۶] و برای رسیدن به بازنمودی میانزبانی که عاری از ابهام نیز باشد استفاده شده است. برای رسیدن به این بازنمود میانزبانی، باید از چند مرحله گذشت: «کیبیامتی ـ ۸۹» ابتدا و با استفاده از یک دستور نقشگرای واژگانی، تجزیه و تحلیل نحوی را آغاز میکند، سپس با استفاده از یک لغتنامة مفهومی، مدخلهای واژگانی را به معادلهای میانزبانیشان ترجمه میکند. در مرحلة بعد، پس از اعمال تغییرات ساختاری، ساختارهای میانزبانی حاصل میشوند و در پایان با ترکیب اجزا، بازسازی جمله در زبان مقصد محقق میشود.
همانگونه که پیشتر ذکر شد در روش میانزبانی، افزودن زبان جدید به ماشین ترجمه بسیار راحتتر از روش انتقال است. با این همه، تاکنون هیچ سیستم میانزبانی مطلوبی به بازار عرضه نشده و تمامی سیستمهای ترجمة ماشینی میانزبانی که تاکنون طراحی شدهاند، مراحل آزمایشی خود را سپری میکنند و از این رو حیطة کار آنها از چند صد واژه یا چندهزار پیشنمونه، فراتر نمیرود. هرچند تحقیقات انجام گرفته در خصوص میانزبان اندک نبوده، اما هنوز روش مشخصی ارائه نشده تا با استفاده از آن بتوان به یک بازنمود معنایی مستقل از زبان دست یافت. البته، درخصوص امکان دستیابی به چنین بازنمودی نیز شک و تردید بسیار وجود دارد (Whorf, B.L., 1956; Nirenbuerg, S.et al., 1992; Hovy, E.H. & Nirenburg, J., 1992).
در سیستمهای علمی، از روش انتقال بیشتر استفاده میشود، چون هم سادهتر است و هم نیازی به میانزبان ندارد. همین امر سبب گردیده تا این روش در مقایسه با روش میانزبانی از کارآیی بیشتری برخوردار باشد. به تازگی سعی شده با تلفیق روشها و دیدگاههای مختلف موجود، سیستمی واحد و چندموتوره ارائه گردد. به نظر میرسد انجام این کار بسیار ساده باشد: جملات موردنظر برای ترجمه به چندین موتور ترجمة موازی فرستاده میشوند و در پایان، بروندادهای موتورهای مختلف با هم ترکیب میگردند و درنهایت، بهترین و مناسبترین بخشها انتخاب، و سپس در قالب جملات زبان مقصد، بازسازی و بازنویسی میشوند.
امروزه تقریباً تمام ماشینهای ترجمه از یکی از سه روش گفته شده ـ مستقیم، غیرمستقیم (میانزبانی) یا انتقال ـ استفاده میکنند. مثلاً در ماشینهای ترجمه «آریان»[۷] و «یوروترا»[۸] که توسط کمیسیون مجامع اروپایی» طراحی شدهاند از روش انتقال استفاده شده است. در اواخر دهه ۱۹۸۰ در ژاپن برای زبانهای آسیایی ماشین ترجمهای ساخته شد که از روش میانزبانی استفاده میکرد، اما این پروژه با شکست مواجه شد و شاید دلیل عمدة این شکست را بتوان ساختار خاص و پیچیدگیهای نوشتاری زبانهایی چون ژاپنی، چینی، و… دانست.
تا دهه ۱۹۹۰ چنین تصور میشد که ماشینهای ترجمه باید در نهایت جایگزین انسان مترجم شوند و ترجمههایی را تولید کنند که از قابلیت چاپ برخوردار باشند، اما چنین تصوری هماکنون دچار تغییر و تحول شده است. امروزه دیگر هدف اصلی از ساخت ماشینهای ترجمه، جایگزینی آنها بهجای انسان مترجم نیست، بلکه رسیدن به ترجمههای ارزانتر و سریعتر (آنهم در حجم بسیار زیاد)، هدف نهایی اینگونه ماشینها است.
در بخش بعدی به بررسی یکی از ماشینهای ترجمة انگلیسی به فارسی خواهیم پرداخت که مدعی است در ترجمه، واحد «جمله» را مدنظر قرار میدهد و بنابراین از بسیاری از مشکلات ترجمة واژهبهواژه بهدور است.
ماشین ترجمه «پدیده»
ماشینهای ترجمهای که در بخش پیشین این مقاله دربارة آنها صحبت کردیم، قادر نبودند متون انگلیسی را به فارسی ترجمه کنند، اما ماشین ترجمه «پدیده» از چنین قابلیتی برخوردار است. این ماشین ترجمه مدعی است که قادر است جملات را بهگونهای مطلوب ترجمه نماید. علاوه بر تایپ جملات یا متون موردنظر، میتوان فایلی را که به فرمت «پیدیاف» یا متن[۹] باشد به ماشین داد و منتظر پاسخ ماند. این ماشین ترجمه ضمن بهرهگیری از آخرین دستاوردهای هوش مصنوعی، قادر است ۴۰۰ صفحه را تنها در یک دقیقه ترجمه کند.
«پدیده» در بانک اطلاعاتی خود برای واژهها و عبارات، ۰۰۰,۵۰۰,۱ مدخل دارد. هر مدخل معنای فارسی واژه، مفاهیم دستوری و چند عنصر دیگر را شامل میگردد. برای ترجمة یک جمله، این ماشین نخست آن را به واژههای تشکیلدهنده، عبارات و نمادها تقسیم و سپس نتایج بهدست آمده را به واحدهای دستوری، واژگانی و واژهسازی ارسال میکند؛ سپس نتایج حاصله به یک موتور برونداد فرستاده میشوند. این موتور نهایی، مسئول تولید و ارائة ترجمة فارسی است.
سازندگان این ماشین میگویند در آیندهای نزدیک «پدیده» خواهد توانست متون مختلف را از فارسی به انگلیسی یا از زبانهای دیگر به فارسی برگرداند.
عملکرد ماشین ترجمه «پدیده»
برای پیبردن به چگونگی عملکرد این ماشین ترجمه، محققان ۱۸ نوع مختلف از جملات انگلیسی را به عنوان نمونه وارد ماشین کردند و سپس به بررسی ترجمههای فارسی تولیدشده پرداختند.
در ادامه به بررسی گروههای هجدهگانة جملات انگلیسی و ترجمههای حاصله میپردازیم.
گروه ۱. جملات ساده: جملات ۱ تا ۵ همگی جملات سادهاند. این جملات را ساده مینامیم چون در ساختارشان، اصطلاح ضربالمثل، استعاره، و … وجود ندارد و در ضمن دارای ساختار دستوری پیچیدهای نیستند، تنها دارای یک فعلاند، و…
من به سینما این آخر هفته خواهمرفت.
۱. I will go to the cinema this weekend.
او چه مژههای بلندی را دارد!
۲. What long eyelashes she has!
من به خدا ایمان دارم.
۳. I believe in God.
او روی میز رفت.
۴. He went on the table.
پدرش چه سنی است؟
۵. How old is his father
با نگاهی به جملات انگلیسی ۱ تا ۵ و ترجمههای فارسی تولیدشده به نتایج زیر میرسیم: ترجمة جمله ۱ کاملاً قابلفهم است، با این همه ترتیب اجزای جمله درست نیست. معمولاً در زبان فارسی قید زمان را در آغاز جمله میآورند و بنابراین بیشتر سخنوران فارسی بهجای «من به سینما این آخر هفته خواهم رفت» میگویند «من این آخر هفته به سینما خواهم رفت» یا در گونههای محاورهای «این آخر هفته میرم سینما». ترجمة ارائهشده برای جمله ۲ نیز کاملاً قابل درک است. اشکال این ترجمه وجود حرف «را» پس از واژه «بلندی» است که باید آن را حذف نمود (او چه مژههای بلندی دارد!). جملات ۳و۴ از نظر معنایی و دستوری کاملاً درستاند و نیاز به هیچ تغییر یا اصلاحی نیست. جمله ۵ نیز کاملاً قابل درک و دستوری است؛ با این همه، ساختار بهکار گرفتهشده در ترجمه، ساختاری کاملاً رایج به شمار نمیرود. معمولاً بهجای «پدرش چه سنی است؟» میگوییم «پدرش چند ساله است» یا درگونههای محاورهای «پدرش چند سالشه؟».
نگاهی دوباره به ترجمههای ارائهشده برای جملات ۱ تا ۵ نشان میدهد که این ماشین قادر است جملات ساده را با موفقیت ترجمه کند و اشکالات موجود، بیشتر اشکالاتی ساختاریاند و نه معنایی و بنابراین در امر ارتباط خللی ایجاد نمیکنند.
گروه ۲. اصطلاحات، ضربالمثلها، و…: هریک از جملات ۶ تا ۱۳ در ساختار خود دارای نوعی اصطلاح، ضربالمثل، یا ساختاری مشابهاند. برای رسیدن به معنای درست اینگونه جملات، انسان مترجم باید از پیش با چگونگی کاربرد آنها آشنایی داشته باشد، چون معنای چنین جملاتی را نمیتوان از جمع عددی معانی واژههای تشکیلدهندة آنها مشخص کرد. مثلاً در جمله ۱۲ منظور نویسنده این نبوده که فردی دماغ بزرگ دارد، چرا که در آن صورت بایست از فعل has استفاده میکرد، بلکه منظور او این بوده که بگوید «او فرد بسیار مهمی است» یا «از آن کلهگندهها است».
من به ستون فقرات را خسته بودم.
۶. I was tired to the backbone.
پهنای اجازه دادن به پاهایمان.
۷. Let’s stretch our legs.
او یک پتوی خیس است.
۸. He is wet blanket.
او این روزهای بدهکار است.
۹. He is in the red These days.
او به سطل لگد زد.
۱۰. He kicked the bucket.
در حال بازی tennis فنجان چاییام است.
۱۱. Playing tennis is my cup of tea.
او یک دماغ بزرگ است.
۱۲. He is a big nose.
او جیم شد.
۱۳. He took French leave.
در این گروه، ترجمههای ارائهشده برای جملات ۶، ۷ و ۱۱ کاملاً بیمعنا و غیردستوریاند. ترجمه درست و البته پیشنهادی این سه جمله به ترتیب عبارتاند از:
۶. کاملا ًخسته بودم.
۷. بیایید کمی خستگی در کنیم یا کمی راه برویم.
۱۱. تنیس ورزش مورد علاقهام است.
«پدیده» در ترجمهای که برای جمله ۱۱ ارائه داده واژه tennis را ترجمه نکرده (که دلیل آن میتواند نبود معادل فارسی برای این واژه در واژگان ماشین ترجمه باشد). ضمناً نتوانسته اسم مصدر بودن playing را تشخیص دهد. از اینرو، آن را به اشتباه فعل استمراری درنظر گرفته. علت بروز چنین اشکالی را باید در نقص برنامههای دستوری تعریف شده برای ماشین جستجو کرد.
جملات۸ ، ۱۰ و ۱۲ همگی دستوریاند، اما منظور اصلی گوینده یا نویسنده را نمیرسانند. جملات کاملاً تحتاللفظی ترجمه شدهاند. به بیان دیگر، «پدیده» به معنای اصطلاحی اینگونه جملات توجهی نکرده است. ترجمة پیشنهادی سه جملة بالا به قرار زیر هستند:
۸ . همیشه آیة یأس میخواند/ همیشه ضدحال میزند.
۱۰. او به درک واصل شد/ سقط شده.
۱۲. او فرد مهمی است/ از آن کلهگندهها است.
جملات ۹ و ۱۳ به درستی ترجمه شدهاند، هرچند در جملة ۹ «ی» باید از آخر «روزها» حذف گردد (او این روزها بدهکار است).
بررسی ترجمههای ارائهشده در گروه ۲ نشان میدهد که «پدیده» در ترجمة ترکیبات اصطلاحی داری اشکال است، چرا که بهجای معنای اصطلاحی، جز در جملة ۱۳ به معنای تحتاللفظی واژهها توجه میکند.
گروه ۳. one: میدانیم که ضمیر جانشین اسم میشود. معمولاً در نوشتار یا گفتار برای جلوگیری از تکرار یک اسم، میتوان از ضمیر مناسب استفاده کرد. در انگلیسی، یکی از موارد کاربرد one آن است که جلوی تکرار اسم را میگیرد، مانند جملة ۱۴. ضمناً one میتواند نقش ضمیر نامشخص را نیز بازی کند. مثلاً در جملة ۱۵، one را میتوان «آدم» ترجمه کرد (که ممکن است به هر فردی اشاره داشته باشد). ترجمههای ارائهشده توسط ماشین برای این دو جمله عبارتاند از:
قدم اول مشکلترین یک است.
۱۴. The first step is the most difficult one.
یک با دقت همیشه باید باشد.
۱۵. One should always be careful
در این مورد نیز میبینیم که «پدیده»،one را بهصورت تحتاللفظی ترجمه کرده و نتوانسته کاربرد این واژه را در دو جمله تمیز دهد. برای این دو جمله ترجمههای زیر پیشنهاد میشوند:
۱۴. قدم اول مشکلترین قدم است.
۱۵. آدم همیشه باید مواظب باشد.
One در جملة ۱۴ به «قدم» و در جملة ۱۵ به «تمام انسانها» اشاره دارد.
گروه ۴. علائم اختصاری و اختصارات: جملات ۱۶ و۱۷ هر دو دارای علائم اختصاریاند (U.S. در جملة ۱۶ و US در جملة ۱۷). «پدیده» توانسته جملة ۱۶ را به درستی ترجمه کند، ولی در ترجمة جملة ۱۷ ناموفق بوده.
حکومت آمریکا
۱۶. The U.S. government
محرک غیرشرطی حکومت
۱۷. The US government
در اینجا املای کلمات نقش مهمی را ایفا میکند. از نظر «پدیده» «.U.S»، وقتی پس از هر حرف بزرگ نقطهای وجود داشته باشد، به معنای آمریکا است، ولی «US» بدون نقطه به معنای «محرک غیرشرطی» (Unstimulated) است که به حوزة روانشناسی مربوط میشود. بنابراین در واردکردن اطلاعات به ماشین و رعایت املای درست کلمات باید دقت کنیم، چرا که برخلاف انسان، ماشین قادر نیست خطاهای املایی کلمات را تشخیص دهد. ضمناً ماشین به بافت و متن حساس نیست و از اینرو متوجه نمیشود که «محرک غیرشرطی»، آن هم در جملهای که به اخبار یا سیاست مربوط میشود، ترجمة درستی برای «US» نیست. ضمناً ماشین بین «US» که با حروف بزرگ نوشته شده و «us» (ضمیر مفعولی «We» تمایز قائلشده، و به همین دلیل بهجای «محرک غیرشرطی» از ضمیر «ما» استفاده نکرده است.
گروه ۵. اسم مصدر و مصدر با to از فعل: دو جملة ۱۸ و ۱۹ هر دو دستوریاند، اما از نظر معنایی تنها جملة ۱۸ درست است.
او به یاد آورد در را قفل کند.
۱۸. He remembered to lock the door.
او در قفلشدنی را به یاد آورد.
۱۹. He remembered locking the door
جمله ۱۸ بدین معنا است که فرد، قبلاً در را قفل نکرده بوده، پس رفت ودر را قفل کرد. اما معنای جملة ۱۹ آن است که او قبلاً در را قفل کرده بوده و قفلکردن در را بهخاطر آورده است. در جملة ۱۹ ماشین نتوانسته تحلیل نحوی درستی از جمله ارائه دهد. ماشین عبارت «locking the door» را با «the locking door» که یک گروه اسمی است یکی فرض کرده و چون این گروه اسمی پس از فعل آمده، آن را مفعول مستقیم دانسته. پس، از نظر ماشین «locking» صفت است و نه صورت «ing»دار فعل «lock». ترجمة درست جملة ۱۹ از این قرار است:
او به یاد آورد که در را قفل کرده بود.
گروه ۶. ضمایر: جملات ۲۰ و ۲۱، هر دو دستوری و بامعنایند. این بدان معنا است که «پدیده» میتواند بدرستی بین انواع مختلف ضمایر، از جمله ضمایر مفعولی و انعکاسی تمایز قائل شود.
او او را شست.
۲۰. He washed him.
او خودش را شست.
.۲۱. He washed himself
هرچند ترجمة ارائهشده توسط «پدیده» برای جملة ۲۰ درست است، با ترجمة ارائهشده توسط انسان مترجم یکی نیست؛ بهاین معنا که مترجمان غالباً به جای آنکه ضمیر «او» را دوبار پشت سرهم بیاورند، به جای یکی از ضمیرها از طریق جستجوی در متن، اسم مناسب را جایگزین میکنند ـ مثلاً «علی او را شست» یا «او علی را شست». بنابراین میتوان گفت که ماشین ترجمه قادر نیست از امکانات متن استفاده کند، یا به بیان دیگر، از حد جمله فراتر رود.
گروه ۷. واژههای همآوا ـ همنوشت: واژههای همآوا ـ همنوشت واژههاییاند که دارای تلفظ و صورت نوشتاری یکسانی میباشند، مثل «شانه» که به وسیلهای برای مرتبکردن مو، عضوی از بدن، شانة تخممرغ، قسمت خاکی جاده، و… اشاره میکند. بدیهی است بین معانی مختلف واژة همآوا ـ همنوشت ارتباطی وجود ندارد.
بانک یک رودخانه.
۲۲. The Bank of a river.
برای پیبردن به معنای موردنظر از واژة همآوا ـ همنوشت، توجه به متن و بافت ضروری است. ترجمة ارائهشده برای جملة ۲۲ نادرست است، چون «پدیده» قادر نیست از حد جمله فراتر رود. همین امر سبب شده تا به جای «حاشیة یک رودخانه»، «بانک یک رودخانه» را به عنوان معادل فارسی جملة ۲۲ ارائه دهد.
گروه ۸ . املا و فاصلة بین کلمات: ترجمة جملة ۲۳ و ۲۴ غیردستوری است. ترجمة ۲۴ بیمعنا، و ترجمة جملة ۲۳ معنادار است، هرچند نیاز به اصلاحات ساختاری و واژگانی نیز دارد.
آیا رقص فرانسوی نشاطآور میتوانید؟
۲۳. Can you cancan?
آیا میتوانید کنسرو بکنید کنسرو بکنید؟
۲۴. Can you can can?
ماشین ترجمه برای اینکه بتواند برای جملات فوق ترجمة درستی ارائه دهد باید بتواند بین معانی مختلف «can» تمایز قائل شود. در جملة ۲۳ «can» در آغاز جمله فعل کمکی است، در حالی که «cancan» در آخر جمله به نوعی رقص اشاره دارد و فعل است. (توجه داشته باشید که در این مورد «cancan» بدون فاصله نوشته میشود. البته میتوان به جای آن از «can the can» نیز استفاده کرد). نکتة جالب آن است که وقتی «cancan» را با فاصله و به صورت «can can» بنویسیم، دیگر ماشین ترجمه قادر نیست این عبارت را به صورت «رقص فرانسوی نشاطآور» ترجمه کند، بلکه هر یک از دو can موجود پس از you را جدا فرض مینماید و به کنسرو ترجمه میکند. بنابراین نگارش درست جملات در هنگام ورود اطلاعات به ماشین از اهمیت بسیاری برخوردار است. انسانهای مترجم میتوانند از طریق بررسی متن و بافت، اشکالات تایپی و املایی احتمالی را تشخیص دهند، منظور اصلی نویسنده را درک و ترجمه کنند، ولی ماشین از چنین قابلیتی برخوردار نیست.
گروه ۹. مقولة دستوری: در زبان، واژههای بسیاری وجود دارند که بسته به بافت و جایگاه، به مقولههای دستوری مختلفی تعلق دارند.
۲۵. Like you I don’t like him.
به شما علاقه داشته باشید من تی ـ را میپوشانم به او علاقه داشته باشد.
در این جمله «like» قبل از you به معنای «مثل و مانند» است، درحالیکه «like» پیش از him فعل است و بهمعنای «دوستداشتن». مشخص است که «پدیده» در تشخیص مقولة دستوری واژههایی که به بیش از یک مقوله تعلق دارند، موفق نیست.
گروه ۱۰. اسامی ساده و مرکب: در انگلیسی به شیوههای مختلف میتوان اسم مرکب ساخت. یکی از این شیوهها آن است که اسم را با فعل ترکیب کنیم، یا دو اسم را بههم بپیوندیم.
میوه علاقه داشتن را هلو پرواز میکند.
۲۶. Fruit flies like peach.
در جملة ۲۶، «fruit flies» اسم مرکب است و به «مگس میوه» یا «حشرات میوه» اشاره دارد، بنابراین باید آن را اسم به حساب آوریم. از سویی دیگر، بدون نگاهکردن به بخش دوم یعنی «like peach» و محدودیتهای معنایی در کاربرد یک واژه، ممکن است تصور کنیم که «fruit» فاعل است و مفرد، و «flies» فعل سومشخص مفرد. اما وقتی بخش دوم جمله را نیز مدنظر قرار دهیم به این نتیجه میرسیم که فعل اصلی جمله «like» است و نه «flies» و درواقع آنچه پیش از «like» آمده اسم مرکب است و نه فاعل و فعل. «پدیده» به جای آنکه «fruit flies» را اسم مرکب درنظر بگیرد، «fruit» را فاعل و «flies» را فعل اصلی درنظر گرفته است، از اینرو «like» را که پس از «flies» آمده مفعول مستقیم و «peach» را متمم فرض کرده. بنابراین «پدیده» در زمینة اسامی مرکب نیز عاری از خطا نیست. ترجمة پیشنهادی جمله ۲۶ از این قرار است: مگسهای میوه هلو را دوست دارند.
گروه ۱۱. جملات سببی: جملههای ۲۷ و ۲۸ هردو دستوریاند، با وجود این میتوان معنای جمله و منظور اصلی گوینده را فهمید.
من ماشینم را داشتم شسته شده.
۲۷. I had my car washed.
دیروز من کوتاهکردن مویم را داشتم.
۲۸. I had my hair cut yesterday.
به نظر میرسد ساختار جملات سببی به خوبی برای «پدیده» تعریف نشده و فعل have و نقش آن در جملة سببی به درستی درک نشده است. از اینرو به جای ترجمههایی چون «ماشینم را دادم بشویند» و «دیروز رفتم سلمانی» یا «دیروز مویم را کوتاه کردم»، ترجمههای فوق تولیدشده است.
گروه ۱۲. توالی صفات: در گروههای اسمی میتوان چندین صفت را پیش از اسم قرار داد که البته در مورد ترتیب قرار گرفتن آنها قواعد خاصی وجود دارد. ضمناً در انگلیسی، فعل و فاعل از نظر عدد و شخص با هم مطابقت دارند.
دو بطریهای چوبی قرمز بزرگ
۲۹. Two large red wooden bottles.
ترجمة جملة ۲۹ غیردستوری، اما قابل درک است. به راستی ترتیب واقعی صفات در زبان فارسی چگونه است؟ «پدیده» ترتیب صفات را از انگلیسی به فارسی کاملاً برعکس کرده، یعنی «large red wooden» را به «چوبی قرمز بزرگ» تبدیل نموده. نکتة دیگر اینکه «پدیده» مطابقت عدد با اسم را بدون تغییر، از انگلیسی وارد فارسی کرده است: برخلاف انگلیسی که در آن عدد با اسم مطابقت دارد، در فارسی اسم همواره مفرد است (یک سیب، دو سیب، سه سیب، و …)، و به نظر میرسد در این زمینه برنامة دستوری مناسب به ماشین داده نشده.
گروه۱۳. جملات امری: ترجمة جملة ۳۰، دستوری است، اما معنای موردنظر گوینده یا نویسنده را منتقل نمیکند.
همانجا به من کتاب را بدهید.
۳۰. Give me the book over there!
«پدیده» در ترجمة عبارت پایان (یعنی «over there» دچار اشتباه شده و آن را به جای «که آنجاست» به «همانجا» ترجمه کرده. ترجمة پیشنهادی این جمله از این قرار است: «کتابی را که آنجا است به من بدهید». ضمناً در فارسی معمولاً مفعول مستقیم پیش از متمم یا مفعول غیرمستقیم میآید. «پدیده» مفعول غیرمستقیم را پیش از مفعول مستقیم آورده است. با این همه، ماشین در ترجمة جملة امری سادهای مثل: «Give me the book» با مشکل چندانی مواجه نبوده و آنرا به صورت «به من کتاب را بدهید» ترجمه میکند، هرچند در این مورد هم باید جای «کتاب را» و «به من» عوض شود.
گروه ۱۴. Nor در آغاز جملات، علامت تخفیف: احتمالاً به این برنامه، اطلاعات دستوری مناسب دربارة «nor» داده نشده است. ضمناً باید کلمات را به صورت کامل تایپ کرد و از تخفیف[۱۰] پرهیز نمود.
۳۱. I don’t like him, nor do I know him.
من تی ـ را میپوشانم به او علاقه داشته باشد، همچنین من او را حتماً بشناسم.
«پدیده» «don’t» را دو واژه به شمار میآورد؛ «don» را فعل و «t» را مفعول میداند و از اینرو در ترجمهاش عبارت «تی ـ را» مشاهده میشود. ضمناً نتوانسته درک کند که علت وارونهشدن توالی فاعل و فعل کمکی در «do I» تأکید نیست، بلکه به خاطر وجود «nor» است. برای جملة ۳۱ ترجمة زیر پیشنهاد میشود:
نه از او خوشم میآید و نه او را میشناسم.
گروه ۱۵. حروف تعریف معین و نامعین: یکی از کاربردهای حرف تعریف نامعین (a یا an) عام[۱۱]بودن آن است، یعنی به تمامی اعضای یک طبقه یا گروه دلالت میکنند.
یک بچه باید با ادب باشد.
۳۲. A child should be polite.
مجبوربودن کهنه بزرگ است.
۳۳. The old should be honored.
جملة ۳۲ دستوری است، اما کاربرد «یک» در آغاز جمله، غیرعادی است؛ یعنی ماشین ترجمه این نکته را نادیده گرفته که «a child» یعنی «تمام بچهها» و نه «یک بچه». در جملة ۳۳ نیز میبینیم که ترجمه ارائهشده کاملاً اشتباه، غیردستوری و بیمعنا است. شاید عامل این خطا، نبود اسم پس از صفت «old» باشد. درحقیقت «the old» یعنی «the old people»، ولی ماشین نتوانسته این قسمت حذف شده را ترمیم کند.
گروه ۱۶. نقلقول غیرمستقیم: جملة ۳۵ در انگلیسی نقلقول غیرمستقیم اخباری نامیده میشود. ترجمة ارائهشده توسط «پدیده» برای این جمله، غیردستوری و بیمعنا است.
۳۲. He said that he had gone to the cinema the day before.
او گفت او به سینما روز رفته بود قبلاً.
به نظر میرسد عامل اصلی بروز چنین مشکلی وجود عبارت «the day before» باشد. میدانیم که در تبدیل جملة خبری از مستقیم به غیرمستقیم واژة «yesterday» به «the day before» تبدیل میشود، ولی «پدیده» نتوانسته بین این دو ساختار متفاوت، رابطهای برقرار کند و درنتیجه ترجمة نادرستی را تولید کرده است.
گروه ۱۷. جملات شرطی بدون if : میدانیم که در جملات شرطی انگلیسی میتوان if را حذف کرد. در این حالت جای فعل کمکی و فاعل عوض میشود. مثلاً
«if I were you» به «were I you» تبدیل میشود و…
من ثروتمند بودم، من یک ماشین میخرم.
۳۶. Were I rich, I would buy a car.
ترجمة «پدیده» برای جملة فوق، غیردستوری و بیمعنا است. به نظر میرسد عامل بخشی از این اشکال، حذف if و جابهجایی فاعل (I) و فعل کمکی (were) باشد. ضمناً پدیده «would buy» را «میخرم» ترجمه کرده که نادرست است. درواقع جملة فوق جملة شرطی نوع دوم است و دربارة چیزی خلاف واقعیت صحبت میکند. مثلاً در جملة فوق، فرد ثروتمند نیست و بنابراین نمیتواند ماشین بخرد. برای جملة ۳۶ ترجمة زیر پیشنهاد میگردد: اگر ثروتمند بودم ماشین میخریدم.
گروه ۱۸. مالکیت: همانگونه که در گروه ۱۴ و مثال ۳۱ مشاهده گردید، «پدیده» don’t را دو واژه فرض کرد و بنابراین آن را به صورت فعل «don» و مفعول مستقیم «t» درنظر گرفت. در جملة ۳۷ نیز پدیده چنین اشتباهی را تکرار کرده است.
من به علی رفتم؟
۳۷. I went to Ali’s.
مشاهده میشود که «پدیده» نتوانسته بین «Ali’s» و «Ali’s house» رابطهای برقرار کند و بنابراین «to Ali» را عبارت «حرف اضافهای» فرض کرده و نتوانسته هویت «s» را مشخص سازد. برای جملة ۳۷ معادل زیر پیشنهاد میگردد: من به خانة علی رفتم.
مشکلات ماشین ترجمة «پدیده»
از جمله مهمترین دلایل بروز مشکلات ذکرشده برای «پدیده»، میتوان به موارد زیر اشاره کرد:
۱. این ماشین ترجمه نسبت به مخاطبان حساس نیست. گاهی مخاطبان یک متن را افراد عادی تشکیل میدهند و گاه افرادی متخصص و حرفهای. پدیده برای هر دو گروه به یک شکل ترجمه میکند؛
۲. «پدیده» در ترجمة متون تخصصی و محدود که موضوع و سبک خاصی را داشته باشند، موفق است، ولی در ترجمة متون عامتر دچار مشکل میباشد؛
۳. با گذشت زمان معنای واژهها تغییر میکند. به همین خاطر اصلاح مداوم برنامه و واژگان ماشین ترجمه ضروری است که البته نیازمند صرف هزینههای بسیار میباشد؛
۴. ماشین ترجمة «پدیده»، سخنگوی بومی یک زبان خاص نیست، از اینرو در برخورد با موقعیتهای جدید موفق نیست؛
۵ . تقسیمبندی و تحول واژهها در زبانهای مختلف یکسان نیست. مثلاً ممکن است دو مفهوم در یک زبان با یک واژه بیان شوند و در زبان دیگر با دو واژه. مثلاً واژة bank در زبان فارسی به معنای «حاشیة رودخانه» و «یک مرکز مالی» است، ولی در انگلیسی هر دو مفهوم توسط bank نشان داده میشود. یا در فارسی «ماهی» هم به معنای «موجودی زنده در آب» است و هم «نام یک غذا، مثل ماهی با پلو» و… ولی این دو مفهوم در اسپانیایی با دو واژة pez (ماهی زنده) و pescado (خوراک ماهی) نشان داده میشود.
ماشین ترجمة «پدیده» در تفکیک و تشخیص معانی مختلف یک واژه، بویژه واژههای همآوا ـ همنگاشت[۱۲] مشکل دارد.
سه اشکال عمده که اکثر ماشینهای ترجمه از جمله «پدیده» با آن مواجهاند عبارتاند از:
الف) ناتوانی اینگونه ماشینها در تمیز بین کاربردهای عام و تخصصی یک واژه. مثلاً bus در متون عام به معنای «اتوبوس» است، ولی در متون تخصصی مربوط به رایانه، به «بخشی از رایانه» اشاره دارد.
ب) ناتوانی در تمیز بین کاربردها و مفاهیم مختلف واژههای عام. مثلاً جملة «The pen is in the box» و «The box is in the pen» را درنظر بگیرید. Pen در جملة اول هم به معنای «وسیلهای برای نوشتن» (قلم داخل جعبه است) و هم به معنای «تخت بازی بچه که دور آن حصار چوبی یا … نیز کشیده میشود» (تخت بچه در جعبه است/ داخل بستهبندی میباشد). اما در جملة دوم یکی از این دو معنا نامربوط است. یعنی نمیتوانیم بگوییم «جعبه در خودکار است»، بلکه فقط میتوانیم بگوییم «جعبه روی تخت بچه است». ماشین ترجمه تنها در صورتی میتواند چنین جملاتی را درست ترجمه کندکه از اندازة نسبی اشیا نیز باخبر باشد.
ج) حساسنبودن به بافت و مخاطب.
اما ریشة اینگونه مشکلات در چیست؟ آیا به تئوری زبانی اشکالی وارد است؟
تئوری زبانی
تئوری زبانی غالب، بر روابط دستوری در جمله و نحو تأکید میکند. حتی در دستور جهانی، «چامسکی» نحو را خودکفا و مستقل از معنا میداند و بحث دربارة معنا را در حاشیه قرار میدهد. به نظر میرسد این نوع تئوری مبتنی بر نحو، عامل بخشی از مشکلات ماشینهای ترجمه باشد.
تئوری زبانی به بافت توجهی نمیکند و جملة منفرد را که توسط گوینده در محیط زبان آرمانی تولید میگردد و توسط شنونده درک میشود مبنای مطالعه قرار میدهد. باید اذعان کرد که دستور و نحو به تنهایی نمیتوانند رایانه را به تولید ترجمهای چون انسان مترجم وادارند. درواقع، به برنامهای نیاز است که همزمان به نحو و معنا بپردازد. ماشین ترجمه باید نسبت به معنا حساس باشد.
اما چگونه میتوان در ماشین ترجمه، نسبت به معنا حساسیت ایجاد کرد؟ برای انجام این کار لازم است در تئوریهای زبانی موجود و برنامة تعریفشده برای ماشینهای ترجمه، قدرت تعقل و تفکر را وارد کنیم. قدرت انتخاب و تعقل همان موهبتی است که انسان از آن برخوردار است. رایانه در انتخاب کاری که انجام میدهد آزاد نیست. این برنامه است که به ماشین میگوید چه کاری را انجام دهد و چه کاری را انجام ندهد. مهمتر از همه آنکه ماشین از درک کاری که انجام میدهد عاجز است. ویژگی مهم دیگر تعقل و تفکر آن است که همزمان میتواند در بیش از یک حوزه کار کند و فرد دارای قدرت تعقل بر این نکته واقف است که در مورد یک پدیده یا واقعیت، بیش از یک تفسیر ممکن است وجود داشته باشد.
نتیجهگیری
تعقل و تفکر اساس کار زبان انسان را تشکیل میدهد و ماشین فاقد آن است.
ریشة مشکلات امروزی ماشینهای ترجمه را باید در سه چیز جستجو کرد:
۱. برنامههای نادرست که به ماشین داده میشود و بیشتر آنها ناشی از کماطلاعی یا بیاطلاعی برنامهنویسان میباشد. ضمناً ضروری است برای داشتن برنامههای مناسب، در گروه برنامهنویسان، زبانشناسی مجرب نیز گنجانده شود تا با تحلیل ساختارهای مختلف زبان، الگوهای مناسب را برای تهیة برنامه در اختیار برنامهنویسان قرار دهد.
۲. با ضعف موجود در تئوری زبانی، طبیعی است که نمیتوان زبان را جدای از معنا بررسی کرد. حتی وقتی دربارة آواهای زبانی صحبت میکنیم، به معنا نیازمندیم (مثلاً جفتهای کمینه را برای تعیین واجهای زبان بهکار میبریم). بنابراین چنانچه تئوری زبانی به گونهای اصلاح گردد که معنا را نیز لحاظ کند میتوان بخش دیگری از مشکلات ماشینهای ترجمه را حل کرد. البته انجام چنین کاری بسیار دشوار، اما شدنی است.
۳. اگر بتوانیم به شکلی فقدان چنین قدرتی را ـ یعنی همان نعمتی را که خدا به ما عطا کرده ـ در اختیار ماشین قرار دهیم، (که البته دستیابی به این هدف بسیار بعید به نظر میرسد) مشکلات ماشینهای ترجمه را میتوان رفع نمود. بنابراین باید انتظار داشته باشیم که با توجه به دانش کنونی بشر، حتی در صورتی که مشکلات دستة اول و دوم رفع گردند، مشکلات دستة سوم به قوت خود باقی بمانند.
سؤالی که در اینجا میتوان مطرح کرد آن است که اگر به فرض بتوانیم چنین قدرتی را به ماشین بدهیم آیا خواهیم توانست هروقت که بخواهیم آن را از ماشین بازپس بگیریم؟ یا از ماشین بخواهیم که برخلاف میل و ارادة خود (که به خاطر داشتن قدرت تعقل، پیدا نموده) هر کاری را که ما بخواهیم، به انجام برساند؟ چنین وضعیتی را «رابینسون» (Robinson, Douglas, 1992) به خوبی به تصویر کشیده است. او مینویسد: اگر ماشین ترجمه بتواند مثل انسان ترجمه کند و از قدرت تعقل و تفکر برخوردار باشد، آیا ترجیح نخواهد داد صبح که از خواب برمیخیزد، به جای ترجمة متن تجاری یا … پای تلویزیون بنشیند و فیلم چارلی را تماشا کند؟!».
منابع
Borr, B. J. (1993). Machine Translation: a View from the Lexicon. Cambridge, Mass: MIT Press.
Dorr, B. J. (1994). “Machine Translation Divergences: A Formal Descriptipn and Proposed Solution”. Computational Linguistics 20 (4). PP 597-634.
Dreyfus, Hubert L. (1992). What Computers Still Can’t Do. Cambridge, MA: MIT Press.
Gerber, Laurie. Working toward Success in Machine Translation. http://www.elsnet.org/mt2010/gerber.pdf.
Hovy, E. H. and Nirenburg (1992). “Approximating an Interlingua in a principle Way”. Proceedings of the DARPA Speech and Natural Language Workshop. Arden House , NY.
Huchins, W.J. (1986). Machine Translation: past, Present, Future. Chichester: Ellis Horwood Publishing.
Kay, Martin. Machine Translation
http://www.isadc.org/kay.html.
Melby, Alan and C. Terry warner (1995). The possibility of Language: a discussion of the Nature of Language, with Implications for Human and Machine Translation. (in Press) Ams
[7] امامی م . بررسی مسایل درک متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه کارشناسی ارشد، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف.،۱۳۷۶.
[۸] صراف زاده ع. سمینار علمی ، آمفی تئاتر دانشکده مهندسی، ۱۳۸۹ .
[۹] Milestones in machine translation – No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins