دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
ترجمه ماشینی | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
شنبه , ۱۳ آذر ۱۳۹۵
آخرین مطالب
خانه -> فنى مهندسى -> ترجمه ماشینی – بخش سوم

ترجمه ماشینی – بخش سوم

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

در سال ۱۳۷۲، در آزمایشگاه پردازش زبان طبیعی داشنگاه صنعتی شریف، مهرنوش شمس فرد ( ۱۳۷۳ ) سامانه ای به نام دنا طراحی و پیاده نمود. در این سامانه با به کارگیری نظریه وابستگی مفهومی شنک ( ۱۹۷۵ )، جمله های فارسی به شبکه ای از مفهوم ها و روابط میان آنها تبدیل می شوند.
پس از آن پروژه های متعدد دیگری در حیطه¬ی زبان فارسی در موضوعات ذیل به انجام رسیدند:
پردازش نحوی جمله ها از جمله گروه های اسمی و جمله های مرکب، طراحی و پیاده سازی بخش واژگان و نیز ارکان ساختواژی، تقویت بخش استنتاج گر پروژه دنا، بررسی شیوه های بازنمایی معنا و انتخاب یک شیوه مناسب برای سامانه دنا ۲ و پروژه های دیگری که بر روی واکافت واژه ای، واکافت ساختواژی، واکافت نحوی و واکافت معنایی متمرکز شده بودند.
در یک تحقیق دیگر نیز  ماشینی کردن عمل ترجمه از یک زبان محاوره ای به زبان محاوره ای دیگر با قابلیت یادگیری ماشین به صورت خودکار مورد بررسی قرار گرفت. از آنجا که در این روش ترجمه، برای طراحی الگوریتم های ارائه شده جهت ایجاد پایگاه دانش و استنتاج دانش از آن از هیچ گونه اطلاعات پیش فرضی در زمینه چگونگی ساختار جملات زبان های مبدا و مقصد و نقش کلمات در جمله استفاده نشده است، مترجم حاضر مستقل از زبان های مبدا و مقصد، توانایی انجام عمل ترجمه از هر زبان به زبان دیگر را دارد.  [۷] در حال حاضر دکتر عبدالحسن صراف زاده (رئیس دانشکده کامپیوتر و فناوری اطلاعات دانشگاه یونیتک نیوزیلند) با بهره گیری از روشهای آماری، چندین سال است که بحث ترجمه ماشینی را در دانشگاه خود همراه با یک تیم تحقیقاتی دنبال می نمایند و به نتایج تقریبا قابل قبول و رضایت بخشی نیز نائل گردیده اند. موفقیت اصلی گروهی پژوهشی- تحقیقاتی ایشان بیشتر در بخش ترجمه ماشینی انگلیسی به فارسی بوده است چرا که پیکره بسیار عظیمی را مشتمل بر ۱۳ میلیون جمله در بخش پیکره تک زبانه خود به زبان فارسی یعنی در بخش نهایی (Persian monolingual corpuse) دارا می باشند و این امر باعث کسب نتایج بهتر آنان نسبت به ترجمه های گوگل میگردد. این در حالیست که گوگل دقیقا وضعیتی عکس این حالت دارد و متقابلا در ترجمه فارسی به انگلیسی بسیار قوی عمل می نماید. در حال حاضر در بخش (English-Persian parallel corpuse) تنها یک میلیون جمله وجود دارد که توسط نرم افزار Microsoft Aligner جمله به جمله و نظیر به نظیر align میشوند و افزایش هر چه بیشتر این پیکره نیز هر چند کاری دشوار و زمانبر است، باعث افزایش دقت ترجمه ماشینی ما خواهد شد. [۸] لذا مجددا  روش ترجمه ماشینی با بهره گیری از روشهای آماری به طور کامل تشریح می گردد:
ترجمه ی ماشینی آماری یکی از راه‌های ترجمه ی ماشینی است که در آن فرآیند ترجمه با مدل‌های آماری انجام می‌شود. این مدل‌های آماری با کمک آنالیز عبارات متنی دوزبانه است. روش آماری با روش ترجمه بر پایه دستور و ترجمه بر پایه نمونه در تضاد است. نخستین ایده ی ترجمه ی ماشینی آماری را وارن ویور در سال ۱۹۴۹ ارائه کرد که در آن نظریه اطلاعات کلود شانون را به کار بست. در سال ۱۹۹۱ این ایده توسط پژوهشگران ای بی ام در مرکز پژوهشی جی واتسون بازتعریف شد و سبب محبوبیت ترجمه ماشینی در سال‌های اخیر شده است. امروزه این روش بهترین و گسترده‌ترین روش ترجمه ی ماشینی است.
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکره‌های متنی دوزبانی استفاده می کنند. همانند پیکره کانادایی هانسارد (Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرم‌افزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آی‌بی‌ام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر ۲۰۰۷ به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیت‌های ترجمه خود را بوسیله دادن ۲۰۰ میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمه‌ها بهبود یافته است.[۹] اصول
ایده ترجمه ماشینی از نظریه اطلاعات سر برآورده است. سند (متن خواهان ترجمه) بر پایه احتمال(p(e|f ترجمه می‌شود که رشته ی e در زبان بومی (برای نمونه انگلیسی) ترجمه ی رشته ی f در زبان بیگانه (برای نمونه فرانسوی) است. معمولا، این احتمالات با استفاده از تکنیک‌های برآورد پارامتر برآورد می‌شوند.
مزیت‌ها
مهمترین مزیت‌های ترجمه ی ماشینی آماری در برابر روش‌های سنتی عبارتند از:
 بهره‌گیری بهتر از منابع
 حجم بسیاری از قالب ماشین خوان که در زبان طبیعی گفته می‌شود وجود دارد.
 معمولاً سامانه‌های ترجمه آماری مختص جفت زبان خاصی نیستند و بر هر جفت زبانی سازگارند.
 سامانه‌های ترجمه بر پایه دستور نیازمند توسعه دستی دستورهای زبان‌شناسی است که می‌تواند پرهزینه باشد و اغلب بر دیگر زبان‌ها سازگار نیست.
 ترجمه طبیعی‌تر (روان‌تر و نزدیک‌تر به گفتار)
موانع و مشکلات ترجمه ماشینی در زبان فارسی
مشکلات زبان فارسی که باعث ابهام در این زمینه ترجمه ماشینی می شود به ۳ دسته تقسیم می شود.   ۱-مشکلات رسم الخط فارسی: چون زبان فارسی از رسم الخط عربی استفاده می کند دارای مشکلاتی فراوان از جمله نداشتن حرکت یا آوای کوتاه(a,e,o) می باشد. همچنین رسم الخط فارسی به دلیل چسبیده بودن حروف به سختی قابل پارس کردن است. ۲- مشکلات نحوی زبان فارسی: نظیر مشکلات افعال و… ۳- استثناها: نظیر اصطلاحات و light verb و ….
در حقیقت در همة ترجمه‌ها ـ چه وقتی که از فارسی به انگلیسی و چه وقتی که از انگلیسی به فارسی صورت می‎گیرند ـ مشکلات وجود دارند. مثلاً اغلب می‎گویند تسلط به زبان مبداء و مقصد و موضوع ترجمه برای ترجمه کفایت می‎کند. به عبارتی دیگر تسلط زبانی کافی است. در حالی که اینگونه نیست و شرایط دیگری مورد نیاز هستند، شما باید تسلط فرهنگی و اجتماعی هم در کنار آن تسلط زبانی داشته‌ باشید. بنابراین مشکلات زبانی در همه جا خودشان را نشان می‎دهند. در انتخاب واژگان و معادل‎سازی نیز ما با مشکلات متعددی روبرو هستیم. اما اینکه این مشکلات و بعضاً ضعفها محسوس یا نامحسوس هستند، یک سخن دیگر است و در این باره هم نگرشهای مختلفی وجود دارند. وقتی که شما از انگلیسی به فارسی ترجمه می کنید یک گرته‎برداری به صورت بسیار رایج و انتقال ساختهای نحوی نارایج به زبان فارسی صورت می گیرد. بنابراین لازم است در ابتدا با اجزای اصلی مورد نیاز در تجزیه و تحلیل جملات برای ترجمه ماشینی آشنا شویم.
همان طور که در بالا توضیح داده شد،‌ مهمترین بخش یک سامانه مترجم ماشینی، تشخیص نقش کلمات در جمله و تشخیص معنای صحیح آنها با توجه به متنی است که آن کلمه در آن قرار گرفته است. برای تشخیص معنا ی صحیح کلمات از سه روش می توان استفاده نمود: در روش اول برای آموزش سامانه به یک مجموعه کلمات فارسی ابهام زدایی شده نیاز می باشد تا از روی آن بتوان عمل رفع ابهام برای کلمات جدید را در متن های مختلف انجام داد که متأسفانه هنوز این مجموعه به صورت یک فرهنگ فارسی قابل خواندن برای ماشین تهیه و تدوین نگردیده است. یعنی این اطلاعات به صورت دستی وجود دارند، اما نسخه رایانه ای از آنها با یک استاندارد معین برای تعریف هر کلمه و معنی و نقش های مختلف آن وجود ندارد. بدیهی است برای این کار ابتدا با ید با یک مرکز زبان شناسی معتبر، استاندارد ذخیره سازی اطلاعات و انواع آن را تدوین نماید و سپس نسخه ای رایانه ای از این اطلاعات جهت استفاده های بعدی تهیه شود.

در روش دوم نیز سامانه مستقیما از یک فرهنگ لغت استفاده می کند، باز هم در مورد زبان فارسی این مشکل وجود دارد که هنوز فرهنگ های لغت فارسی رایانه ای با یک استاندارد مشخص تهیه نشده اند. این در حالی است که در زبان انگلیسی فرهنگ های متعددی مانند net LDOCE, Word یا Roget’s International Thesaurus به صورت MRD یا نسخ قابل خواندن توسط رایانه وجود دارند که سامانه های مختلف مترجم ماشینی از آنها با یکی از روش های رفع ابهام مذکور بهره می جویند.

از روش سوم رفع ابهام نیز همان طور که دیده شد صرفا برای لغات خاص و محدود فنی یا پزشکی استفاده می شود، نه برای کلیه لغات فارسی و چون متأسفانه هنوز استفاده از اصطلاحات فنی فارسی متداول و رایج نشده است، این روش رفع ابهام در زبان فارسی زیاد موفق نخواهد بود. از این رو برای اینکه بتوان از یک مترجم قوی وبدون مشکل فارسی بهره مند شد، ابتدا باید مقدمات بر شمرده را فراهم نمود و این خود تلاش گروهی متشکل از زبان شناسان، مترجمان، ادیبان و متخصان رایانه را می طلبد که سرآغازی خواهد شد برای رسیدن به این هدف ملی.

آینده ترجمه ماشینی
اکنون بسیاری از صاحب نظران برآ نند که ارائه ترجمه خوب ، تنها با داشتن اشراف کامل به واژگان و قواعد نگارشی زبان های مبدأ و مقصد میسر نمی شود، بلکه نیازمند ادراک انسانی از مفاهیم گوناگونی می باشد که ماشین هرگز قادر به فهم آن نیست و نخواهد بود. از نظر برخی افراد، ماشین های ترجمه شفاهی، نرم افزارهای تبدیل کلام به آدمک های گرافیکی که به زبان اشاره صحبت می کنند و یا موبایل هایی که صحبت های شخص آن طرف خط را به زبان دیگر برمی گردانند شاید فقط در حد سرگرمی جلوه کند؛ لیکن از یاد نبریم که بسیاری از امکانات پیش پا افتاده و کاملا بدیهی زندگی امروزی ما یکصد سال پیش حتی به مخیله دانشمندان نیز راه پیدا نمی کرد.
همان طور که گفته شد منظور از ترجمه متن توسط ماشین ترجمه – به پشتوانه پیشرفت هایی که به ویژه در دهه اخیر در تحقق بخشیدن به این رؤیای پنجاه ساله به دست آمده است- فقط برگردان متن نوشتاری نیست، بلکه ترجمة نوشته به صوت، برگردان نوشته به نمایش گرافیکی زبان اشاره ، ترجمه صوت به صوت و یا ترجمه صوت به متن نیز- چه در داخل یک سیستم زبانی و چه به زبان دیگر- و وظایف دیگری از این دست نیز قرار است به عهده ماشین های مترجم گذاشته شود. به عنوان نمونه می توان به نوعی سیستم تلفن همراه طراحی شده توسط شرکت   NEC  اشاره کرد که برای ترجمه مکالمات تلفنی ژاپنی به انگلیسی طراحی شده است؛ یا از نرم افزارهایی یاد کرد(digital avatars)  که برای کمک به ناشنوایان و یا کم شنوایان طراحی شده و مراحل تکمیلی خود را می گذراند و قرار است بتواند آنچه را که میشنود با استفاده از تصویر آدمکی که با زبان اشاره صحبت می کند، به ناشنواها منتقل نماید.
جمع بندی و نتیجه گیری
فراگیری ترجمه ماشینی عبارت اند از: واکافت واژه ای، واکافت ساختواژی، واکافت نحوی، واکافت معنایی، تشخیص نقش کلمات در جمله، تشخیص معنای صحیح کلمات ( با توجه به جمله حاوی و رفع ابهام از کلمات دارای معنی مشابه و یافتن معنی معادل کلمه در زبان مقصد و تبدیل جمله زبان مبدا به جمله زبان مقصد با توجه به دستور زبان مقصد و در صورت نیاز اعمال گشتارهای مناسب برای تبدیل جملات مقصد به شکل روساختی آن ). در این راستا مهمترین بخش یک مترجم که دقت در آن باعث بالا رفتن دقت کل عمل ترجمه می گردد،‌ رفع ابهام معنایی از کلمات جملات زبان مبدا ونیز رفع ابهام از ترجمه آنها به زبان مقصد می باشد. برای رفع ابهام معنایی کلمات سه روش کلی وجود دارد که عبارت اند از: ( الف ) رفع ابهام با مربی، (‌ب ) رفع ابهام بر مبنای فرهنگ لغت، و ( ج ) رفع ابهام بدون مربی.
اما مشکل اصلی بر سر راه رفع ابهام از کلمات فارسی این است که اگر از دو روش اول استفاده شود، به یک نسخه رایانه ای از مجموعه لغات همراه بانقش های مختلفی که می توانند به خود بگیرند و معانی مختلفی که باتوجه به نقش های مختلف و یا همنشینی با کلمات مختلف به خود می گیرند، نیاز می باشد که متأسفانه این نسخه رایانه ای و همچنین استاندارد ذخیره سازی این دسته اطلاعات وجود ندارد که باید با کار گروهی متشکل از زبان شناسان، ادیبان و متخصصان رایانه ایجاد و جهت سیستم های مترجم زبان فارسی صورت بگیرد. استفاده از روش سوم رفع ابهام نیز خاص لغات فنی است که در زبان فارسی هنوز کاملا جا نیفتاده است . بنابراین با توجه به این که دقت در رفع ابهام از معنای کلمات، دقت مترجم را بالا می برد،‌ هنوز نمی توان سامانه های مترجم فارسی مناسب را تهیه و از آنها بهره برداری نمود.
پیشنهادات
اولا که بایستی واژگان معنایی (WordNet) بسیار عظیمی در اختیار داشته باشیم و همچنین با توجه به اضافه شدن لغات جدید در گذر زمان به هر زبان بایستی واژگان معنایی ما بروزرسانی شود و دائما گسترش داده شود.
بایستی توجه داشت که اگر حوزه ی موضوعی متن محدود و کنترل شده باشد، کیفیت ترجمه ماشینی اساساً بهتر خواهد شد.
علاوه بر این‌ وجود خطاهای‌ تایپی و یا املایی‌ و همچنین خطاهای نحوی و نگارشی در متن‌ می‌تواند در کار ترجمه ماشینی‌ ایجاد اختلال‌ کند. مترجمین‌ ورزیده‌ در رویارویی‌ با کلمات‌ ناشناخته‌ یا ساختارهای‌ پیچیده جملات‌، با مراجعه‌ به‌ منابع‌ معتبر و با بکارگیری تجربیات‌ و دانش‌ فردی و یا از طرق دیگر به‌ حل‌ مشکل‌ و مسأله‌ می ‌پردازند. در ترجمه‌ ماشینی  نیز باید در مقابل‌این‌ گونه‌ پدیده‌ها ساز و کار مناسبی طراحی نمود تا سیستم‌ به‌ ابزار‌ خاصی‌ مجهز باشد تا اختلالی در امر ترجمه‌ بوجود نیاید. بنابراین بایستی ابزارهای پیش پردازش و پس پردازش بسیار قدرتمندی طراحی گردد که متن را قبل از ورود به فاز ترجمه و همچنین خروجی نهایی را بهینه سازی و استاندارد نماید.

 نام مقاله:     انسان مترجم و ترجمة ماشینی: بررسی موردی مشکلات ماشین ترجمة انگلیسی به فارسی «پدیده»
نام نشریه:     فصلنامه کتابداری و اطلاع رسانی

شماره نشریه:     ۲۶ _ شماره دوم، جلد ۷
پدیدآور:     محمدرضا فلاحتی، آزاده نعمتی

  چکیده
هدف از نگارش این مقاله آن بود تا دست‌کم بخشی از مشکلات ترجمه ماشینی، مشخص و ریشه‌یابی گردد. یافته‌ها حاکی از آن بود که «پدیده» در حال حاضر دارای مشکلات فراوانی است که ریشة آن‌ها را در سه چیز می‌توان جستجو کرد: ۱) نبود زبانشناسان مجرب در گروه برنامه‌نویسان؛ ۲) نحوـ‌ محوربودن تئوری زبانی؛ ۳) نبود قدرت تعقل و تفکر در ماشین‌های ترجمه. ضمناً مشخص گردید که مشکلات نوع اول را می‌توان با به‌کارگیری نیروی متخصص رفع نمود. مشکلات نوع دوم با تجدیدنظر در تئوری زبانی و توجه به معنا قابل رفع است، اما- دست‌کم در شرایط کنونی- نمی‌توان قدرت تعقل و تفکر را به ماشین داد و بنابراین مشکلات مربوط به مورد ۳ قابل حل نیستند. با وجود این، نتیجه‌گیری شد که برای ترجمة متون اینترنتی و حجم زیادی از اطلاعات، بویژه وقتی هدف درک کلیات متن باشد، استفاده از ماشین به جای انسان هم راحت‌تر است و هم سریع‌تر و معقول‌تر.
کلیدواژه‌ها: ماشین ترجمه، ترجمة ماشینی، ترجمة انسانی، شیوة میان زبانی در ترجمة ماشینی، شیوة انتقال در ترجمة ماشینی، ماشین ترجمة «پدیده»، ترجمة انگلیسی‌ـ فارسی
مقدمه
در آغاز اجازه دهید دیدگاه‌های مختلفی را که دربارة بخش آغازین عنوان این مقاله وجود دارد، باهم مرور کنیم. در یک نگاه کلی سه دیدگاه مختلف درخصوص عنوان این مقاله هست: ۱) طرفداران نظریة نبود تفاوت بین انسان مترجم و ماشین ترجمه، ۲) طرفداران تفوق انسان مترجم بر ماشین ترجمه، و ۳) طرفداران تفوق ماشین ترجمه بر انسان مترجم.

برخی از صاحب‌نظران بر این باورند که در ترجمه، بین انسان و ماشین تفاوت چندانی وجود ندارد. آنان ضمن اقرار به مشکلات موجود در کار ماشین ترجمه و قبول عملکرد ضعیف آن نسبت به عملکرد مترجمان متخصص، اظهار می‌دارند که در آینده ماشین ترجمه از عملکردی بهتر برخوردار خواهد شد و در توجیه ادعای خود می‌گویند که در شرایط فعلی، رایانه‌ها در انجام امور محاسباتی و ریاضیات، نسبت به انسان از سرعت عمل بیشتری برخوردارند و به بیان دیگر انسان ابداً در این زمینه‌‍‌ها قادر نیست با ماشین رقابت کند. مثلاً تصور کنید که بخواهیم دو عدد ۱۲۳۹۴۷۶۵ و ۸۹۴۵۶۳۰ را در هم ضرب، حاصل را از ۴۴۳۹۵۴ کسر و نتیجه را بر ۱۲۴۵۹ تقسیم کنیم. مسلماً حتی با استفاده از کاغذ، انجام چنین کاری برای انسان چندین دقیقه به‌طول خواهد انجامید، درحالی که تمام این محاسبات را یک ماشین حساب ساده می‌تواند با دقت لازم و تنها در چند ثانیه به انجام برساند. این گروه از محققان، یادگیری ریاضیات را دشوارتر از یادگیری زبان می‌دانند و بر این نکته تأکید می‌کنند که در آینده‌ای نزدیک، رایانة جدیدی را خلق خواهند نمود که در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتی چون انسان برخوردار باشد.

طرفداران تفوق انسان مترجم بر ماشین ترجمه بر این باورند که چون عملکرد ذهن انسان با ماشین متفاوت است و ماشین از قدرت تصمیم‌گیری و انتخابی که انسان دارد، برخوردار نیست، هیچ‌گاه نخواهد توانست بهتر از انسان یا حتی مانند انسان به ترجمه و امور مربوط به آن بپردازد.

طرفداران تفوق ماشین ترجمه بر انسان مترجم نیز بر این باورند که مشکلات ماشین ترجمه سال‌ها پیش مرتفع‌شده و هم‌اکنون این‌گونه ماشین‌ها در ترجمة متون مختلف ـ یا دست‌کم انواعی از آن ـ با مشکلی مواجه نیستند و در آینده‌ای نزدیک خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.

در این مقاله و با ارائة مثال‌ها و بحث‌های مختلف نشان خواهیم داد که با توجه به پیشرفت‌های به‌دست آمدة کنونی در علوم، ماشین قادر نیست مانند انسان به ترجمه بپردازد. توجه داشته باشید که این گفته بدان معنان نیست که ماشین قادر به ترجمه نیست، بلکه بر کیفیت پایین‌تر ترجمة ماشینی در مقایسه با ترجمة انسانی تأکید دارد.

حال نگاهی گذرا به تاریخچة کارهای انجام‌گرفته در خصوص ماشین ترجمه داشته باشیم.

نگاهی کوتاه به تاریخچة ماشین ترجمه
امروزه در کتاب‌ها و مجلات معتبر دنیا مطالب فراوانی به چاپ می‌رسد که به موضوع ترجمه و ترجمة ماشینی مربوط است. «هاچینز» (Huchins, W.J. 1986) و «مل بای» و «تری» (Melby. Alan & Terry, Varner C., 1995) از جمله افرادی‌اند که به بررسی تاریخچة ماشین ترجمه پرداخته‌اند. «نیرنبرگ»(Nirenburg, S. 1986) موضوعات روش‌شناختی و نظری مرتبط با ماشین ترجمه را به تفصیل شرح می‌دهد. «کی»(kay, Martin) و «گربر» (Gerber, Laurie)می‌کوشند راه‌هایی را ارائه کنند که باعث بهبود کیفیت ترجمة ماشینی شود. «دور» (Dorr, B.J. 1993) نقش و مشکلات مربوط به واژگان را در ترجمة ماشینی موردبحث و بررسی قرار می‌دهد، «دری فاس» (Dreyfus, Hubert, 1992) به ناتوانی‌های رایانه در انجام برخی امور اشاره می‌کند، و…

کار بر روی ماشین ترجمه همزمان با اختراع رایانه در دهة ۱۹۴۰ آغاز شد. ماشین‌های ترجمة اولیه به‌این‌صورت طراحی شده بودند که برای ترجمة متون مختلف، مستقماً از یک واژه‌نامة دوزبانه استفاده می‌کردند. ترجمه نیز تنها به ترجمة واژگانی محدود می‌شد و از ترجمة ساختار نحوی زبان مبدأ یا مقصد نیز خبری نبود. این نوع روش ترجمه را مستقیم می‌نامیدند. با این همه در دهه ۱۹۸۰ چندین سامانة ترجمه به بازار عرضه شد که در ترجمه از روش غیرمستقیم استفاده می‌کردند. علت استفاده از لفظ غیرمستقیم صرفاً بدان علت است که این‌گونه ماشین‌ها متن را مستقیماً از زبان مبدأ به زبان مقصد ترجمه نمی‌کنند، بلکه ابتدا متن از زبان مبدأ به یک «میان‌زبان»[۳] و سپس به زبان مقصد ترجمه می‌شود؛ بنابراین، ترجمه در دو مرحله به انجام می‌رسد. در این‌گونه سیستم‌ها برنامه‌هایی تعبیه شده تا به شناسایی ساختار واژه و جمله، و واژه‌ها و عبارات مبهم بپردازند.

روش غیرمستقیم دارای انواعی است که از آن جمله می‌توان به دو شیوة «میان‌زبانی» و «انتقال»[۴] اشاره کرد. در ادامه به صورت اجمالی به معرفی این دو روش می‌پردازیم.

۱. روش‌های ترجمة میان‌زبانی و انتقال
۱ـ۱. روش انتقال: متن مبدأ ـ ـ تجزیه ـ ـ ساختار بینابینی متن مبدأ ـ ـ انتقال ـ ـ ساختار بینابینی متن مقصد ـ ـ ترکیب ـ ـ متن مقصد

۱ـ۲. روش میان‌زبانی: متن مبدأ ـ ـ تجزیه ـ ـ میان‌زبان ـ ـ ترکیب ـ ـ متن مقصد

در روش انتقال، ساختار بینابینی معمولاً کار تجزیه و تحلیل دستوری متن را برعهده دارد و هربار می‌تواند تنها یک جمله را بررسی کند. از سویی دیگر، روش میان‌زبانی، متن را بدون توجه به زبانی خاص مورد تجزیه و تحلیل قرار دهد. مزیت روش میان‌زبانی این است که می‌توان با صرف هزینه‌های نسبتاً پایین، زبان‌های جدیدی را نیز به ماشین ترجمه اضافه کرد. این کار صرفاً با استفاده از قوانینی تحقق می‌یابد که بین زبان جدید و «میان‌زبان» برقرار است.

اما در دیدگاه انتقال، حیطة کار این قوانین و قواعد، زبان جدید و دیگر زبان‌های موجود در ماشین ترجمه می‌باشد. در روش انتقال، تنها بین دو زبان مبدأ و مقصد مقایسه به عمل می‌آید. در این مقایسه، واحدهای واژگانی و ساختارهای نحوی دو زبان با هم مقایسه می‌شوند؛ سپس با استفاده از قواعد انطباقی سعی می‌شود ساختار بینابینی زبان مبدأ به ساختاری مشابه در زبان مقصد تبدیل شود (Tusjii, 1990). این قواعد همراه با دیگر اطلاعات معنایی و …، در لغتنامه‌ها یا پایگاه‌های دانش ذخیره می‌شوند. در شیوة انتقال، عمق و میزان تجزیه و تحلیل از پیش مشخص نیست، بلکه به میزان قرابت و نزدیک‌بودن دو زبان بستگی دارد: هرچه دو زبان به هم نزدیک‌تر باشند، از عمق تجزیه و تحلیل نیز به همان میزان کاسته خواهد شد.

اما برای این که بتوانیم به ترجمه‌ای کیفی دست یابیم، باید پا را از تجزیه و تحلیل نحوی یا تجزیه و تحلیل معنایی سطحی فراتر بگذاریم. برای انجام ترجمة کیفی، سیستم باید بتواند معنای واقعی جمله را نیز درک کند. مثلاً جملات ساده‌ای چون «دانش‌آموز امتحان داد» و «معلم امتحان گرفت» را در دو زبان فارسی و انگلیسی در نظر بگیرید. معادل این دو جمله در انگلیسی بدین قرارند:

The student took the test. The teacher gave the test

ماشین ترجمه باید بتواند این‌گونه جملات را نیز به خوبی درک کند و برای درک آن‌ها لازم است که درباة امتحان‌دادن و امتحان‌گرفتن در انگلیسی و فارسی اطلاعاتی داشته باشد. غالباً چنین اطلاعاتی در بخشی از سیستم به نام قالب‌های حالت[۵] ذخیره می‌شود. در این مرحله سیستم ترجمه برای شناسایی عناصر جمله به تجزیه و تحلیل معنایی، قواعد انتقال معنایی، و قواعد دیگری نیازمند است. تجزیه‌گر معنایی با استفاده از نمودار نحوی، قالب حالت را تولید می‌کند و مرحلة انتقال نیز «قالب حالت» استخراج شده از جمله در زبان مبدأ را به «قالب حالت» معادل در زبان مقصد تبدیل می‌کند.

اما در روش «میان‌زبانی» به تجزیه و تحلیل مفصل‌تری نیازمندیم. نتیجة این تجزیه و تحلیل یک بازنمود انتزاعی است که مستقل از زبان مبدأ است. مزیت این استقلال آن است که ترکیب اجزا و شکل‌گیری جملة معادل در زبان مقصد می‌تواند بدون شناخت زبان مبدأ صورت پذیرد. بنابراین در این روش، اطلاعاتی ممکن است به جمله اضافه شود که به صورت واضح و آشکار در جملة مبدأ وجود ندارد. البته افزودن اطلاعات بویژه اطلاعات معنایی و فرازبانی، کاری بس دشوار و وقتگیر است. اطلاعات معنایی غالباً در یک «پایگاه دانش» یا «واژه‌نامة مفهومی» ذخیره می‌شود. «نیرنبرگ» و دیگران (Nirenberg, J., Garbonell, J.c., Tomita, M; &Goodman, K., 1992) بر این باورند که از این نوع اطلاعات معنایی، در سیستم ترجمة «کی‌بی‌ام‌تی ـ ۸۹»[۶] و برای رسیدن به بازنمودی میان‌زبانی که عاری از ابهام نیز باشد استفاده شده است. برای رسیدن به این بازنمود میان‌زبانی، باید از چند مرحله گذشت: «کی‌بی‌ام‌تی ـ ۸۹» ابتدا و با استفاده از یک دستور نقش‌گرای واژگانی، تجزیه و تحلیل نحوی را آغاز می‌کند، سپس با استفاده از یک لغتنامة مفهومی، مدخل‌های واژگانی را به معادل‌های میان‌زبانی‌شان ترجمه می‌کند. در مرحلة بعد، پس از اعمال تغییرات ساختاری، ساختارهای میان‌زبانی حاصل می‌شوند و در پایان با ترکیب اجزا، بازسازی جمله در زبان مقصد محقق می‌شود.

همان‌گونه که پیشتر ذکر شد در روش میان‌زبانی، افزودن زبان جدید به ماشین ترجمه بسیار راحت‌تر از روش انتقال است. با این همه، تاکنون هیچ سیستم میان‌زبانی مطلوبی به بازار عرضه نشده و تمامی سیستم‌های ترجمة ماشینی میان‌زبانی که تاکنون طراحی شده‌اند، مراحل آزمایشی خود را سپری می‌کنند و از این رو حیطة کار آن‌ها از چند صد واژه یا چندهزار پیش‌نمونه، فراتر نمی‌رود. هرچند تحقیقات انجام گرفته در خصوص میان‌زبان اندک نبوده، اما هنوز روش مشخصی ارائه نشده تا با استفاده از آن بتوان به یک بازنمود معنایی مستقل از زبان دست یافت. البته، درخصوص امکان دست‌یابی به چنین بازنمودی نیز شک و تردید بسیار وجود دارد (Whorf, B.L., 1956; Nirenbuerg, S.et al., 1992; Hovy, E.H. & Nirenburg, J., 1992).

در سیستم‌های علمی، از روش انتقال بیشتر استفاده می‌شود، چون هم ساده‌تر است و هم نیازی به میان‌زبان ندارد. همین امر سبب گردیده تا این روش در مقایسه با روش میان‌زبانی از کارآیی بیشتری برخوردار باشد. به تازگی سعی شده با تلفیق روش‌ها و دیدگاه‌های مختلف موجود، سیستمی واحد و چندموتوره ارائه گردد. به نظر می‌رسد انجام این کار بسیار ساده باشد: جملات موردنظر برای ترجمه به چندین موتور ترجمة موازی فرستاده می‌شوند و در پایان، بروندادهای موتورهای مختلف با هم ترکیب می‌گردند و درنهایت، بهترین و مناسب‌ترین بخش‌ها انتخاب، و سپس در قالب جملات زبان مقصد، بازسازی و بازنویسی می‌شوند.

امروزه تقریباً تمام ماشین‌های ترجمه از یکی از سه روش گفته شده ـ مستقیم، غیرمستقیم (میان‌زبانی) یا انتقال ـ استفاده می‌کنند. مثلاً در ماشین‌های ترجمه «آریان»[۷] و «یوروترا»[۸] که توسط کمیسیون مجامع اروپایی» طراحی شده‌اند از روش انتقال استفاده شده است. در اواخر دهه ۱۹۸۰ در ژاپن برای زبان‌های آسیایی ماشین ترجمه‌ای ساخته شد که از روش میان‌زبانی استفاده می‌کرد، اما این پروژه با شکست مواجه شد و شاید دلیل عمدة این شکست را بتوان ساختار خاص و پیچیدگی‌های نوشتاری زبان‌هایی چون ژاپنی، چینی، و… دانست.

تا دهه ۱۹۹۰ چنین تصور می‌شد که ماشین‌های ترجمه باید در نهایت جایگزین انسان مترجم شوند و ترجمه‌هایی را تولید کنند که از قابلیت چاپ برخوردار باشند، اما چنین تصوری هم‌اکنون دچار تغییر و تحول شده است. امروزه دیگر هدف اصلی از ساخت ماشین‌های ترجمه، جایگزینی آن‌ها به‌جای انسان مترجم نیست، بلکه رسیدن به ترجمه‌های ارزان‌تر و سریعتر (آن‌هم در حجم بسیار زیاد)، هدف نهایی این‌گونه ماشین‌ها است.

در بخش بعدی به بررسی یکی از ماشین‌های ترجمة انگلیسی به فارسی خواهیم پرداخت که مدعی است در ترجمه، واحد «جمله» را مدنظر قرار می‌دهد و بنابراین از بسیاری از مشکلات ترجمة واژه‌به‌واژه به‌دور است.

ماشین ترجمه «پدیده»
ماشین‌های ترجمه‌ای که در بخش پیشین این مقاله دربارة آن‌ها صحبت کردیم، قادر نبودند متون انگلیسی را به فارسی ترجمه کنند، اما ماشین ترجمه «پدیده» از چنین قابلیتی برخوردار است. این ماشین ترجمه مدعی است که قادر است جملات را به‌گونه‌ای مطلوب ترجمه نماید. علاوه بر تایپ جملات یا متون موردنظر، می‌توان فایلی را که به فرمت «پی‌دی‌اف» یا متن[۹] باشد به ماشین داد و منتظر پاسخ ماند. این ماشین ترجمه ضمن بهره‌گیری از آخرین دستاوردهای هوش مصنوعی، قادر است ۴۰۰ صفحه را تنها در یک دقیقه ترجمه کند.

«پدیده» در بانک اطلاعاتی خود برای واژه‌ها و عبارات، ۰۰۰,۵۰۰,۱ مدخل دارد. هر مدخل معنای فارسی واژه، مفاهیم دستوری و چند عنصر دیگر را شامل می‌گردد. برای ترجمة یک جمله، این ماشین نخست آن را به واژه‌های تشکیل‌دهنده، عبارات و نمادها تقسیم و سپس نتایج به‌دست آمده را به واحدهای دستوری، واژگانی و واژه‌سازی ارسال می‌کند؛ سپس نتایج حاصله به یک موتور برونداد فرستاده می‌شوند. این موتور نهایی، مسئول تولید و ارائة ترجمة فارسی است.

سازندگان این ماشین می‌گویند در آینده‌ای نزدیک «پدیده» خواهد توانست متون مختلف را از فارسی به انگلیسی یا از زبان‌های دیگر به فارسی برگرداند.

عملکرد ماشین ترجمه «پدیده»
برای پی‌بردن به چگونگی عملکرد این ماشین ترجمه، محققان ۱۸ نوع مختلف از جملات انگلیسی را به عنوان نمونه وارد ماشین کردند و سپس به بررسی ترجمه‌های فارسی تولیدشده پرداختند.

در ادامه به بررسی گروه‌های هجده‌گانة جملات انگلیسی و ترجمه‌های حاصله می‌پردازیم.

گروه ۱. جملات ساده: جملات ۱ تا ۵ همگی جملات ساده‌اند. این جملات را ساده می‌نامیم چون در ساختارشان، اصطلاح ضرب‌المثل، استعاره، و … وجود ندارد و در ضمن دارای ساختار دستوری پیچیده‌ای نیستند، تنها دارای یک فعل‌اند، و…

من به سینما این آخر هفته خواهم‌رفت.
۱. I will go to the cinema this weekend.

او چه مژه‌های بلندی را دارد!
۲. What long eyelashes she has!

من به خدا ایمان دارم.
۳. I believe in God.

او روی میز رفت.
۴. He went on the table.

پدرش چه سنی است؟
۵. How old is his father

با نگاهی به جملات انگلیسی ۱ تا ۵ و ترجمه‌های فارسی تولیدشده به نتایج زیر می‌رسیم: ترجمة جمله ۱ کاملاً قابل‌فهم است، با این همه ترتیب اجزای جمله درست نیست. معمولاً در زبان فارسی قید زمان را در آغاز جمله می‌آورند و بنابراین بیشتر سخنوران فارسی به‌جای «من به سینما این آخر هفته خواهم رفت» می‌گویند «من این آخر هفته به سینما خواهم رفت» یا در گونه‌های محاوره‌ای «این آخر هفته می‌رم سینما». ترجمة ارائه‌شده برای جمله ۲ نیز کاملاً قابل درک است. اشکال این ترجمه وجود حرف «را» پس از واژه «بلندی» است که باید آن را حذف نمود (او چه مژه‌های بلندی دارد!). جملات ۳و۴ از نظر معنایی و دستوری کاملاً درست‌اند و نیاز به هیچ تغییر یا اصلاحی نیست. جمله ۵ نیز کاملاً قابل درک و دستوری است؛ با این همه، ساختار به‌کار گرفته‌شده در ترجمه، ساختاری کاملاً رایج به شمار نمی‌رود. معمولاً به‌جای «پدرش چه سنی است؟» می‌گوییم «پدرش چند ساله است» یا درگونه‌های محاوره‌ای «پدرش چند سالشه؟».

نگاهی دوباره به ترجمه‌های ارائه‌شده برای جملات ۱ تا ۵ نشان می‌دهد که این ماشین قادر است جملات ساده را با موفقیت ترجمه کند و اشکالات موجود، بیشتر اشکالاتی ساختاری‌اند و نه معنایی و بنابراین در امر ارتباط خللی ایجاد نمی‌کنند.

گروه ۲. اصطلاحات، ضرب‌المثل‌ها، و…: هریک از جملات ۶ تا ۱۳ در ساختار خود دارای نوعی اصطلاح، ضرب‌المثل، یا ساختاری مشابه‌اند. برای رسیدن به معنای درست این‌گونه جملات، انسان مترجم باید از پیش با چگونگی کاربرد آن‌ها آشنایی داشته باشد، چون معنای چنین جملاتی را نمی‌توان از جمع عددی معانی واژه‌های تشکیل‌دهندة آن‌ها مشخص کرد. مثلاً در جمله ۱۲ منظور نویسنده این نبوده که فردی دماغ بزرگ دارد، چرا که در آن صورت بایست از فعل has استفاده می‌کرد، بلکه منظور او این بوده که بگوید «او فرد بسیار مهمی است» یا «از آن کله‌گنده‌ها است».

من به ستون فقرات را خسته بودم.
۶. I was tired to the backbone.

پهنای اجازه دادن به پاهایمان.
۷. Let’s stretch our legs.

او یک پتوی خیس است.
۸. He is wet blanket.

او این روزهای بدهکار است.
۹. He is in the red These days.

او به سطل لگد زد.
۱۰. He kicked the bucket.

در حال بازی tennis فنجان چایی‌ام است.
۱۱. Playing tennis is my cup of tea.

او یک دماغ بزرگ است.
۱۲. He is a big nose.

او جیم شد.
۱۳. He took French leave.

در این گروه، ترجمه‌های ارائه‌شده برای جملات ۶، ۷ و ۱۱ کاملاً بی‌معنا و غیردستوری‌اند. ترجمه درست و البته پیشنهادی این سه جمله به ترتیب عبارت‌اند از:

۶. کاملا ًخسته بودم.

۷. بیایید کمی خستگی در کنیم یا کمی راه برویم.

۱۱. تنیس ورزش مورد علاقه‌ام است.

«پدیده» در ترجمه‌ای که برای جمله ۱۱ ارائه داده واژه tennis را ترجمه نکرده (که دلیل آن می‌تواند نبود معادل فارسی برای این واژه در واژگان ماشین ترجمه باشد). ضمناً نتوانسته اسم مصدر بودن playing را تشخیص دهد. از این‌رو، آن را به اشتباه فعل استمراری درنظر گرفته. علت بروز چنین اشکالی را باید در نقص برنامه‌های دستوری تعریف شده برای ماشین جستجو کرد.

جملات۸ ، ۱۰ و ۱۲ همگی دستوری‌اند، اما منظور اصلی گوینده یا نویسنده را نمی‌رسانند. جملات کاملاً تحت‌اللفظی ترجمه شده‌اند. به بیان دیگر، «پدیده» به معنای اصطلاحی این‌گونه جملات توجهی نکرده است. ترجمة پیشنهادی سه جملة بالا به قرار زیر هستند:

۸ . همیشه آیة یأس می‌خواند/ همیشه ضدحال می‌زند.

۱۰. او به درک واصل شد/ سقط شده.

۱۲. او فرد مهمی است/ از آن کله‌گنده‌ها است.

جملات ۹ و ۱۳ به درستی ترجمه شده‌اند، هرچند در جملة ۹ «ی» باید از آخر «روزها» حذف گردد (او این روزها بدهکار است).

بررسی ترجمه‌های ارائه‌شده در گروه ۲ نشان می‌دهد که «پدیده» در ترجمة ترکیبات اصطلاحی داری اشکال است، چرا که به‌جای معنای اصطلاحی، جز در جملة ۱۳ به معنای تحت‌اللفظی واژه‌ها توجه می‌کند.

گروه ۳. one: می‌دانیم که ضمیر جانشین اسم می‌شود. معمولاً در نوشتار یا گفتار برای جلوگیری از تکرار یک اسم، می‌توان از ضمیر مناسب استفاده کرد. در انگلیسی، یکی از موارد کاربرد one آن است که جلوی تکرار اسم را می‌گیرد، مانند جملة ۱۴. ضمناً one می‌تواند نقش ضمیر نامشخص را نیز بازی کند. مثلاً در جملة ۱۵، one را می‌توان «آدم» ترجمه کرد (که ممکن است به هر فردی اشاره داشته باشد). ترجمه‌های ارائه‌شده توسط ماشین برای این دو جمله عبارت‌اند از:

قدم اول مشکل‌ترین یک است.
۱۴. The first step is the most difficult one.

یک با دقت همیشه باید باشد.
۱۵. One should always be careful

در این مورد نیز می‌بینیم که «پدیده»،one را به‌صورت تحت‌اللفظی ترجمه کرده و نتوانسته کاربرد این واژه را در دو جمله تمیز دهد. برای این دو جمله ترجمه‌های زیر پیشنهاد می‌شوند:

۱۴. قدم اول مشکل‌ترین قدم است.

۱۵. آدم همیشه باید مواظب باشد.

One در جملة ۱۴ به «قدم» و در جملة ۱۵ به «تمام انسان‌ها» اشاره دارد.

گروه ۴. علائم اختصاری و اختصارات: جملات ۱۶ و۱۷ هر دو دارای علائم اختصاری‌اند (U.S. در جملة ۱۶ و US در جملة ۱۷). «پدیده» توانسته جملة ۱۶ را به درستی ترجمه کند، ولی در ترجمة جملة ۱۷ ناموفق بوده.

حکومت آمریکا
۱۶. The U.S. government

محرک غیرشرطی حکومت
۱۷. The US government

در اینجا املای کلمات نقش مهمی را ایفا می‌کند. از نظر «پدیده» «.U.S»، وقتی پس از هر حرف بزرگ نقطه‌ای وجود داشته باشد، به معنای آمریکا است، ولی «US» بدون نقطه به معنای «محرک غیرشرطی» (Unstimulated) است که به حوزة روانشناسی مربوط می‌شود. بنابراین در واردکردن اطلاعات به ماشین و رعایت املای درست کلمات باید دقت کنیم، چرا که برخلاف انسان، ماشین قادر نیست خطاهای املایی کلمات را تشخیص دهد. ضمناً ماشین به بافت و متن حساس نیست و از این‌رو متوجه نمی‌شود که «محرک غیرشرطی»، آن هم در جمله‌ای که به اخبار یا سیاست مربوط می‌شود، ترجمة درستی برای «US» نیست. ضمناً ماشین بین «US» که با حروف بزرگ نوشته شده و «us» (ضمیر مفعولی «We»;) تمایز قائل‌شده، و به همین دلیل به‌جای «محرک غیرشرطی» از ضمیر «ما» استفاده نکرده است.

گروه ۵. اسم مصدر و مصدر با to از فعل: دو جملة ۱۸ و ۱۹ هر دو دستوری‌اند، اما از نظر معنایی تنها جملة ۱۸ درست است.

او به یاد آورد در را قفل کند.
۱۸. He remembered to lock the door.

او در قفل‌شدنی را به یاد آورد.
۱۹. He remembered locking the door

جمله ۱۸ بدین معنا است که فرد، قبلاً در را قفل نکرده بوده، پس رفت ودر را قفل کرد. اما معنای جملة ۱۹ آن است که او قبلاً در را قفل کرده بوده و قفل‌کردن در را به‌خاطر آورده است. در جملة ۱۹ ماشین نتوانسته تحلیل نحوی درستی از جمله ارائه دهد. ماشین عبارت «locking the door» را با «the locking door» که یک گروه اسمی است یکی فرض کرده و چون این گروه اسمی پس از فعل آمده، آن را مفعول مستقیم دانسته. پس، از نظر ماشین «locking» صفت است و نه صورت «ing»دار فعل «lock». ترجمة درست جملة ۱۹ از این قرار است:

او به یاد آورد که در را قفل کرده بود.

گروه ۶. ضمایر: جملات ۲۰ و ۲۱، هر دو دستوری و بامعنایند. این بدان معنا است که «پدیده» می‌تواند بدرستی بین انواع مختلف ضمایر، از جمله ضمایر مفعولی و انعکاسی تمایز قائل شود.

او او را شست.
۲۰. He washed him.

او خودش را شست.
.۲۱. He washed himself

هرچند ترجمة ارائه‌شده توسط «پدیده» برای جملة ۲۰ درست است، با ترجمة ارائه‌شده توسط انسان مترجم یکی نیست؛ به‌این معنا که مترجمان غالباً به جای آن‌که ضمیر «او» را دوبار پشت سرهم بیاورند، به جای یکی از ضمیرها از طریق جستجوی در متن، اسم مناسب را جایگزین می‌کنند ـ مثلاً «علی او را شست» یا «او علی را شست». بنابراین می‌توان گفت که ماشین ترجمه قادر نیست از امکانات متن استفاده کند، یا به بیان دیگر، از حد جمله فراتر رود.

گروه ۷. واژه‌های هم‌آوا ـ هم‌نوشت: واژه‌های هم‌آوا ـ هم‌نوشت واژه‌هایی‌اند که دارای تلفظ و صورت نوشتاری یکسانی می‌باشند، مثل «شانه» که به وسیله‌ای برای مرتب‌کردن مو، عضوی از بدن، شانة تخم‌مرغ، قسمت خاکی جاده، و… اشاره می‌کند. بدیهی است بین معانی مختلف واژة هم‌آوا ـ هم‌نوشت ارتباطی وجود ندارد.

بانک یک رودخانه.
۲۲. The Bank of a river.

برای پی‌بردن به معنای موردنظر از واژة هم‌آوا ـ هم‌نوشت، توجه به متن و بافت ضروری است. ترجمة ارائه‌شده برای جملة ۲۲ نادرست است، چون «پدیده» قادر نیست از حد جمله فراتر رود. همین امر سبب شده تا به جای «حاشیة یک رودخانه»، «بانک یک رودخانه» را به عنوان معادل فارسی جملة ۲۲ ارائه دهد.

گروه ۸ . املا و فاصلة بین کلمات: ترجمة جملة ۲۳ و ۲۴ غیردستوری است. ترجمة ۲۴ بی‌معنا، و ترجمة جملة ۲۳ معنادار است، هرچند نیاز به اصلاحات ساختاری و واژگانی نیز دارد.

آیا رقص فرانسوی نشاط‌آور می‌توانید؟
۲۳. Can you cancan?

آیا می‌توانید کنسرو بکنید کنسرو بکنید؟
۲۴. Can you can can?

ماشین ترجمه برای این‌که بتواند برای جملات فوق ترجمة درستی ارائه دهد باید بتواند بین معانی مختلف «can» تمایز قائل شود. در جملة ۲۳ «can» در آغاز جمله فعل کمکی است، در حالی که «cancan» در آخر جمله به نوعی رقص اشاره دارد و فعل است. (توجه داشته باشید که در این مورد «cancan» بدون فاصله نوشته می‌شود. البته می‌توان به جای آن از «can the can» نیز استفاده کرد). نکتة جالب آن است که وقتی «cancan» را با فاصله و به صورت «can can» بنویسیم، دیگر ماشین ترجمه قادر نیست این عبارت را به صورت «رقص فرانسوی نشاط‌آور» ترجمه کند، بلکه هر یک از دو can موجود پس از you را جدا فرض می‌نماید و به کنسرو ترجمه می‌کند. بنابراین نگارش درست جملات در هنگام ورود اطلاعات به ماشین از اهمیت بسیاری برخوردار است. انسان‌های مترجم می‌توانند از طریق بررسی متن و بافت، اشکالات تایپی و املایی احتمالی را تشخیص دهند، منظور اصلی نویسنده را درک و ترجمه کنند، ولی ماشین از چنین قابلیتی برخوردار نیست.

گروه ۹. مقولة دستوری: در زبان، واژه‌های بسیاری وجود دارند که بسته به بافت و جایگاه، به مقوله‌های دستوری مختلفی تعلق دارند.

۲۵. Like you I don’t like him.

به شما علاقه‌ داشته باشید من تی ـ را می‌پوشانم به او علاقه داشته باشد.

در این جمله «like» قبل از you به معنای «مثل و مانند» است، درحالی‌که «like» پیش از him فعل است و به‌معنای «دوست‌داشتن». مشخص است که «پدیده» در تشخیص مقولة دستوری واژه‌هایی که به بیش از یک مقوله تعلق دارند، موفق نیست.

گروه ۱۰. اسامی ساده و مرکب: در انگلیسی به شیوه‌های مختلف می‌توان اسم مرکب ساخت. یکی از این شیوه‌ها آن است که اسم را با فعل ترکیب کنیم، یا دو اسم را به‌هم بپیوندیم.

میوه علاقه داشتن را هلو پرواز می‌کند.
۲۶. Fruit flies like peach.

در جملة ۲۶، «fruit flies» اسم مرکب است و به «مگس میوه» یا «حشرات میوه» اشاره دارد، بنابراین باید آن را اسم به حساب آوریم. از سویی دیگر، بدون نگاه‌کردن به بخش دوم یعنی «like peach» و محدودیت‌های معنایی در کاربرد یک واژه‌، ممکن است تصور کنیم که «fruit» فاعل است و مفرد، و «flies» فعل سوم‌شخص مفرد. اما وقتی بخش دوم جمله را نیز مدنظر قرار دهیم به این نتیجه می‌رسیم که فعل اصلی جمله «like» است و نه «flies» و درواقع آنچه پیش از «like» آمده اسم مرکب است و نه فاعل و فعل. «پدیده» به جای آن‌که «fruit flies» را اسم مرکب درنظر بگیرد، «fruit» را فاعل و «flies» را فعل اصلی درنظر گرفته است، از این‌رو «like» را که پس از «flies» آمده مفعول مستقیم و «peach» را متمم فرض کرده. بنابراین «پدیده» در زمینة اسامی مرکب نیز عاری از خطا نیست. ترجمة پیشنهادی جمله ۲۶ از این قرار است: مگس‌های میوه هلو را دوست دارند.

گروه ۱۱. جملات سببی: جمله‌های ۲۷ و ۲۸ هردو دستوری‌اند، با وجود این می‌توان معنای جمله و منظور اصلی گوینده را فهمید.

من ماشینم را داشتم شسته شده.
۲۷. I had my car washed.

دیروز من کوتاه‌کردن مویم را داشتم.
۲۸. I had my hair cut yesterday.

به نظر می‌رسد ساختار جملات سببی به خوبی برای «پدیده» تعریف نشده و فعل have و نقش آن در جملة سببی به درستی درک نشده است. از این‌رو به جای ترجمه‌هایی چون «ماشینم را دادم بشویند» و «دیروز رفتم سلمانی» یا «دیروز مویم را کوتاه کردم»، ترجمه‌های فوق تولیدشده است.

گروه ۱۲. توالی صفات: در گروه‌های اسمی می‌توان چندین صفت را پیش از اسم قرار داد که البته در مورد ترتیب قرار گرفتن آن‌ها قواعد خاصی وجود دارد. ضمناً در انگلیسی، فعل و فاعل از نظر عدد و شخص با هم مطابقت دارند.

دو بطری‌های چوبی قرمز بزرگ
۲۹. Two large red wooden bottles.

ترجمة جملة ۲۹ غیردستوری، اما قابل درک است. به راستی ترتیب واقعی صفات در زبان فارسی چگونه است؟ «پدیده» ترتیب صفات را از انگلیسی به فارسی کاملاً برعکس کرده، یعنی «large red wooden» را به «چوبی قرمز بزرگ» تبدیل نموده. نکتة دیگر این‌که «پدیده» مطابقت عدد با اسم را بدون تغییر، از انگلیسی وارد فارسی کرده است: برخلاف انگلیسی که در آن عدد با اسم مطابقت دارد، در فارسی اسم همواره مفرد است (یک سیب، دو سیب، سه سیب، و …)، و به نظر می‌رسد در این زمینه برنامة دستوری مناسب به ماشین داده نشده.

گروه۱۳. جملات امری: ترجمة جملة ۳۰، دستوری است، اما معنای موردنظر گوینده یا نویسنده را منتقل نمی‌کند.

همانجا به من کتاب را بدهید.
۳۰. Give me the book over there!

«پدیده» در ترجمة عبارت پایان (یعنی «over there»;) دچار اشتباه شده و آن را به جای «که آنجاست» به «همان‌جا» ترجمه کرده. ترجمة پیشنهادی این جمله از این قرار است: «کتابی را که آنجا است به من بدهید». ضمناً در فارسی معمولاً مفعول مستقیم پیش از متمم یا مفعول غیرمستقیم می‌آید. «پدیده» مفعول غیرمستقیم را پیش از مفعول مستقیم آورده است. با این همه، ماشین در ترجمة جملة امری ساده‌ای مثل: «Give me the book» با مشکل چندانی مواجه نبوده و آن‌را به صورت «به من کتاب را بدهید» ترجمه می‌کند، هرچند در این مورد هم باید جای «کتاب را» و «به من» عوض شود.

گروه ۱۴. Nor در آغاز جملات، علامت تخفیف: احتمالاً به این برنامه، اطلاعات دستوری مناسب دربارة «nor» داده نشده است. ضمناً باید کلمات را به صورت کامل تایپ کرد و از تخفیف[۱۰] پرهیز نمود.

۳۱. I don’t like him, nor do I know him.

من تی ـ را می‌پوشانم به او علاقه داشته باشد، همچنین من او را حتماً بشناسم.

«پدیده» «don’t» را دو واژه به شمار می‌آورد؛ «don» را فعل و «t» را مفعول می‌داند و از این‌رو در ترجمه‌اش عبارت «تی ـ را» مشاهده می‌شود. ضمناً نتوانسته درک کند که علت وارونه‌شدن توالی فاعل و فعل کمکی در «do I» تأکید نیست، بلکه به خاطر وجود «nor» است. برای جملة ۳۱ ترجمة زیر پیشنهاد می‌شود:

نه از او خوشم می‌آید و نه او را می‌شناسم.

گروه ۱۵. حروف تعریف معین و نامعین: یکی از کاربردهای حرف تعریف نامعین (a یا an) عام[۱۱]‌بودن آن‌ است، یعنی به تمامی اعضای یک طبقه یا گروه دلالت می‌کنند.

یک بچه باید با ادب باشد.
۳۲. A child should be polite.

مجبوربودن کهنه بزرگ است.
۳۳. The old should be honored.

جملة ۳۲ دستوری است، اما کاربرد «یک» در آغاز جمله، غیرعادی است؛ یعنی ماشین ترجمه این نکته را نادیده گرفته که «a child» یعنی «تمام بچه‌ها» و نه «یک بچه». در جملة ۳۳ نیز می‌بینیم که ترجمه ارائه‌شده کاملاً اشتباه، غیردستوری و بی‌معنا است. شاید عامل این خطا، نبود اسم پس از صفت «old» باشد. درحقیقت «the old» یعنی «the old people»، ولی ماشین نتوانسته این قسمت حذف شده را ترمیم کند.

گروه ۱۶. نقل‌قول غیرمستقیم: جملة ۳۵ در انگلیسی نقل‌قول غیرمستقیم اخباری نامیده می‌شود. ترجمة ارائه‌شده توسط «پدیده» برای این جمله، غیردستوری و بی‌معنا است.

۳۲. He said that he had gone to the cinema the day before.

او گفت او به سینما روز رفته بود قبلاً.

به نظر می‌رسد عامل اصلی بروز چنین مشکلی وجود عبارت «the day before» باشد. می‌دانیم که در تبدیل جملة خبری از مستقیم به غیرمستقیم واژة «yesterday» به «the day before» تبدیل می‌شود، ولی «پدیده» نتوانسته بین این دو ساختار متفاوت، رابطه‌ای برقرار کند و درنتیجه ترجمة نادرستی را تولید کرده است.

گروه ۱۷. جملات شرطی بدون if : می‌دانیم که در جملات شرطی انگلیسی می‌توان if را حذف کرد. در این حالت جای فعل کمکی و فاعل عوض می‌شود. مثلاً
«if I were you» به «were I you» تبدیل می‌شود و…

من ثروتمند بودم، من یک ماشین می‌خرم.
۳۶. Were I rich, I would buy a car.

ترجمة «پدیده» برای جملة فوق، غیردستوری و بی‌معنا است. به نظر می‌رسد عامل بخشی از این اشکال، حذف if و جابه‌جایی فاعل (I) و فعل کمکی (were) باشد. ضمناً پدیده «would buy» را «می‌خرم» ترجمه کرده که نادرست است. درواقع جملة فوق جملة شرطی نوع دوم است و دربارة چیزی خلاف واقعیت صحبت می‌کند. مثلاً در جملة فوق، فرد ثروتمند نیست و بنابراین نمی‌تواند ماشین بخرد. برای جملة ۳۶ ترجمة زیر پیشنهاد می‌گردد: اگر ثروتمند بودم ماشین می‌خریدم.

گروه ۱۸. مالکیت: همان‌گونه که در گروه ۱۴ و مثال ۳۱ مشاهده گردید، «پدیده» don’t را دو واژه فرض کرد و بنابراین آن را به صورت فعل «don» و مفعول مستقیم «t» درنظر گرفت. در جملة ۳۷ نیز پدیده چنین اشتباهی را تکرار کرده است.

من به علی رفتم؟
۳۷. I went to Ali’s.

مشاهده می‌شود که «پدیده» نتوانسته بین «Ali’s» و «Ali’s house» رابطه‌ای برقرار کند و بنابراین «to Ali» را عبارت «حرف اضافه‌ای» فرض کرده و نتوانسته هویت «s» را مشخص سازد. برای جملة ۳۷ معادل زیر پیشنهاد می‌گردد: من به خانة علی رفتم.

مشکلات ماشین ترجمة «پدیده»
از جمله مهم‌ترین دلایل بروز مشکلات ذکرشده برای «پدیده»، می‌توان به موارد زیر اشاره کرد:

۱. این ماشین ترجمه نسبت به مخاطبان حساس نیست. گاهی مخاطبان یک متن را افراد عادی تشکیل می‌دهند و گاه افرادی متخصص و حرفه‌ای. پدیده برای هر دو گروه به یک شکل ترجمه می‌کند؛

۲. «پدیده» در ترجمة متون تخصصی و محدود که موضوع و سبک خاصی را داشته باشند، موفق است، ولی در ترجمة متون عام‌تر دچار مشکل می‌باشد؛

۳. با گذشت زمان معنای واژه‌ها تغییر می‌کند. به همین خاطر اصلاح مداوم برنامه و واژگان ماشین ترجمه ضروری است که البته نیازمند صرف هزینه‌های بسیار می‌باشد؛

۴. ماشین ترجمة «پدیده»، سخنگوی بومی یک زبان خاص نیست، از این‌رو در برخورد با موقعیت‌های جدید موفق نیست؛

۵ . تقسیم‌بندی و تحول واژه‌ها در زبان‌های مختلف یکسان نیست. مثلاً ممکن است دو مفهوم در یک زبان با یک واژه بیان شوند و در زبان دیگر با دو واژه. مثلاً واژة bank در زبان فارسی به معنای «حاشیة رودخانه» و «یک مرکز مالی» است، ولی در انگلیسی هر دو مفهوم توسط bank نشان داده می‌شود. یا در فارسی «ماهی» هم به معنای «موجودی زنده در آب» است و هم «نام یک غذا، مثل ماهی با پلو» و… ولی این دو مفهوم در اسپانیایی با دو واژة pez (ماهی زنده) و pescado (خوراک ماهی) نشان داده می‌شود.

ماشین ترجمة «پدیده» در تفکیک و تشخیص معانی مختلف یک واژه، بویژه واژه‌های هم‌آوا ـ هم‌نگاشت[۱۲] مشکل دارد.

سه اشکال عمده که اکثر ماشین‌های ترجمه از جمله «پدیده» با آن مواجه‌اند عبارت‌اند از:

الف) ناتوانی این‌گونه ماشین‌ها در تمیز بین کاربردهای عام و تخصصی یک واژه. مثلاً bus در متون عام به معنای «اتوبوس» است، ولی در متون تخصصی مربوط به رایانه، به «بخشی از رایانه» اشاره دارد.

ب) ناتوانی در تمیز بین کاربردها و مفاهیم مختلف واژه‌های عام. مثلاً جملة «The pen is in the box» و «The box is in the pen» را درنظر بگیرید. Pen در جملة اول هم به معنای «وسیله‌ای برای نوشتن» (قلم داخل جعبه است) و هم به معنای «تخت بازی بچه که دور آن حصار چوبی یا … نیز کشیده می‌شود» (تخت بچه در جعبه است/ داخل بسته‌بندی می‌باشد). اما در جملة دوم یکی از این دو معنا نامربوط است. یعنی نمی‌توانیم بگوییم «جعبه در خودکار است»، بلکه فقط می‌توانیم بگوییم «جعبه روی تخت بچه است». ماشین ترجمه تنها در صورتی می‌تواند چنین جملاتی را درست ترجمه کندکه از اندازة نسبی اشیا نیز باخبر باشد.

ج) حساس‌نبودن به بافت و مخاطب.

اما ریشة این‌گونه مشکلات در چیست؟ آیا به تئوری زبانی اشکالی وارد است؟

تئوری زبانی
تئوری زبانی غالب، بر روابط دستوری در جمله و نحو تأکید می‌کند. حتی در دستور جهانی، «چامسکی» نحو را خودکفا و مستقل از معنا می‌داند و بحث دربارة معنا را در حاشیه قرار می‌دهد. به نظر می‌رسد این نوع تئوری مبتنی بر نحو، عامل بخشی از مشکلات ماشین‌های ترجمه باشد.

تئوری زبانی به بافت توجهی نمی‌کند و جملة منفرد را که توسط گوینده در محیط زبان آرمانی تولید می‌گردد و توسط شنونده درک می‌شود مبنای مطالعه قرار می‌دهد. باید اذعان کرد که دستور و نحو به تنهایی نمی‌توانند رایانه را به تولید ترجمه‌ای چون انسان مترجم وادارند. درواقع، به برنامه‌ای نیاز است که همزمان به نحو و معنا بپردازد. ماشین ترجمه باید نسبت به معنا حساس باشد.

اما چگونه می‌توان در ماشین ترجمه، نسبت به معنا حساسیت ایجاد کرد؟ برای انجام این کار لازم است در تئوری‌های زبانی موجود و برنامة تعریف‌شده برای ماشین‌‌های ترجمه، قدرت تعقل و تفکر را وارد کنیم. قدرت انتخاب و تعقل همان موهبتی است که انسان از آن برخوردار است. رایانه در انتخاب کاری که انجام می‌دهد آزاد نیست. این برنامه است که به ماشین می‌گوید چه کاری را انجام دهد و چه کاری را انجام ندهد. مهم‌تر از همه آ‌ن‌که ماشین از درک کاری که انجام می‌دهد عاجز است. ویژگی مهم دیگر تعقل و تفکر آن است که همزمان می‌تواند در بیش از یک حوزه کار کند و فرد دارای قدرت تعقل بر این نکته واقف است که در مورد یک پدیده یا واقعیت، بیش از یک تفسیر ممکن است وجود داشته باشد.

نتیجه‌گیری
تعقل و تفکر اساس کار زبان انسان را تشکیل می‌دهد و ماشین فاقد آن است.

ریشة مشکلات امروزی ماشین‌های ترجمه را باید در سه چیز جستجو کرد:

۱. برنامه‌های نادرست که به ماشین داده می‌شود و بیشتر آن‌ها ناشی از کم‌اطلاعی یا بی‌اطلاعی برنامه‌نویسان می‌باشد. ضمناً ضروری است برای داشتن برنامه‌های مناسب، در گروه برنامه‌نویسان، زبانشناسی مجرب نیز گنجانده شود تا با تحلیل ساختارهای مختلف زبان، الگوهای مناسب را برای تهیة برنامه در اختیار برنامه‌نویسان قرار دهد.

۲. با ضعف موجود در تئوری زبانی، طبیعی است که نمی‌توان زبان را جدای از معنا بررسی کرد. حتی وقتی دربارة آواهای زبانی صحبت می‌کنیم، به معنا نیازمندیم (مثلاً جفت‌های کمینه را برای تعیین واج‌های زبان به‌کار می‌بریم). بنابراین چنانچه تئوری زبانی به گونه‌ای اصلاح گردد که معنا را نیز لحاظ کند می‌توان بخش دیگری از مشکلات ماشین‌های ترجمه را حل کرد. البته انجام چنین کاری بسیار دشوار، اما شدنی است.

۳. اگر بتوانیم به شکلی فقدان چنین قدرتی را ـ یعنی همان نعمتی را که خدا به ما عطا کرده ـ در اختیار ماشین قرار دهیم، (که البته دستیابی به این هدف بسیار بعید به نظر می‌رسد) مشکلات ماشین‌های ترجمه را می‌توان رفع نمود. بنابراین باید انتظار داشته باشیم که با توجه به دانش کنونی بشر، حتی در صورتی که مشکلات دستة اول و دوم رفع گردند، مشکلات دستة سوم به قوت خود باقی بمانند.

سؤالی که در اینجا می‌توان مطرح کرد آن است که اگر به فرض بتوانیم چنین قدرتی را به ماشین بدهیم آیا خواهیم توانست هروقت که بخواهیم آن را از ماشین بازپس بگیریم؟ یا از ماشین بخواهیم که برخلاف میل و ارادة خود (که به خاطر داشتن قدرت تعقل، پیدا نموده) هر کاری را که ما بخواهیم، به انجام برساند؟ چنین وضعیتی را «رابینسون» (Robinson, Douglas, 1992) به خوبی به تصویر کشیده است. او می‌نویسد: اگر ماشین ترجمه بتواند مثل انسان ترجمه کند و از قدرت تعقل و تفکر برخوردار باشد، آیا ترجیح نخواهد داد صبح که از خواب برمی‌خیزد، به جای ترجمة متن تجاری یا … پای تلویزیون بنشیند و فیلم چارلی را تماشا کند؟!».

منابع

Borr, B. J. (1993). Machine Translation: a View from the Lexicon. Cambridge, Mass: MIT Press.

Dorr, B. J. (1994). “Machine Translation Divergences: A Formal Descriptipn and Proposed Solution”. Computational Linguistics 20 (4). PP 597-634.

Dreyfus, Hubert L. (1992). What Computers Still Can’t Do. Cambridge, MA: MIT Press.

Gerber, Laurie. Working toward Success in Machine Translation. http://www.elsnet.org/mt2010/gerber.pdf.

Hovy, E. H. and Nirenburg (1992). “Approximating an Interlingua in a principle Way”. Proceedings of the DARPA Speech and Natural Language Workshop. Arden House , NY.

Huchins, W.J. (1986). Machine Translation: past, Present, Future. Chichester: Ellis Horwood Publishing.

Kay, Martin. Machine Translation

http://www.isadc.org/kay.html.

Melby, Alan and C. Terry warner (1995). The possibility of Language: a discussion of the Nature of Language, with Implications for Human and Machine Translation. (in Press) Ams

[7] امامی م . بررسی مسایل درک متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه کارشناسی ارشد، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف.،۱۳۷۶.
[۸]  صراف زاده ع. سمینار علمی ، آمفی تئاتر دانشکده مهندسی، ۱۳۸۹ .

[۹] Milestones in machine translation – No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

ده − 5 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/