ترجمه ماشینی مبتنی بر آنتولوژی – Ontology based translation machine
در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم ترینکارکردهای پردازش زبان های طبیعی می باشد، بیان می گردد. اجزای مورد نیاز در معماری ماشین های ترجمه بیان گردیده و روشهای موجود در ترجمه ماشینی از ابتدا تا به اکنون تشریح و مزایا و معایب هر کدام ذکر می گردد. در پایان نیز با تاکید بر روش ترجمه ماشینی مبتنی بر روش های آمارگرا، ترجمه ماشینی در زبان فارسی مورد بررسی قرار می گیرد. این مجموعه برای معرفی انواع پردازشهای موجود بر روی زبان های طبیعی و به خصوص ترجمه ماشینی متون، انواع روشهای موجود و روند پیشرفت و بهبود ماشین های ترجمه به پژوهشگرانی که هدفشان تحقیق در حوزه پردازش زبان و به خصوص ترجمه ماشینی است، کمک موثری باشد. در ضمن، به موانع موجود به خصوص در زمینه ترجمه ماشینی زبان فارسی اشاره گردیده و در خاتمه راه حل های پیشنهادی موجود برای بهبود ترجمه ماشینی و به ویژه برای زبان فارسی مورد بررسی قرار گرفته است.
واژه های کلیدی:
ترجمه ماشینی، روشهای آماری، پیکره، فارسی.
مقدمه
پردازش زبانهای طبیعی نقشی بسیار عمده و کلیدی به خصوص در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر ایفا می کند.
ترجمه خود کار متون، جزو اولین کاربردهای غیر محاسبه ای کامپیوتر است. ایده ترجمه ماشینی اولین بار در بحثی بین وارن ویور و آندره بوث شکل گرفت. مدل آنان بر اساس جداولی طراحی شده بود که در آنها برای رمز گشایی، از تواتر کلمات و حروف استفاده می شد.[۱]
با پیدایش تکنیک هایی چون جست و جوی دودوئی و روش تقلیل مسأله در الگوریتم های برنامه سازی و ایده ویرایش ثانویه در ترجمه، اعتقاد به عملی بودن ترجمه ماشینی قوت گرفت. در پایان دهه ۵۰ و اوایل ۶۰، COMIT به عنوان اولین زبان همه منظوره پردازش نماد مطرح شد و برنامه های کمکی واژه پرداز به مرحله پیاده سازی رسید. از سوی دیگر در زمینه زبان شناسی، نسبت به ساخت جملات زبان، دید الگوریتمیکی تحت عنوان دستور زبان گشتاری مطرح گردید.
نتیجه پروژه های دهه ۶۰ که بیشتر از آنها برای مقاصد سیاسی استفاده می شد، پیدایش دو شاخه اصلی در روش های ترجمه ماشینی بود. یکی از این روش ها استفاده از فرم های اصلاح شده دستور زبان گشتاری و دیگری استفاده از اطلاعات آماری در مورد نقش کلمات در جمله و ترجمه آنها بود. در پایان دهه ۷۰، اعتقاد عمومی بر آن بود که ترجمه ماشینی باید پیچیده تر از جابه جایی و جایگذاری کلمات زبان مبدا برای رسیدن به زبان مقصد باشد و ماشین باید به نوعی یک فهم از معنای هر دو نوشتار پیدا کند. این اعتقاد راه را برای استفاده از تکنیک های جدید هوش مصنوعی و به خصوص پردازش زبان طبیعی در ترجمه ماشینی هموار کرد و در این مدت شاهد پیشرفتهای چشمگیری در قلمرو ترجمه ماشینی و دستاوردهای متنوع جانبی آن بوده ایم. اهمیت این پدیده جدید و مقتضیات عصر ارتباطات و اطلاعات ایجاب کرده است که میزان سرمایه گذاری در این عرصه در سالهای گذشته بسیار چشمگیر باشد.
فایل فشرده حاوی دو فایل:
یک فایل PDF سمینار کارشناسی ارشد
ترجمه ماشینی مبتنی بر آنتولوژی
یک فایل PowerPoint سمینار کارشناسی ارشد
ترجمه ماشینی مبتنی بر آنتولوژی
لینک دو فایل PDF و فیلم ارائه ای درباره ترجمه ماشینی