دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
چهارشنبه , ۱۷ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> ابزارهای پردازش متن -> نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE

نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE

GATE یک نرم افزار پردازش متن است که توسط تیم طراحی دانشگاه Sheffield ساخته شده است. پردازشی که توسط این نرم افزار صورت می گیرد براساس اجزاء موجود در آن، به صورت ترتیبی، صورت می گیرد. لذا قابلیت این وجود دارد که بخش های مختلف توسط کاربران و برنامه نویسان توسعه یابد و بعنوان یک جزء جدا به آن اضافه شده و پس از اجرای پردازش توسط اجزاء قبلی بر روی متن اعمال شود. تفاوت هایی که می تواند مابین زبان های مختلف باشد باعث شده که این امکان در GATE فراهم شود که برخی از اجزاء ، مخصوصا برای هر زبان مشخص ، به صورت یک plugin جدا پیاده سازی شده و به آن اضافه شود. کاری که ما در این پروژه انجام می دهیم نوشتن یک plugin فارسی برای GATE می باشد. یکی از مهم ترین تفاوت هایی که بین زبان فارسی و سایر زبان ها مخصوصا عربی وجود دارد ، وجود اختلاف در نوع برخی کاراکتر ها مثل “الف” ، “ی” و “ک” بین این دو زبان می باشد که این اختلاف باعث ایجاد مشکل مخصوصا به هنگام جست و جوی کلمات می شود. لذا اضافه کردن یکسان ساز برای این plugin علاوه بر سایر اجزاء ضروی مثل قطعه بند و مبدل هم ضروری به نظر می رسد.

GATE یک ابزار بر پایه اجزاء می باشد.یک ابزار مناسب برای پژوهش های پردازش زبان های طبیعی و مهندسی متن. معماری چنین ابزار هایی نباید کاربران را محدود به استفاده با ترتیب خاصی از این اجزاء کند؛ امری که این نرم افزار به خوبی پشتیبانی می کند. GATE با استفاده از اجزاء سازگار Java Bean شرکت sun این امکان را فراهم می آورد.
اجزاء GATE از سه بخش تشکیل شده است :
۱. منابع زبانی که موجودیت ها را نشان می دهد همچون lexicon،corpora و ontology ها .
۲. منابع پردازشی که به صورت پایه ای بر اساس الگوریتم هستند.مانند parser،generatorها و ngram modeler ها.
۳. منابع دیداری که اجزاء دیداری و ویرایشی را که در قسمت واسط گرافیکی کاربری به کار برده می شوند.
در این مقاله به نحوه ی کار با هر یک از این بخش ها اشاره خواهد شد. همین طور به این که چگونه با استفاده از زبان jape بتوانیم گرامر های مخصوص خودمان را بنویسیم و متن مورد نظر را مطابق با هدف خودمان نشان گذاری بکنیم.همین طور plugin نوشته شده برای زبان فارسی نیز معرفی می شود. کاری که ما در این پروژه انجام می دهیم نوشتن یک plugin فارسی برای GATE می باشد. یکی از مهم ترین تفاوت هایی که بین زبان فارسی و سایر زبان ها مخصوصا عربی وجود دارد ، وجود اختلاف در نوع برخی کاراکتر ها مثل “الف” ، “ی” و “ک” بین این دو زبان می باشد که این اختلاف باعث ایجاد مشکل مخصوصا به هنگام جست و جوی کلمات می شود. لذا اضافه کردن یکسان ساز برای این plugin علاوه بر سایر اجزاء ضروی مثل قطعه بند و مبدل هم ضروری به نظر می رسد.

فایل ورد – ۵۵ صفحه

 

فهرست مطالب
۱. مقدمه ۱۱
۲. کارهای مرتبط ۱۲
۳. CREOLE مدلی از اجزاء GATE: 12
3.1CREOLE و WEB: 12
3.2چهار چوب GATE: 12
3.3چرخه منابع CREOLE: 13
3.4پردازش منابع و ابزار ها : ۱۳
۳.۵منابع زبانی و Data store ها : ۱۳
۳.۶منابع CREOLE در داخل نرم افزار: ۱۳
۳.۷Configuration منابع CREOLE: 14
3.8مجموعه های annotation: 25

4. JAPE: 28
4.1یک مثال ساده از JAPE برای طبقه بندی ورزش: ۲۸
۴.۲مثال شماره ۲: ۲۹
۴.۳مثال شماره ۳ : ۳۰
۴.۴مثال شماره ۴ : استفاده از ویژگی های POS برای استخراج موجودیت ها: ۳۳
۴.۵مثال شماره ۵: اولویت در قوانین JAPE 34
4.6استفاده از Macro ها برای موارد تکراری : ۳۷
۴.۷استفاده از عملگر منفی ساز در JAPE: 38
4.8استفاده از جاوا در قوانین RSH گرامر جاوا: ۳۹
۴.۹استفاده از یک فایل مشترک به عنوان نگهدارنده فایل های گرامر JAPE: 40
4.10یک مثال سخت تر برای استفاده از جاوا در قوانین RHS : 40
4.11استفاده از split برای کنترل استفاده قوانین برای یک جمله: ۴۳
۴.۱۲Co Referencing: 44
4.13ساختن annotation موقتی و پاک کردن آن در آخر در صورت نیاز نداشتن به آن: ۴۶
۴.۱۴ساختن موجودیت های جدید برای استفاده در گرامر JAPE: 46
5. FARSI PLUGIN: 47
5.1Gazetteer: 52
5.2Tokeniser: 53
6. جمع بندی و کارهای آینده ۵۴
۷. فهرست مراجع ۵۵

 

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

19 − 17 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/