دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
فارس نت (وردنت عمومی زبان فارسی) | فارس نت (وردنت عمومی زبان فارسی)"/>
طبقه بندی موضوعات
جستجوی کلمات کلیدی
پنج‌شنبه , 18 آگوست 2022
آخرین مطالب
خانه -> دانلود -> فارس نت (وردنت عمومی زبان فارسی)

فارس نت (وردنت عمومی زبان فارسی)

نخستین شبكه ­ی واژگان زبان فارسی تحت عنوان فارس­نت (وردنت عمومی زبان فارسی)  با حمایت مرکز تحقیقات مخابرات ایران در پژوهشكده­ی IT پژوهشگاه فضای مجازی و با همكاری متخصصان از هر دو حوزه­ی رایانه و زبان شناسی دانشگاه شهید بهشتی تهیه گردیده است. در واقع هدف ایجاد فارس­نت، ايجاد يک شاخه­ی فارسي براي Word Net است که در تحقيقات و پژوهش­هاي زبان فارسي قابل استفاده باشد و امکانات تبديل چند زبانه را نيز فراهم کند. فارس­نت در تاریخ ۲۱ فروردین ۱۳۹۲در سایت مرجع دادگان زبان فارسی ثبت گردیده است و از طریق همین سایت قابل دستیابی می­باشد. کلیه­ی اطلاعات و توضیحات مربوط به روال تولید فارس­نت که زیر نظر دکتر مهرنوش شمس فرد، عضو هیأت علمی دانشگاه شهید بهشتی انجام گردیده در مقاله­ای آورده شده است.

این پایگاه دانش كه حاوی اطلاعات درمورد واژه‌ها و ترکیبات زبان (مفاهیم)، اطلاعات نحوی آنها و روابط معنایی میان آنها است در دو نسخه از طریق آدرس http://nlp.sbu.ac.ir:8080/farsnet  قابل دسترسی می‌باشد.

نسخۀ اول فارس­نت شامل بیش از 17هزار مدخل واژگانی از مقوله‌های اسم، فعل و صفت است که در قالب 10 هزار مجموعه مترادف بیان گردیده است، همچنین روابط تحت پوشش آن، روابط درون مقوله‌ای مطرح در وردنت انگلیسی (نسخه 2.1) می‌باشد و  قابلیت اتصال به وردنت‌های دیگر از طریق نگاشت به وردنت پرینستون نسخۀ 3.0 را نیز داراست.

نسخۀ دوم فارس­نت نیز كه توسعه‌یافتۀ نسخه اول است برای كاربردهای پژوهشی به صورت رایگان در اختیار پژوهشگران قرار دارد و شامل بیش از 30هزار مدخل واژگانی از مقوله‌های اسم، فعل، صفت و قید می‌باشد. در این نسخه علاوه بر روابط درون مقوله‌ای مطرح در وردنت انگلیسی (نسخۀ 2.1)  پنج رابطۀ میان مقوله‌ای نیز مفاهیم را به هم پیوند می‌دهد و علاوه بر ویژگی‌های درنظر گرفته شده برای واژه‌ها، ویژگی‌های نحوی، ساخت‌واژی و آوایی به واژه‌ها و قاب و ساختار آرگومانی به افعال افزوده شده است. همچنین این وردنت همانند نسخه­ی قبل، قابلیت اتصال به وردنت‌های دیگر از طریق نگاشت به وردنت پرینستون نسخۀ 3.0 را نیز داراست.

شبکه واژگان فارس­نت دارای سه پایگاه داده می­باشد:

  1. پایگاه داده مفهوم­ها: هر مفهوم دارای «شناسه»، «جمله تعریف»، «جمله مثال» و مجموعه «شناسه کلمه» بیان­کننده مفهوم می­باشد
  2. پایگاه داده کلمات: هر کلمه دارای «شناسه»، «نوع کلمه» (اسم،فعل،صفت) و «نام کلمه» می­باشد.
  3. پایگاه داده روابط بین مفهوم­ها: روابط بین مفهوم­ها از طریق «شماره شناسه» دو مفهوم و «نوع رابطه» بیان می­شود.

در شبکه واژگان فارس­نت هشت نوع رابطه بین مفهوم­ها وجود دارد که عبارتند از:

– Holonym (member of)

– Holonym(part of)

– Holonym(portion of)

– Antonym

– Causes

– Hypernym

– Hyponym

– Sysnonym

 

در روال تولید فارس­نت، سه مرحله­ی اولیه وجود دارد که با استفاده از روش نیمه اتوماتیک و تهیه­ی ساختارهای جدید سعی شده است روابط هم­معنا به صورت دقیق و بدون سوگیری به زبان انگلیسی فراهم، و همه­ی مفاهیم پایه به زبان فارسی استخراج گردد. چهار محور اصلی در خودکارسازی این پروژه دخیل بوده است. این مراحل شامل: نگاشت نیمه خودکار کلمات در وردنت انگلیسی، استخراج خودکار روابط از پیکره وب، دسته­بندی نیمه خودکار سه فاز و ایجاد رابطه تضاد بین آنها و مرحله­ی آخر، انجام آزمون­های ارزیابی می­باشد.

از جمله کارهایی که انجام شده است، نگارش متن فارسی در ورد نت فارسی با اتصال به ورد نت انگلیسی بود؛ چون مواردی که در وردنت فارسی هست، در ورد نت انگلیسی هم است. مسأله مورد توجه این است که گفته می شود این Synsets (مجموعه مترادف ها) در زبان انگلیسی معادل Synset آن در زبان فارسی است.

این کار قاعدتا با کمک زبان­شناسان متخصص انجام شده و با توجه به اینکه کاری زمان بر بود، نتیجه­ی حاصل از آن تهیه­ی ابزار واژه­نگار بود. طرح نگاشت نیمه خودکار در دو فاز انجام شد؛ به این صورت که کلمات هم­معنا به زبان انگلیسی وصل و در نهایت نزدیکترین Sysnset به لغت مورد نظر تعیین می­شد که در این راستا تعدادی واژگان کاندیدا وجود داشت و به ترتیب احتمال نگارش مرتب شد.

مرحله بعد تبدیل Sysnsetهای فارسی به Sysnsetهای انگلیسی نگاشته شده است که با استفاده از سیستم ترجمه و کاربرد فرهنگ لغت­ها، این کار با نگاشت کلمات انجام می­شد و برای تهیه  قسمتی از سلسله مراتب اسامی نیز به صورت دستی ساخته شد تا بتوان از آن استفاده کرد. در واقع یک کلمه که احتمال نگاشت آن به شکل­های مختلف وجود دارد در یک سیستم قرار می­گیرد که می­توان آن را توسط  nسیستم دیگر نیز نگاشت.

یکی از مشکلات نگاشت، وجود یا عدم وجود یک مفهوم در هر دو ورد نت فارسی و زبان انگلیسی است، و مسأله­ی دیگر وجود سطوح جزئی­سازی در فرایند دو وردنت است که نگاشت­ها در بعضی موارد یک به یک نیستند و در برخی موارد نیز نگاشت صورت گرفته است.

از زمینه های دیگر که به صورت نیمه خودکار انجام شد، استخراج و دسته­بندی نیمه خودکار صفت­ها و استخراج رابطه­ی تضاد بین آنها بود که در این رابطه­ی تضاد، یک سری قوانین رابطه مورفولوژی تضاد ایجاد می­شد و با این کار تضاد در سطح واژه شناسایی و با تایید زبانشناسان به سیستم افزوده شد.

یک بخش از شبکه واژگان فارسی، استخراج خودکار روابط مفهومی است که عمده منابع مورد استفاده در این کار، فرهنگ­های دو زبانه یا دیکشنری (پیکره) است و با چهار رویکرد اساسی؛ مبتنی بر الگو، روش های ساختاری، روش آماری و روش مبتنی بر شباهت استخراج خودکار روابط انجام شد.

در تهیه ورد نت فارسی، تمام مراحل اشاره شده در فوق به صورت نیمه خودکار انجام گرفتند و ما بقی روش­ها به صورت دستی و به کمک زبانشناسان متخصص انجام شده است. در راستای این فعالیت ها یک ویرایشگر نیز برای ورد نت فارسی فراهم شد که در قالب وب ارائه می­شود و افراد می­توانند با استفاده از نام کاربری و کلمه عبور مشخص، کلمه مورد نظر را در سیستم وارد کنند و از موارد یافت شده توسط وردنت استفاده کنند.

یک سیستم تحت آزمون و ارزیابی نیز تهیه شده است و صحت داده­ها بر اساس کتاب­های مرجع تطبیق داده شده و برخی نیز بر اساس شم  زبانی متخصص تعیین شدند. از جمله قابلیت­های فارس­نت، امکان جستجوی دو زبانه در آن است و در تکمیل ورد نت فارسی سطح پوشش واژگان در حال افزایش است.

در واقع فارس نت (وردنت عمومی زبان فارسی) پایگاه دانشی است كه حاوی اطلاعات درمورد واژه‌ها و ترکیبات زبان (مفاهیم)، اطلاعات نحوی آنها و روابط معنایی میان آنها است و در دو نسخه قابل دسترسی می‌باشد. نسخۀ اول فارس‌نت شامل بیش از ۱۷هزار مدخل واژگانی از مقوله‌های اسم، فعل و صفت است. روابط تحت پوشش در این نسخه روابط درون‌مقوله‌ای مطرح در وردنت انگلیسی (نسخه ۲٫۱) می‌باشد و قابلیت اتصال به وردنت‌های دیگر از طریق نگاشت به وردنت پرینستون نسخۀ ۳٫۰ را نیز داراست. نسخه دوم فارس نت شامل بیش از ۳۰ هزار مدخل واژگانی از مقوله‌های اسم، فعل، صفت و قید است. علاوه بر روابط درون-مقوله‌ای مطرح در وردنت انگلیسی (نسخه ۲٫۱)، پنج رابطه میان-مقوله‌ای نیز مفاهیم را بهم پیوند می‌دهد و علاوه بر ویژگی‌های در نظر گرفته شده برای واژه‌ها، ویژگی‌های نحوی، ساخت‌واژی و آوایی به واژه‌ها و قاب و ساختار آرگومانی به افعال افزوده شده است. این وردنت نیز قابلیت اتصال به وردنت‌های دیگر را از طریق نگاشت به وردنت پرینستون نسخه ۳٫۰ داراست. مجموعه فارس نت در پژوهشكدۀ فناوری اطلاعات پژوهشگاه فضای مجازی و با همكاری دانشگاه شهید بهشتی تهیه شده است.

شرایط استفاده:

 – استفاده از فارس‌نت ۱ جهت اهداف پژوهشی برای عموم کاربران آزاد است. فارس‌نت ۲ تنها در اختیار اعضای هیئت علمی دانشگاه‌ها قرار می‌گیرد.

اطلاعات ارجاع:

 – Mehrnoush Shamsfard, Akbar Hesabi, Hakimeh Fadaei, Niloofar Mansoory, Ali Famian, Somayeh Bagherbeigi, Elham Fekri, et al. (2010). Semi Automatic Development of Farsnet; the Persian Wordnet. Proceedings of 5th Global WordNet Conference (GWA2010). Mumbai, India. (دریافت)

کاربردها:

پردازش زبان طبیعی، زبان‌شناسی رایانشی

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی
لیست محصولات مورخ 1399/09/27