دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> شباهت متون -> چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی

در نخستین گام از طراحی و پیاده­سازی ابزار مورد نظر برای محاسبه میزان تشابه متون، بایستی بسیاری از ابزارهای پایه­ای پردازش زبان انگلیسی از ابتدا و با رویکردی اصولی منطبق بر قواعد گرامری و نگارشی زبان انگلیسی طراحی و پیاده­سازی گردد. از جمله­ی این ابزارها می­توان ابزار نرمال­ساز یا یکسان­ساز، ابزار تشخیص دهنده جملات، ابزار تشخیص دهنده لغات، ابزار ریشه­یاب، ابزار برچسب­زن اجزای واژگانی کلام و غیره را نام برد.

  • نرمال­ساز (Normalizer): در ابتدا بایستی همه‌ی نویسه‌های (کاراکترهای) متن با جایگزینی با معادل استاندارد آن یکسان‌سازی گردند.
  • جداکننده کلمات (Tokenizer): با کمک این پردازشگر می­توان کلمات متن را استخراج نمود.
  • حذف کننده کلمات ایست (Stopword Remover): با استفاده از این ابزار می­توان کلمات ایست را حذف نمود.
  • جدا کننده جملات (Sentence Splitter): با کمک این پردازشگر می­توان جملات را از متن استخراج کرد.
  • ریشه­یاب (Stemmer) : وظیفه ریشه­یابی کلمات را بر عهده دارد.
  • برچسب زننده اجزای واژگانی کلام (POS): از این پردازشگر برای برچسب­زنی اجزای واژگانی کلام استفاده می­شود.

در روند هرگونه پردازش روی متن­های زبان طبیعی انجام یک سری پیش­پردازش امری اجتناب ناپذیر است. علاوه بر آن، دقت این پیش­پردازش­ها تاثیر بسزایی در فازهای بعدی نتایج اعمال الگوریتم­ها دارد. هرچقدر که دقت پیش­پردازش بیشتر باشد الگوریتم­ها به نتایج واقعی خود نزدیک­تر خواهند شد.

متن­هایی که قرار است از نظر  شباهت با هم سنجیده شوند متون برگزیده از مقالات هستند که در ۳ قسمت (عنوان، چکیده، و کلید واژه­ها) تقسیم­بندی شده­اند و هریک از این قسمت­ها باید در تمام مقالات با هم سنجیده شوند. بنابراین سه فایل به عنوان ورودی به نرم­افزار داده می­شود. یک فایل حاوی عناوین مقالات، یک فایل حاوی کلمات کلیدی مقالات و یک فایل هم حاوی چکیده مقالات. در روند ارزیابی، هر کدام از مقالات در سه قسمت عناوین، کلمات کلیدی و چکیده دو به دو با یکدیگر مقایسه گردیده و میانگین وزن­داری از آنها به عنوان نتیجه نهایی ابزار برگردانده می­شود.

فایل اول:

فایل Word – یازده صفحه

—————————————————————————

ابزارهای لازم برای پردازش متن در زبان فارسی

تشخیص دهنده ی جمله: این ابزار باید با توجه به کاراکترهای جداکننده ی جمله در زبان فارسی، توانایی تشخیص جملات را در متن ورودی داشته باشد.
Tokenizer: ابزاری برای شکستن یک متن بر اساس واحدهای با معنی مانند کلمه، پاراگراف، نمادهای معنادار مانند space و tab و … . ل
Named entity recognition: ابزاری برای تشخیص اسامی و نوع آنها اعم از اسامی افراد، اماکن، مقادیر عددی و … .
Word-net: مجموعه ای از لغات و ارتباط میان آنها به لحاظ معنایی.
Stemmer: ابزاری برای ریشه یابی لغات و تشخیص نوع کلمه ساخته شده از آن ریشه (اسم مکان، اسم زمان، حالت فاعلی، مفعولی و …).
Similarity recognition: ابزاری برای تشخیص میزان شباهت میان دو عبارت بر اساس پارامترهای مختلف مانند نوع اسامی مشابه به کار رفته، استفاده از word-net و… .
Chunker: ابزاری برای تشخیص گروه های اسمی، فعلی و ….
Semantic role labeler: ابزاری برای تشخیص نقش گرامری کلمه در جمله.
Annotator: ابزاری برای ایجاد یک نمونه از یک آنتولوژی در یک سند داده شده.
Coreference resolution: ابزاری برای تعیین مرجع اسمی یک اسم یا یک ضمیر در جملات.
Pos tagger: ابزاری برای مشخص کردن نوع کلمات از قبیل اسم، صفت، قید، فعل و … .

 

فایل دوم:

فایل Word_  دو صفحه توضیح مختصری در مورد ابزارهای پردازش متن و معرفی ابزارهای موجود و آماده در زبان انگلیسی

—————————————————————————

مرور ادبیات پردازش متن

در این فصل به مرور مفاهیم مرتبط با پایان نامه، پیش نیازهای لازم برای درک مفاهیم مطرح شده و کارهای انجام شده در ارتباط با موضوع پایان نامه می پردازیم. ابتدا تعاریف پایه در پردازش زبان طبیعی ذکر گردیده است. پس از آن، از آنجا که مشابهت معنایی بین اجزای مختلف متن، جایگاه ویژه ای در کاربردهای مختلف پردازش متن دارا می باشد، به معرفی تلاش های انجام شده در زمینه ی محاسبه ی شباهت معنایی کلمات و جملات می پردازیم.
۱- مرور ادبیات ۲
۱-۱- تعاریف پایه زبانشناسی ۲
۱-۱-۱- زبان فارسی ۲
۱-۱-۲- ایست واژهها (Stop words) 4
1-1-3- ریشه‌یابی ۴
۱-۱-۴- برچسبزنی بخشهای سخن (POS) 4
1-1-5- پارسر ۶
۱-۱-۶- درخت تجزیه ۶
۱-۱-۷- برچسب‏زنی نقش معنایی کلمات (SRL) 7
1-1-8- شبکه واژگان ۸

فایل سوم:

فایل Word – ده صفحه

—————————————————————————

دانلود هر سه عدد فایل بالا در یک فایل فشرده:

 

 

.

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

1 + 4 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/