دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
شنبه , ۱۳ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> خلاصه سازی -> خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم

خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم

خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم

چکیده:
با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متون نیز با استقبال چشم گیر محققین روبرو شده است. در سال های اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، خلاصه سازی است که چندین سند را به عنوان ورودی دریافت کرده و گزبده ای از جملات اسناد اولیه را تولید می نماید. . خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد.
در این پایان نامه با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی و عدم وجود افزونگی، روشی جدید برای خلاصه سازی ارائه شده است. در مدل پیشنهادی در ابتدا با دید کلی بر اسناد، زمینه آنها استخراج می شود. سپس جملات بر اساس شباهت با زمینه مرتب می شوند. در ادامه با استفاده از برچسب زنی معنایی جملات و شبکه واژگان، شباهت کلمات در نقش های معنایی یکسان محاسبه شده و افزونگی حذف می شود. برای استخراج زمینه از روش آنالیز روابط معنایی پنهان استفاده شده است. نحوه استفاده از این روش در این پایان نامه، باعث افزایش قابل توجه دقت نسبت به کاربردهای قبلی این تکنیک در روش های پیشین شده است. همچنین روش پیشنهادی برای حذف جملات تکراری نسبت به روش های گذشته، منجر به حذف با دقت بیشتر شده است.
ارزیابی سیستم پیشنهادی برروی داده های کنفرانس DUC و با استفاده از معیار ارزیابی ROUGE صورت گرفته است. همچنین سیستم پیشنهادی برروی پیکره کوچکی از متون فارسی هم ارزیابی شده است.
کلمات کلیدی:
خلاصه سازی متن، خلاصه سازی چندسندی، مفهوم، زمینه، آنالیز استخراج روابط معنایی پنهان، شباهت معنایی.

 

در این مستند روشی برای خلاصه سازی چندسندی خودکار متن ارائه شد که در قیاس با سیستم های مشابه و هم خانواده از دقت و کیفیت بالاتری برخودار بوده و مشکلات آنها را پوشش داده است. در این سیستم در یک مرحله زمینه اصلی متن با استفاده از تکنیک آنالیز روابط معنایی پنهان متن و با ساخت ماتریس کلمه-سند استخراج می شود. استفاده از ماتریس کلمه-سند برای استخراج زمینه باعث می شود که مفاهیم پنهان موجود در کل مجموعه اسناد مرتبط با موضوع استخراج گردد. بعبارت دیگر زمینه موجود در کل اسناد با یک دید سراسری استخراج می گردد بر خلاف روش های پیشین که با دید محلی به نوعی این کار را انجام می دادند. این موضوع منجر به افزایش قابل ملاحظه دقت نسبت به روش های مشابه شده است. همچنین در فاز دوم سیستم پیشنهادی، پس از استخراج جملات مرتبط با زمینه، شباهت معنایی بین جملات به صورت معنایی محاسبه شده و جملات تکراری حذف می گردند. در روش پیشنهادی در این فاز، شباهت بین کلمات دو جمله، در نقش های معنایی یکسان و با استفاده از تعاریف شبکه واژگان محاسبه می گردد. در این محاسبه معیار موقعیت کلمه در عبارت اسمی و فعلی هم به عنوان معیار جدید در نظر گرفته می شود.
در مجموع سیستم پیشنهادی ضمن بهبود چشم گیر نسبت به روش های هم خانواده، نسبت به سیستم های شرکت کننده در کنفرانس بین المللی DUC هم نتایج خوبی کسب کرده است که در قسمت ارزیابی به آن اشاره شد.

از جمله کارهایی که در جهت افزایش دقت سیستم پیشنهادی می توان انجام داد، بررسی تاثیر سایر معیارهای وزن دهی می باشد. در [GON01] تاثیر معیارهای مختلف وزن دهی در افزایش دقت بررسی شده است که این بررسی ها حاکی از آن است که معیار وزن دهی مناسب تا حتی ۲ یا ۳ برابر می توان دقت را افزایش دهد.
پس از انتخاب جملات مناسب برای خلاصه، در گام بعدی می توان به ساختار جمله ها دست برد و با اعمال عملیاتی نظیر کاهش، افزایش یا ادغام گام هایی به سوی خلاصه سازی چکیده ای برداشت. هدف نهایی سیستم های خلاصه سازی تولید خلاصه های با کیفیت خلاصه های تولید شده توسط انسان می باشد. اگر چه تولید این چنین خلاصه هایی در حال حاضر مقدور نمی باشد اما با بررسی ساختارهای مختلف جملات می توان قواعدی برای حالت های مشخص استخراج نمود تا با کاهش یا افزایش یا ادغام جملات خلاصه هایی نزدیک به خلاصه های انسانی تولید نمود.

فهرست مطالب

۱- مقدمه ۱
۱-۱- ساختار پایان‌نامه ۳
۲- مرور ادبیات ۵
۲-۱- تعاریف پایه زبان شناسی ۵
۲-۱-۱- بازیابی اطلاعات ۵
۲-۱-۲- ایست واژهها (Stop words) 5
2-1-3- ریشه یابی ۶
۲-۱-۴- برچسب زنی بخشهای سخن (POS) 6
2-1-5- برچسب زنی نقش معنایی کلمات (SRL) 7
2-1-6- شبکه واژگان ۷
۲-۲- خلاصه سازی خودکار متن ۸
۲-۲-۱- تاریخچه خلاصه سازی متن ۹
۲-۲-۲- کاربردهای خلاصه سازی ۱۰
۲-۲-۳- جنبه ها و مدل های مختلف خلاصه سازی متن ۱۱
۲-۳- مشابهت معنایی مبتنی بر شبکه واژگان ۱۶
۲-۳-۱- روشهای مبتنی بر شمارش یالها ۱۶
۲-۳-۲- روشهای آماری مبتنی بر اطلاعات ۱۷
۲-۳-۳- روشهای مبتنی بر ویژگی‌ها ۱۸
۲-۳-۴- روشهای ترکیبی ۱۸
۲-۴- روشهای اندازه گیری شباهت بین جملات ۱۹
۲-۴-۱- معیار اشتراک کلمات ۲۰
۲-۴-۲- معیارهای TFIDF 21
2-4-3- معیارهای زبان شناسی ۲۱
۲-۵- بررسی روش‌های خلاصه سازی ۲۳
۲-۵-۱- روش های خلاصه سازی آماری ۲۳
۲-۵-۲- روش های خلاصه سازی مبتنی بر تکنیک های هوش مصنوعی ۲۸
۲-۵-۳- روشهای خلاصهسازی مبتنی بر روشهای معنایی سطوح بالاتر ۲۸
۲-۶- روش های ارزیابی و مجموعه داده های استاندارد ۳۸
۲-۶-۱- روش های ارزیابی خلاصه سازی ۳۸
۲-۶-۲- مجموعه داده های استاندارد برای خلاصه سازی ۴۳
۲-۷- سیستم های معروف خلاصه سازی ۴۵
۲-۷-۱- سیستم MEAD 45
2-7-2- سیستم SweSum 45
2-7-3- سیستم PERSIVAL 46
2-7-4- سیستم های تجاری موجود ۴۶
۲-۷-۵- سایر سیستم ها ۴۷
۲-۸- خلاصه سازی در زبان فارسی ۴۷
۲-۸-۱- سیستم FarsiSum 48
2-8-2- سایر کارهای انجام شده ۴۸
۲-۹- خلاصه ۴۹
فصل ۳ و ۴ موجود نیست….
۵- نتیجه‌گیری و کارهای آتی ۱۰۵
۵-۱- نتیجه‌گیری ۱۰۵
۵-۲- کارهای آتی ۱۰۵
۶- منابع ۱۰۷

 

فایل ورد

فایل فشرده حاوی یک فایل:

مرور ادبیات و کارهای انجام شده پایان نامه کارشناسی ارشد
نوع فایل:  Microsft word Office
تعداد صفحات: ۶۸   صفحه

 

 

 

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

چهارده + 11 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/