دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
دسته کننده Rocchio | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
چهارشنبه , ۱۷ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> دسته بندی متون -> دسته کننده Rocchio

دسته کننده Rocchio

دسته‌بندی متن شامل نسبت دادن اسناد به یکی از چند گروه از پیش تعیین شده است. برای نایل شدن به این هدف اسناد ورودی توسط یک مجموعه از مشخصات[۱] که معمولاً خصوصیات[۲] نامیده می‌شود توصیف می‌شوند. برخلاف خوشه‌بندی[۳] که شامل آموزش بدون نظارت است، در دسته‌بندی یک مجموعه آموزشی از داده‌ها با برچسب‌گذاری قبلی نیاز است (یادگیری ماشین نظارتی). هدف دسته‌بندی تحلیل داده های ورودی و ایجاد یک مدل دقیق برای هر دسته با استفاده از این خصوصیات است. اسناد جدید در داخل یکی از این دسته‌ها دسته‌بندی می‌شوند.

یک فایل فشرده حاوی دو فایل:فایل ورد
۱. مطالب بسیار فنی در مورد  دسته بندی متن با استفاده از درخت تصمیم
نوع فایل:  Microsft word Office
تعداد صفحات: ۱۱
حجم: ۱۳۳ KB
به همراه کد کامل پیاده سازی الگوریتم به زبان جاوا

 

 

[1]attributes

[2]features

[3]clustering

1-1           دسته کننده روچیو[۱]

الگوریتم روچیو یک الگوریتم سنتی برای پیاده‌سازی بازخورد رابطه‌ای است. این الگوریتم یک روش برای ارتباط اطلاعات بازخورد رابطه‌ای با مدل فضای برداری را مدل می‌کند.

تئوری اصلی. می‌خواهیم یک بردار پرس و جو را که با  نشان داده می‌شود را طوری بیابیم که بیشترین شباهت را با اسناد مرتبط و کمترین شباهت را با اسناد نامربوط داشته باشد. اگر Cr مجموعه اسناد مرتبط  و Cnr مجموعه اسناد نامرتبط، آنگاه ما می‌خواهیم تا این موضوع را بصورت زیر بیابیم:

 

 

بطوری که شباهت با استفاده از فرمول زیر محاسبه می‌شود:

 

 

بردار پرس و جوی بهینه  برای جداسازی اسناد مربوط و نامربوط بصورت زیر خواهد بود:

 

 

در یک محتوای پرس و جوی IR واقعی، یک پرس و جوی کاربر و اطلاعات جزئی[۲] از اسناد آشنای مربوط و نامربوط داریم. الگوریتم اصلاح بردار پرس و جوی  را بصورت زیر پیشنهاد می‌کند:

 

 

که q0 بردار پرس و جوی اصلی، Dr و Dnr به ترتیب مجموعه اسناد مرتبط و نامرتبط شناخته شده و α، β و γ اوزان مرتبط با هر واژه است. این پارامترها تعادل بین درستی تشخیص مجموعه اسناد در برابر پرس و جو را کنترل می‌کنند. اگر تعداد زیادی سند تشخیص داده شده داشته باشیم، می‌خواهیم که β و γ بالاتری داشته باشیم. با بردار q0 شروع می‌کنیم، بردار جدید با برخی فاصله‌ها شما را به مرکز اسناد مرتبط حرکت می‌دهد و با برخی فاصله‌ها شما را از مرکز اسناد نامرتبط دور می‌کند. این پرس و جوی جدید می‌تواند برای بازیابی در مدل فضای برداری استاندارد مورد استفاده قرار گیرد.

بازخورد رابطه‌ای هر دو مقدار فراخوانی و دقت را بهبود می‌بخشد، اما عملاً نشان داده شده است که برای افزایش فراخوانی در موقعیت‌هایی که فراخوانی مهمتر است مفیدتر است. مقادیر منطقی برای α، β و γ ممکن است بصورت α=۱، β=۰.۷۵ و γ=۰.۱۵ باشند اما در حقیقت بیشتر سیستمها فقط از بازخورد مثبت[۳] استفاده می‌کنند و مقدار پارامتر γ را صفر در نظر می‌گیرند.

 

 

[1]Rocchio

[2]partial knowledge

[3]positive feedback

 

فهرست مطالب

۱ دسته بندی ۳
۱-۱ مقدمه ۳
۲-۱ دسته کننده روچیو ۵
۱-۳ پیاده سازی نرم افزاری ۹

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

هشت + 10 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/