دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
دسته کننده K نزديکترين مجاور | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> دسته بندی متون -> دسته کننده K نزدیکترین مجاور یا KNN

دسته کننده K نزدیکترین مجاور یا KNN

دسته‌بندی متن شامل نسبت دادن اسناد به یکی از چند گروه از پیش تعیین شده است. برای نایل شدن به این هدف اسناد ورودی توسط یک مجموعه از مشخصات[۱] که معمولاً خصوصیات[۲] نامیده می‌شود توصیف می‌شوند. برخلاف خوشه‌بندی[۳] که شامل آموزش بدون نظارت است، در دسته‌بندی یک مجموعه آموزشی از داده‌ها با برچسب‌گذاری قبلی نیاز است (یادگیری ماشین نظارتی). هدف دسته‌بندی تحلیل داده های ورودی و ایجاد یک مدل دقیق برای هر دسته با استفاده از این خصوصیات است. اسناد جدید در داخل یکی از این دسته‌ها دسته‌بندی می‌شوند.

در مسأله دسته‌بندی متن، مشخصات کلماتی هستند که درون اسناد متنی قرار دارند. در بسیاری از موارد قبل از یادگیری ماشین انتخاب خصوصیت[۴] صورت می‌گیرد تا فضای خصوصیات[۵] را کاهش دهد.

در دسته بندی هدف بدست آوردن  یک تابع  نگاشت بین اسناد و مجموعه کلاس ها یا گروه ها به  وسیله یک سری سند که به آنها مجموعه آموزشی[۶]می‌گویند، می‌باشد. که از این تابع نگاشت برای تعیین خودکار گروه سند جدید استفاده می‌شود. توجه شود که در هنگام تولید تابع نگاشت مجموعه اسناد برچسب خورده هستند یعنی گروه هر یک از اسناد مشخص شده است و به وسیله این اسناد برای هر گروه یک سری ویژگی وصفات منحصر به فرد استخراج می‌کنیم.

 

یک فایل فشرده حاوی دو فایل:فایل ورد
۱. مطالب بسیار فنی در مورد  دسته بندی متن با استفاده از درخت تصمیم
نوع فایل:  Microsft word Office
تعداد صفحات: ۱۰
حجم: ۲۲۵ KB
به همراه کد کامل پیاده سازی الگوریتم به زبان جاوا

 

مراحل مختلف دسته بندی بصورت زیر است:

  1. پردازش مجموعه داده ها؛ در این مرحله اسناد بررسی شده، قابلیتها استخراج وکلمات غیر ضروریحذف می‌شوند. یک بردار[۷] برای نمایش متن ایجاد و مقدار دهی می‌شود. در این مرحله داده ها ممکن است به دو قسمت تقسیم شوند.
    • مجموعه آموزشی : این قسمت از داده ها برای ایجاد یک مدل بکار می‌رود.
    • مجموعه آزمایشی[۸]: این قسمت برای تست مدل بکار می‌رود.

 

  1. ساختن مدل؛ این مرحله را آموزش واقعی می‌گویند که از یک الگوریتم یادگیری[۹] استفاده می‌کند. این مرحله خود ممکن است چندین تکرار وچندین زیر مرحله داشته باشد.
  • انتخاب خصوصیت
  • اجرای یک الگوریتم یادگیری
  • اعتبار سنجی مدل

 

  1. بکار بردن مدل برای مشخص کردن کلاس یک سند جدید.

 

[1]attributes

[2]features

[3]clustering

[4]Feature selection

[5]feature space

[6]Train Set

[7]Vector

[8]Testing Set

[9]Learning

 

فهرست مطالب

۱-دسته بندی ۳
۱-۱مقدمه ۳
۱-۲دسته‌کننده های فاصله کمینه ۵
۲-۲-۱دسته‌کننده k نزدیکترین مجاور(k-NN) 7
1-3پیاده سازی نرم افزاری ۹

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

دوازده − 4 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/