دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
دسته بندی متن با استفاده از درخت تصمیم | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> دسته بندی متون -> دسته بندی متن با استفاده از درخت تصمیم

دسته بندی متن با استفاده از درخت تصمیم

دسته‌بندی متن شامل نسبت دادن اسناد به یکی از چند گروه از پیش تعیین شده است. برای نایل شدن به این هدف اسناد ورودی توسط یک مجموعه از مشخصات[۱] که معمولاً خصوصیات[۲] نامیده می‌شود توصیف می‌شوند. برخلاف خوشه‌بندی[۳] که شامل آموزش بدون نظارت است، در دسته‌بندی یک مجموعه آموزشی از داده‌ها با برچسب‌گذاری قبلی نیاز است (یادگیری ماشین نظارتی). هدف دسته‌بندی تحلیل داده های ورودی و ایجاد یک مدل دقیق برای هر دسته با استفاده از این خصوصیات است. اسناد جدید در داخل یکی از این دسته‌ها دسته‌بندی می‌شوند.

در مسأله دسته‌بندی متن، مشخصات کلماتی هستند که درون اسناد متنی قرار دارند. در بسیاری از موارد قبل از یادگیری ماشین انتخاب خصوصیت[۴] صورت می‌گیرد تا فضای خصوصیات[۵] را کاهش دهد.

در دسته بندی هدف بدست آوردن  یک تابع  نگاشت بین اسناد و مجموعه کلاس ها یا گروه ها به  وسیله یک سری سند که به آنها مجموعه آموزشی[۶]می‌گویند، می‌باشد. که از این تابع نگاشت برای تعیین خودکار گروه سند جدید استفاده می‌شود. توجه شود که در هنگام تولید تابع نگاشت مجموعه اسناد برچسب خورده هستند یعنی گروه هر یک از اسناد مشخص شده است و به وسیله این اسناد برای هر گروه یک سری ویژگی وصفات منحصر به فرد استخراج می‌کنیم.

دسته‌کننده درخت تصمیم گیری یکی از پر استفاده ترین روشهای یادگیری با نظارت است که برای کاوش[۱] داده‌ها مورد استفاده قرار می‌گیرد. این دسته‌کننده برای تفسیر آسان است و می‌تواند بصورت قوانین if-then-else بازنمایی گردد. در این دسته‌کننده تابعی توسط مناطق ثابت تکه های تقریب زده می‌شود و به هیچ دانش قبلی از توزیع داده‌ها نیاز ندارد. این دسته‌کننده بر روی داده‌های پارازیت دار به خوبی کار می‌کند. یک دسته‌کننده درخت تصمیم گیری در اکتشاف داده ها به روش زیر کمک می‌کند:

  • کاهش حجم زیادی از داده‌ها توسط تبدیل آن به یک نوع فشرده تر که خصوصیات ذاتی و اساسی را حفظ می‌کند و یک خلاصه دقیق را فراهم می‌کند.
  • کشف می‌کند که آیا داده‌ها شامل دسته های به خوبی جدا شده[۲] از اشیا هستند، بطوری که دسته ها بتوانند در متن یک تئوری حقیقی[۳] بطور با معنی تفسیر شوند.
  • داده ها را به شکل یک درخت نگاشت می‌کند بطوری‌که مقادیر پیش بینی بتوانند با عقب گرد از برگ‌ها به ریشه تولید شوند. که ممکن است پیش بینی نتایج  برای یک داده یا پرس و جوی جدید استفاده شود.

الگوریتم‌های درخت تصمیم‌گیری اصلی در دو گروه زیر دسته‌بندی شده اند:

  • دسته‌کننده‌ها از نوع یادگیری ماشین مانند ID3،  C4.5وCART.
  • دسته‌کننده‌ها برای پایگاه داده‌ای بزرگ مانند SLIQ، SPRINT، SONARوRainForest.

 

[1]exploration

[2]well-separated

[3]substantive theory

[1]attributes

[2]features

[3]clustering

[4]Feature selection

[5]feature space

[6]Train Set

 

یک فایل فشرده حاوی دو فایل:فایل ورد
۱. مطالب بسیار فنی در مورد  دسته بندی متن با استفاده از درخت تصمیم
نوع فایل:  Microsft word Office
تعداد صفحات: ۹
حجم: ۵۸ KB

فهرست مطالب

۱- دسته بندی ۳
۱-۱ مقدمه ۳
۱-۲ دسته‌کننده‌های درخت تصمیم گیری ۵
۱-۲-۲استخراج قوانین دسته‌بندی از روی درختها ۸

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

سه + 13 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/