دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
متن کاوی | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> متن کاوی

متن کاوی

مروری روی مهمترین متدهای متن کاوی موجود وارزیابی آن ها

رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین ، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و….. روش ها و ایده هایی را کاوش کرده اند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه داده های غیرمتنی بکار می بریم، غیر ممکن می سازد. بنابراین روش ها و الگوریتم های پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده می کند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی می کند. در این مقاله ما به بررسی یکی از جدیدترین زمینه های مورد تحقیق در داده کاوی، متن کاوی می پردازیم. در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی ، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات می گیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند.
۱. مقدمه
بخش قابل توجهی از اطلاعات قابل دسترس در پایگاه داده های متنی (یا پایگاه داده های سند ) که شامل مجموعه بزرگی از اسناد منابع مختلف (مثلا مقالات خبری، paperها، کتاب ها، ایمیل ها و صفحات وب) ذخیره شده اند. پایگاه داده-های متنی به علت افزایش مقدار اطلاعات موجود به فرم الکترونیکی سریع رشد می کنند. امروزه بیشتر اطلاعات در صنعت، کسب و کار و سازمان های دیگر به صورت الکترونیکی و به فرم پایگاه داده متنی ذخیره شده اند.
داده های ذخیره شده در بیشتر پایگاه داده های متنی، داده های نیمه ساختاریافته هستند چون نه به طور کامل غیرساختیافته هستند و نه به طور کامل ساختیافته هستند. برا ی مثال یک سند شامل تعدادی فیلد ساختیافته مانند عنوان، نویسندگان، تاریخ انتشار، رده و ….. و از طرف دیگر شامل برخی کامپوننت های متنی غیرساختاریافته مانند چکیده و محتویات است. تکنیک های بازیابی اطلاعات مانند (متدهای ایندکس کردن متن ) برای هندل کردن سندهای غیر ساختاریافته ایجاد شده اند. تکنیک های بازیابی اطلاعات قدیمی برای مقدار زیادی داده متنی که به طور فزاینده افزایش می یابند، ناکارآمد هستند. بدون دانستن محتویات سندها، فرمول بندی کردن Queryهای مناسب برای آنالیز کردن و استخراج کردن اطلاعات مفید از داده، مشکل است. کاربرها نیاز به ابزارهایی برای مقایسه سندهای مختلف، مرتب کردن سندها بر اساس موبوط بودن آن ها و یافتن الگوها دارند. بنابراین یکی از جدیدترین زمینه های مورد تحقیق در داده کاوی، متن کاوی برای این منظور گسترش یافت. متن کاوی یعنی جستجوی الگوها در متن غیرساختیافته. متن کاوی برای کشف اتوماتیک دانش مورد علاقه یا مفید از متن نیمه ساختیافته استفاده می شود. چندین تکنیک برای متن کاوی پیشنهاد شده است عبارتند از ساختار مفهومی ،کاوش association ruleها درخت تصمیم گیری، روش های استنتاج قوانین ، همچنین تکنیک های بازیابی اطلاعات برای کارهایی مانند تطبیق دادن سندها، مرتب کردن کردن، کلاسترینگ و…..

فایل ورد – ۲۹ صفحه

سال ۱۳۸۸

 

 

فهرست مطالب
چکیده ۳
۱ مقدمه ۳
۱.۱ کشف دانش و ارتباط آن متن کاوی ۵
۲.۱ تعاریف متن کاوی ۵
۳.۱ ناحیه های سرچ مرتبط ۶
۲ روش ها پیش پردازش کردن متون ۷
۱.۲ مدل فضای برداری ۹
۲.۲ پیش پردازش زبان شناختی ۱۰
۳ روش های متن کاوی … ۱۰
۱.۳ فازهای اصلی فرآیند کتن کاوی… ۱۱
۲.۳ رده بندی … ۱۲
۱.۲.۳ انتخاب ترم ایندکس ۱۲
۲.۲.۳ رده کننده Naïve Bayes 12
3.2.3 رده بندی کننده نزدیکترین همسایه ۱۳
۴.۲.۳ درخت تصمیم گیری ۱۴
۵.۲.۳ متدهای هسته و SVM 14
6.2.3 ارزیابی رده بندی کننده ها ۱۵
۳.۳ استخراج اطلاعات ۱۶
۱.۳.۳ رده بندی برای استخراج اطلاعات ۱۶
۲.۳.۳ مدل مارکوف پنهان ۱۷
۳.۳.۳ فیلدهای رندم شرطی ۱۷
۴.۳.۳ مقایسه روش های استخراج اطلاعات ۱۸
۲.۲ پیش پردازش زبان شناختی ۱۸
۴.۳ روش ها ترکیبی ۱۸
۱.۴.۳ روش های dicsotex 18
1.1.4.3 مقدمه ۱۹
۲.۱.۴.۳ یکپارچه کردن داده کاوی و استخراج اطلاعات ۱۹
۳.۱.۴.۳ سیستم dicsotex 19
2.4.3روش textminer 21
1.2.4.3 مقدمه ۲۱
۲.۲.۴.۳ استخراج اطلاعات ۲۲
۳.۲.۴.۳ الگوریتم خوشه بندی ۲۳
۳.۴.۳ یافتن روابط ۲۵
۴.۴.۳ مقایسه روش های ترکیبی ۲۶
۴ کاربردهای متن کاوی ۲۶
۵ نتیجه گیری و کارهای آینده ۲۷
۶ مراجع ۲۸

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

1 × دو =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/