دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
دانلود لیست ایست واژه ها (Stop words) در زبان فارسی و انگلیسی persian stop word & english stop word download | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
شنبه , ۱۳ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> ایست واژه ها (Stop words) در زبان فارسی و انگلیسی

ایست واژه ها (Stop words) در زبان فارسی و انگلیسی

ایست واژه ها (Stop words)
ایست واژه ها لغاتی هستند که علی رغم تکرار فروان در متن، از لحاظ معنایی دارای اهمیت کمی هستند مثل “اگر”، “و”، “ولی”،”که” و غیره. در نگاه اولیه کلمات ربط و تعریف، ایست واژه به نظر می آیند؛ در عین حال بسیاری از افعال، افعال کمکی، اسم ها، قیدها و صفات نیز ایست واژه شناخته شده اند. در اغلب کاربردهای متن، حذف این کلمات، نتایج پردازش را به شدت بهبود می دهد و سبب کاهش بار محاسبات و افزایش سرعت خواهد شد. به همین دلیل این کلمات غالبا در فاز پیش پردازش، حذف می شوند. برای زبان فارسی چندین لیست از این کلمات منتشر شده است که بطور میانگین شامل ۵۰۰ کلمه می باشند.
ایست لیست ها  یک فایل محتوی تعدادی کلمه  پرتکرار است که شامل عمومی‌ترین افعال، ضمایر، قیدها، حروف ربط و حروف اضافه می‌باشد.
ایست واژه ها stop words

ایست واژه ها stop words

حذف­ کننده کلمات ایست (Stopword Remover)

در این فاز کلمات کم اهمیت ­تر و یا ایست ­واژه ­ها در صورت تایید کاربراز متون مورد پردازش، حذف می­گردند. ایست واژه­ ها لغاتی پرکاربرد و اغلب کم اهمیتی هستند که هنگام کار با متن به وفور با آنها برخورد می­شود مثل “اگر“، “و“، “که” و غیره. در نگاه اولیه کلمات ربط و تعریف، ایست­ واژه به نظر می ­آیند؛ در عین حال بسیاری از افعال، افعال کمکی، اسم­ ها، قیدها و صفات نیز ایست ­واژه شناخته شده­ اند. این کلمات علی رغم اینکه بسیار استفاده می­ شوند، اما از لحاظ معنایی دارای اهمیت کمی بوده و بهمین دلیل عموما در فعالیت­های مربوط به حوزه پردازش زبان طبیعی که با حجم انبوهی از داده­ها روبه‌رو هستیم، در فاز پیش پردازش حذف می­شوند. برای حذف این کلمات عموما لیستی از این کلمات از پیش تهیه می­شود و سپس در صورت رخداد این کلمات در متن، از سند حذف می­شوند. در اغلب کاربردهای متن، حذف این کلمات نتایج پردازش را بهبود می­دهد. علاوه بر این از آنجا که بیشتر کاربردهای پردازش متن با حجم عظیمی از داده­ها رو به رو هستند، حذف این کلمات سبب کاهش بار محاسبات و افزایش سرعت خواهد شد. برای زبان فارسی بایستی لیست این واژه­ها با دقت فراوانی تهیه گردد. لیست کلمات تهیه شده شامل بیش از ۵۰۰ کلمه می­باشد. در جدول زیر تعدادی از این لغات ذکر گردیده ­است.

 

نمونه‌ای از ایست واژه‌های زبان فارسی و انگلیسی

اکنون است زیرا برای اینک اگر
البته شد چون بالاخره اینطور بعدا
اما کرد باید اینقدر بدون حدودا
از باشد حالا بله با خصوصا
که هست حتی زود حتما انگار

 

– یک فایل فشرده حاوی دوعدد فایل متنی با پسوند txt

– لیست کامل کلمات عمومی ایست واژه ها یا Stop words برای زبان فارسی و انگلیسی

– FarsiStopWords.txt  &&  EnglishStopWords.txt

 

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

جوابی بنویسید

ایمیل شما نشر نخواهد شد

پنج + 16 =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/