دوستان عزیز برای پیدا کردن سریع مطالب مورد نظر خود، می توانید از قسمت جستجوی سریع در سایت، یک یا چند کلمه کلیدی مورد نظر خود را جستجو نمایید.
یا اینکه بر روی دو آیکون سبز رنگ "طبقه بندی موضوعات" یا "جستجوی کلمات کلیدی" در سمت راست و چپ موجود در بالای سایت کلیک نمایید...
در صورت بروز مشکل در پرداخت الکترونیکی؛ میتونید ایمیلی ، پیامکی، تلفنی یا تلگرامی بگید تا فایلتون براتون ارسال بشه.
کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی | تعاونی نیرومندسازی تحقیقات
طبقه بندی موضوعات
جستجوی کلمات کلیدی
یکشنبه , ۲۱ آذر ۱۳۹۵
آخرین مطالب
خانه -> پردازش متن -> ابزارهای پردازش متن -> کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی

کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی

کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی (نرمال سازی، تشخیص جملات، تشخیص کلمات، حذف ایست واژه ها و ریشه یابی)

حذف­ کننده کلمات ایست (Stopword Remover)

در این ابزار، کلمات کم اهمیت ­تر و یا ایست ­واژه ­ها در صورت تایید کاربر از متون مورد پردازش، حذف می­گردند. ایست واژه­ ها لغاتی پرکاربرد و اغلب کم اهمیتی هستند که هنگام کار با متن به وفور با آنها برخورد می­شود مثل “اگر“، “و“، “که” و غیره. در نگاه اولیه کلمات ربط و تعریف، ایست­ واژه به نظر می ­آیند؛ در عین حال بسیاری از افعال، افعال کمکی، اسم­ ها، قیدها و صفات نیز ایست ­واژه شناخته شده­ اند. این کلمات علی رغم اینکه بسیار استفاده می­ شوند، اما از لحاظ معنایی دارای اهمیت کمی بوده و بهمین دلیل عموما در فعالیت­های مربوط به حوزه پردازش زبان طبیعی که با حجم انبوهی از داده ­ها روبه‌رو هستیم، در فاز پیش پردازش حذف می­شوند. برای حذف این کلمات عموما لیستی از این کلمات از پیش تهیه می­شود و سپس در صورت رخداد این کلمات در متن، از سند حذف می­شوند. در اغلب کاربردهای متن، حذف این کلمات نتایج پردازش را بهبود می­دهد. علاوه بر این از آنجا که بیشتر کاربردهای پردازش متن با حجم عظیمی از داده­ ها رو به رو هستند، حذف این کلمات سبب کاهش بار محاسبات و افزایش سرعت خواهد شد. برای زبان فارسی بایستی لیست این واژه­ ها با دقت فراوانی تهیه گردد.

ایست لیست ها  یک فایل محتوی تعدادی کلمه  پرتکرار است که شامل عمومی‌ترین افعال، ضمایر، قیدها، حروف ربط و حروف اضافه می‌باشد.

ایست واژه ها stop words

کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی (نرمال سازی، تشخیص جملات، تشخیص کلمات، حذف ایست واژه ها و ریشه یابی)

دانلود کد, کد آماده, حذف ایست واژه, حذف stopword, Stop Words Remover ,زبان فارسی, ابزارهای پردازش متن فارسی , nlp

در این کد که به زبان سی شارپ نوشته شده است چگونگی استفاده از کتابخانه های  ابزارهای پردازش متن فارسی زیر آورده شده است:

–  نرمالسازی متون فارسی – Normalizer

– تشخیص کلمات – Tokenizer

– حذف ایست واژه ها – Stop Word Remover

– تشخیص جملات – Sentence Spliter

– ریشه یابی کلمات – Stemmer

فایل فشرده حاوی کد زبان سی شارپ  به همراه کتابخانه های مورد نظر بعلاوه لیست ایست واژه های زبان فارسی

FarsiStopWords.txt

 

 

 

 

کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی

کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی

 

دانلود کد عملیات نرمالسازی متون فارسی ، تشخیص جملات،تشخیص کلمات،ریشه یابی کلمات ،برچسب زنی نحوی کلمات  – POS Tagger ، تشخیص گروه های تشکیل دهنده جملات  – Parser ، – تبدیل عبارات عامیانه و محاوره ای به عبارات رسمی  – Formal

 

 

 

کاربر گرامی

برای دانلود فایل های مورد نظرتان بایستی بر روی دکمه "افزودن به سبد خرید" کلیک نمایید .

پس از چند ثانیه ، فایل مورد نظر شما به سبد خریدتان اضافه گردیده و این دکمه تبدیل به دکمه "پرداخت" خواهد شد.

با کلیلک بر روی دکمه "پرداخت" ، وارد صفحه پرداخت خواهید شد .

با وارد کردن اطلاعات و ایمیل خود ، فایل مورد نظر به ایمیل شما ارسال گردیده و همچنین لینک دانلود فایل بلافاصله برایتان به نمایش درخواهد آمد.

– قابل پرداخت با تمام کارتهای بانکی + رمز دوم

– پشتیبانی سایت ۰۹۳۵۹۵۲۹۰۵۸ – Info@tnt3.ir – universitydatainfo@yahoo.com




سفارش ترجمه متون عمومی و تخصصیفروشگاه اینترنتی کتاب - خرید آنلاین کتاب - دانلود کتاب الکترونیکی

۳ نظر

جوابی بنویسید

ایمیل شما نشر نخواهد شد

یک × دو =

شما می‌توانید از این دستورات HTML استفاده کنید: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>


This site is using the Seo Wizard plugin by http://seo.uk.net/