کد داده: D3911105a | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۵۰۵ واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت واجی، مقولهٔ واژگانی، الگوی تکیه، و بسامد واژه میباشد. برای تهیهٔ واژگان زایا، یک پیکره متنی ۱۰میلیون کلمهای ملاک استخراج واژهها قرار ... ادامه مطلب »
نتیجه جستجو برای : بر استخراج
معرفی سایت دادگان
مرجع دادگان زبان فارسی (dadegan.ir) با هدف ارائه متمرکز پیکرهها و سایر دادههای زبانی موجود برای زبان فارسی راهاندازی شده است. دادههای عرضه شده در این مرجع تخصصی میتوانند برای اهداف پردازش رایانهای زبان و مطالعات زبانشناختی مورد استفاده قرار بگیرند. امروزه روشهای آماری و مبتنی بر یادگیری ماشینی کاربرد فراوانی در پردازش زبان طبیعی و ایجاد سامانههایی چون سامانههای ... ادامه مطلب »
تشخیص هرزنامه – اسپم – Spam
هرزنامه سوءاستفاده از سیستمهای پیغامدهی الکترونیکی ( شامل اغلب رسانههای دادهپراکنی و سیستمهای تحویل دیجیتالی اطلاعات) برای فرستادن پیغامهای زیاد برای افراد نامشخص میباشد. درحالیکه مشهورترین نوع هرزنامه، هرزنامه های پست الکترونیکی میباشند، ولی این کلمه برای سایر سوءاستفادههای رسانهای نیز استفاده میگردد. سایر انواع هرزنامه عبارتند از هرزنامههای پیام الکترونیکی ، هرزنامه گروههای خبری Usenet، هرزنامههای موتور جستجوی ... ادامه مطلب »
تشخیص هرزنامه – اسپم – Spam
سمینار,کارشناسی,ارشد,آماده,هرزنامه,SPAM,نامه,الکترونیکی,فیلتر,ایمیل,تشخیص,سرآیند,شبکه,اجتماعی,آنتولوژی,WordNet,شبکه,واژگان ادامه مطلب »
پیکره ارزیابی سیستم های توصیه گر – مجموعه داده Epinions
ارزيابي سيستم توصيه گر پیکره گرداوری شده حدود ۲ گیگا بایت حجم دارد، و نمونه هایی از پیکره در ادامه قابل دانلود و مشاهده است. در صورت نیاز به ارسال از طریق پست ، لطفا از طریق پیامک یا ایمیل زیر به ما اطلاع دهید تا پس از دریافت آدرس پستی شما، در صورتیکه در تهران هستید با پیک موتوری و ... ادامه مطلب »
مجموعه همشهری
مجموعههای متنی ابزارهای مهمی برای پیشبرد تحقیقات در تعدادی از شاخههای علوم کامپیوتر مانند بازیابی اطلاعات (Information Retrieval)، زبانشناسی پیکرهای (Corpus Linguistics) و زبانشناسی محاسباتی (Computational Linguistics) هستند. مجموعه آزمایش همشهری یکی از معتبرترین این منابع در زبان فارسی است. از این مجموعه در همایشهای معتبر بینالمللی Persian@CLEF2008 و Persian@CLEF2009 استفاده شده است. لازم به ذکر است که سایت قدیمی ... ادامه مطلب »
دادهكاوی موازی فازی در محیط محاسباتی گرید
دادهكاوی موازی فازی در محیط محاسباتی گرید داده کاوی به منظور دسته بندی اطلاعات جهت ارائه بهتر آنها به مدیران، پیش بینی اطلاعات و یا تعیین اعتبار داده ها از روی اطلاعات قبلی استفاده می شود. یکی از شاخه های پرکاربرد داده کاوی، درخت های تصمیم گیری می باشد. درخت های تصمیم گیری قادر خواهند بود کل دادهها را به ... ادامه مطلب »
دادهكاوی موازی فازی در محیط محاسباتی گرید
دادهكاوی موازی فازی در محیط محاسباتی گرید ادامه مطلب »
استنتاج و پایگاههای RDFS/OWL
استنتاج و پایگاههای RDFS/OWL چکیده در طی سالیان اخیر حجم زیادی از سه گانههای RDF (در حدود چند ده میلیارد) در وب منتشر گردیده است. برای استفاده از این دادههای منتشر شده باید الگوریتم استنتاجی داشته باشیم که بتواند روی این حجم عظیم از دادهها استنتاج انجام دهد و همچنین بتواند خود را با این نرخ بالای رشد ، تطبیق ... ادامه مطلب »
استنتاج و پایگاههای RDFS/OWL
استنتاج و پایگاههای RDFS/OWL ادامه مطلب »
پروپوزال کارشناسی ارشد: خلاصه سازی خودکار مبتنی بر مفاهیم اسناد چند سندی متنی
عنوان : خلاصه سازی خودکار مبتنی بر مفاهیم اسناد چند سندی متنی Title: Concept based Automatic Text Summarization 1- تعريف مساله، پیشینه، اهداف و سوالات تحقيق: 1-1- مقدمه : با گسترش روزافزون حجم اطلاعات موجود در وب و افزايش چشم گير مقالات و کتب منتشر شده در زمينه هاي مختلف علمي ، دسترسي درست به مطالب و مطالعه اطلاعات مورد ... ادامه مطلب »
پروپوزال کارشناسی ارشد: خلاصه سازی خودکار مبتنی بر مفاهیم اسناد چند سندی متنی
پروپوزال کارشناسی ارشد: خلاصه سازی خودکار مبتنی بر مفاهیم اسناد چند سندی متنی ادامه مطلب »
داده آمیزی معنایی – semantic data fusion
در حوزههايي که اطلاعات زيادي وجود دارد و تصميمگيريهاي ضعيف باعث پيامدهاي جدي میشود، مسئله دادهآمیزی بسيار حياتي میشود و نياز است که دادههاي فراوان از منابع مختلف به صورت مناسب تفسیر و با يکديگر ترکيب شوند. در مقالات گوناگون تعاريف متفاوتي از دادهآمیزی ارائه شده است، اما در تعريفي کلي ميتوان گفت، دادهآمیزی عبارتست از استفاده از تکنيکهايي که ... ادامه مطلب »
داده آمیزی معنایی – semantic data fusion
داده آمیزی معنایی - semantic data fusion ادامه مطلب »
شبکه واژگان فارسی، فارس نت و فردوس نت
نخستین شبكه ی واژگان زبان فارسی تحت عنوان فارسنت (وردنت عمومی زبان فارسی) با حمایت مرکز تحقیقات مخابرات ایران در پژوهشكدهی IT پژوهشگاه فضای مجازی و با همكاری متخصصان از هر دو حوزهی رایانه و زبان شناسی دانشگاه شهید بهشتی تهیه گردیده است. در واقع هدف ایجاد فارسنت، ايجاد يک شاخهی فارسي براي Word Net است که در تحقيقات و پژوهشهاي زبان فارسي قابل استفاده باشد ... ادامه مطلب »
فارس نت (وردنت عمومی زبان فارسی)
شبکه واژگان فارسی - فارس نت ادامه مطلب »