پکیج متن کاوی – شامل 4 عدد فایل فایل اول: متن كاوي چیست؟ فایل Word – زیان فارسی – شامل 9 صفحه چکيده : تقاضا براي اطلاعات فرابري شده ا ز منابع متني به طور فزاينده اي در حال افزايش است. ذات غيرساخت يافته ي اين متون، اعمال همان روشهايي را که ما در مورد ديتابيسها بکار مي بريم، غير ممکن مي ... ادامه مطلب »
نتیجه جستجو برای : ماشینی
پردازش متن – متن کاوی – NLP
پردازش متن - متن کاوی ادامه مطلب »
آموزش کار با Rouge – ابزار ارزیابی خلاصه سازها
ابزار ارزیابی Rouge( A Package for Automatic Evaluation of Summaries ) ابزار Rouge معروفترین ابزار برای ارزیابی در خلاصه سازی خودکار می باشد که البته از آن در دیگر کاربردهای پردازش زبان طبیعی و بازیابی اطلاعات هم استفاده شده است. Rouge مخفف جمله ی “Recall-Oriented Understudy for Gisting Evaluation” به معنای “ارزیابی مبتنی بر یادآوری برای خلاصه” می باشد. این ابزار شامل ... ادامه مطلب »
آموزش کار با Rouge – ابزار ارزیابی خلاصه سازها
آموزش کار با Rouge - ابزار ارزیابی خلاصه سازها ادامه مطلب »
کلمات کلیدی مرتبط با دانلود مقاله، تحقیق، سمینار و پایان نامه- سری هشتم
کاربران اینترنت با جستجوی کلمات کلیدی زیر در موتورهای جستجو، به جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه هدایت شده اند. در صورتیکه نیاز به هر کدام از مطالب مرتبط با کلمات کلیدی زیر دارید بر روی آن کلیک نمایید تا مطالب منتشر شده در جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه مرتبط با ... ادامه مطلب »
پیکره – پی.سی.ای.سی ۲۰۰۸ (پیکره مرجع ضمیر)
کد داده: D3940406a | ثبت در مرجع: ۰۶ تیر ۱۳۹۴ | تعداد بازدید: ۶۲۹ پیکره پی.سی.ای.سی ۲۰۰۸ (PCAC-2008 Persian Coreferentially Annotated Corpus) مجموعهای است شامل ۳۱ متن برگرفته از پیکره بیجنخان که در آن نزدیکترین مرجع اسمی ۲۰۷۹ ضمیر مشخص شده است. دسترسی به اطلاعات مربوط به مرجع ضمیر در بسیاری از کاربردهای پردازش زبان طبیعی چون ترجمه ماشینی، پرسش ... ادامه مطلب »
پیکره فارسی ۱۹۸۴
کد داده: D3930213a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۳ | تعداد بازدید: ۲۶۴۰ برای تهیه پیکره فارسی ۱۹۸۴ که در در چارچوب MULTEXT-East تولید شده است، رمان ۱۹۸۴ جرج اورول به عنوان متن اصلی انتخاب شده و نسخه فارسی این کتاب برای اضافه کردن زبان فارسی به این چارچوب حاشیهنویسی شده است. این پیکره که از ۱۱۰۰۰۰ توکن، ۱۱۲۶۶ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی پیام
کد داده: D3920713a | ثبت در مرجع: ۱۴ مهر ۱۳۹۲ | تعداد بازدید: ۲۴۸۴ پیکره موازی انگلیسی-فارسی پیام مجموعهای است از جملات فارسی و انگلیسی که از مستندات دوزبانه وب استخراج شدهاند. در این پیکره که حاوی حدود صدهزار جمله موازی است، همترازی به شکل دستی و در سطح جمله انجام گرفته است. متون مورد استفاده در این پیکره موازی ... ادامه مطلب »
پیکره دوزبانه فارسی-انگلیسی امیرکبیر [منتشر نشده]
کد داده: D3920418a | ثبت در مرجع: ۲۶ تیر ۱۳۹۲ | تعداد بازدید: ۱۶۵۶ پیکره دوزبانه فارسی-انگلیسی امیرکبیر (AFEC) پیکرهای موازی از جملات فارسی و انگلیسی است که در آزمایشگاه فناوری زبان انسانی دانشگاه صنعتی امیرکبیر و با حمایت پژوهشگاه فضای مجازی به عنوان یکی از خروجیهای پروژه ترجمه ماشینی تهیه شده است. برای تهیهٔ این مجموعه که حاوی حدود ۱۵میلیون ... ادامه مطلب »
پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران
کد داده: D3920230a | ثبت در مرجع: ۳۱ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۷۶۱ پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بیبیسی ساخته شده است. همچنین برای همترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته ... ادامه مطلب »
پیکره – تنزیل (پیکره قرآنی)
کد داده: D3920228a | ثبت در مرجع: ۲۸ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۵۳۸ تنزیل یک پروژه بینالمللی قرآنی است که با هدف فراهمسازی نسخهای دقیق از قرآن کریم ایجاد شده است. در این پروژه علاوه بر ارائه نسخه رقومی دقیقی از متن قرآن، بالغ بر ۱۰۰ ترجمه از قرآن کریم برای بیش از ۴۰ زبان دنیا از جمله ۱۱ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی میزان
کد داده: D3920221a | ثبت در مرجع: ۲۲ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۳۱۲۱ پیکره میزان مجموعهای است حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزه ادبیات کلاسیک) و ترجمه این جملات به فارسی که توسط دبیرخانه شورای عالی اطلاعرسانی تهیه شده است. از این پیکره میتوان در کاربردهای مختلف پردازش زبان طبیعی و به ویژه در ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی تهران
کد داده: D3920214a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۶۵۸ پیکره موازی انگلیسی فارسی تهران (TEP) مجموعهای است حاوی بیش از ششصدهزار جمله همترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شدهاند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشینهای ترجمه و دیگر سیستمهای پردازش زبان طبیعی ... ادامه مطلب »
معرفی سایت دادگان
مرجع دادگان زبان فارسی (dadegan.ir) با هدف ارائه متمرکز پیکرهها و سایر دادههای زبانی موجود برای زبان فارسی راهاندازی شده است. دادههای عرضه شده در این مرجع تخصصی میتوانند برای اهداف پردازش رایانهای زبان و مطالعات زبانشناختی مورد استفاده قرار بگیرند. امروزه روشهای آماری و مبتنی بر یادگیری ماشینی کاربرد فراوانی در پردازش زبان طبیعی و ایجاد سامانههایی چون سامانههای ... ادامه مطلب »
کلمات کلیدی
برگه ها تدریس خصوصی تماس با ما جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه حمایت مالی سایت دانلود مقاله، تحقیق، سمینار و پایان نامه ISI IEEE Scopos درباره ما راهنمای ,خرید ,اینترنتی ,مقاله ,تحقیق ,سمینار ,پروپوزال ,پایان نامه ,ترجمه ,تکلیف ,درسی ,نمونه ,سوال راهنمای همکاری در سایت ... ادامه مطلب »
تشخیص هرزنامه – اسپم – Spam
هرزنامه سوءاستفاده از سیستمهای پیغامدهی الکترونیکی ( شامل اغلب رسانههای دادهپراکنی و سیستمهای تحویل دیجیتالی اطلاعات) برای فرستادن پیغامهای زیاد برای افراد نامشخص میباشد. درحالیکه مشهورترین نوع هرزنامه، هرزنامه های پست الکترونیکی میباشند، ولی این کلمه برای سایر سوءاستفادههای رسانهای نیز استفاده میگردد. سایر انواع هرزنامه عبارتند از هرزنامههای پیام الکترونیکی ، هرزنامه گروههای خبری Usenet، هرزنامههای موتور جستجوی ... ادامه مطلب »