حذف کننده کلمات ایست (Stopword Remover) ادامه مطلب »
نتیجه جستجو برای : محاسبات با کلمات
مقاله + ترجمه : سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی
چکیده هدف این مقاله، بررسی سیستمهای ترجمه ماشینی آماری است. در روشهای آماری هدف، حداقل سازی خطای تصمیم، با استفاده از تئوری تصمیم آماری یا قاعده بیز میباشد. در این پروژه، یک سیستم مبتنی بر عبارت آماری، راه اندازی شده و تغییرات پارامترهای سیستم، مورد بررسی و تحلیل قرار گرفته است. ارزیابی سیستم توسط معیار بلو ، نشان میدهد که ... ادامه مطلب »
مقاله + ترجمه : سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی
مقاله + ترجمه : سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی ادامه مطلب »
مجموعه همشهری
مجموعههای متنی ابزارهای مهمی برای پیشبرد تحقیقات در تعدادی از شاخههای علوم کامپیوتر مانند بازیابی اطلاعات (Information Retrieval)، زبانشناسی پیکرهای (Corpus Linguistics) و زبانشناسی محاسباتی (Computational Linguistics) هستند. مجموعه آزمایش همشهری یکی از معتبرترین این منابع در زبان فارسی است. از این مجموعه در همایشهای معتبر بینالمللی Persian@CLEF2008 و Persian@CLEF2009 استفاده شده است. لازم به ذکر است که سایت قدیمی ... ادامه مطلب »
لیست فایل ها و منابع علمی موجود
ردیف موضوع قالب فایل عنوان فایل کلمات کلیدی متن 1 شبکه های کامپیوتری پی دی اف GSM زیرسیستم های شبکه GSM، زیر سیستم رادیو، خدکات شبکه GSM، هویت MS در شبکه GSM ، توضیحات MSC و BSC 2 شبکه های کامپیوتری پاور پوئینت مخابرات سلولی واستاندارد ان درا یران GSM تلفن های سلولی انا لوگ، برقراری یک ارتباط توسط تلفن ... ادامه مطلب »
ایست واژه ها (Stop words) در زبان فارسی و انگلیسی
ایست واژه ها (Stop words) ایست واژه ها لغاتی هستند که علی رغم تکرار فروان در متن، از لحاظ معنایی دارای اهمیت کمی هستند مثل “اگر”، “و”، “ولی”،”که” و غیره. در نگاه اولیه کلمات ربط و تعریف، ایست واژه به نظر می آیند؛ در عین حال بسیاری از افعال، افعال کمکی، اسم ها، قیدها و صفات نیز ایست واژه شناخته ... ادامه مطلب »
ایست واژه ها (Stop words) در زبان فارسی و انگلیسی
دانلود لیست ایست واژه ها (Stop words) در زبان فارسی و انگلیسی persian stop word & english stop word download ادامه مطلب »
آنتولوژی یا هستان شناسی و ارزیابی آنتولوژی
تکنیکهای معنایی یکی از مهمترین مسائل در دنیای اینترنت میباشند. مسائلی از قبیل قابلیت استفاده مجدد، مجتمعسازی منابع، توصیف معنایی دادهها یا سرویسها، مستلزم به کار بردن آنتولوژی[1] در قراردادهای دو جانبه میباشند. همترازسازی آنتولوژی ها [2]به کشف تشابه بین مولفهها و روابط بین آنتولوژیهای گوناگون می پردازد. همترازسازی، عناصر کلیدی را با تعمیم معنایی ایجاد می کند. در OA باید توجه ویژهای به ... ادامه مطلب »
ترجمه ماشینی – بخش دوم
فعالیت و کار ترجمه سابقة بسیار طولانی دارد. بعضیها معتقدند که اولین کاری که بشر کرده ترجمه است؛ اگر ترجمه را به معنی برگرداندن فرض کنیم کلام در واقع برگردان اندیشه است. این اولین قدمی است که بشر برای ترجمه برداشته است. در واقع یکی از استراتژیهای ترجمه، از هر زبانی که بخواهید ترجمه کنید، به هدف و نوع متنی ... ادامه مطلب »
ترجمه ماشینی – بخش اول
ربات ها به زودی جایگزین مترجمین انسانی می شوند… دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، ... ادامه مطلب »
Semantic Web یا Data Web یا وب3 یا همون وب معنایی
اول از همه یهتعریف کوچکی از نسخه های قبلی وب داشته باشیم. وب 1 که همون World Wide Web اولیه خودمون بود که سیستم فقط تک کاربره بود و یااصلآ داینامیک نبود که بعد ها تبدیل به داینامیک هم شد. وب 2 که با ظهور تکنولوژی Ajax (تو پرانتز) که خیلی ها هم فکر میکنن به خاطر هیمنAjax بهش میگن وب 2ولی نه به خاطر ... ادامه مطلب »
روش هاي ارزيابي خلاصه ساز ها – بخش دوم
ارزيابي بيروني (جعبه سياه) [2] برخلاف ارزيابي دروني ، در ارزيابي بيروني توجه برروي کاربر نهايي معطوف مي شود .درنتيجه در اين روش ميزان مؤثر بودن و قابليت پذيرش خلاصه هاي توليد شده با بعضي روشها ، مثل ارزيابي رابطه اي يا قابليت فهم در خواندن ، سنجيده مي شود. همچنين اگر خلاصه به نوعي شامل مجموعه دستوراتي باشد يک ... ادامه مطلب »
پردازش متن
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »