کد داده: D3920418a | ثبت در مرجع: ۲۶ تیر ۱۳۹۲ | تعداد بازدید: ۱۶۵۶ پیکره دوزبانه فارسی-انگلیسی امیرکبیر (AFEC) پیکرهای موازی از جملات فارسی و انگلیسی است که در آزمایشگاه فناوری زبان انسانی دانشگاه صنعتی امیرکبیر و با حمایت پژوهشگاه فضای مجازی به عنوان یکی از خروجیهای پروژه ترجمه ماشینی تهیه شده است. برای تهیهٔ این مجموعه که حاوی حدود ۱۵میلیون ... ادامه مطلب »
نتیجه جستجو برای : پر
پیکره – مجموعه ارقام دستنویس هدی
کد داده: D3920411a | ثبت در مرجع: ۱۷ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ مجموعه ارقام دستنویس هدی مجموعه بزرگی از ارقام دستنویس فارسی است که مشتمل بر ۱۰۲۳۵۳ نمونه دستنوشته سیاه سفید میباشد. این مجموعه طی انجام یک پروژه کارشناسی ارشد در دانشگاه تربیت مدرس برای بازشناسی فرمهای دستنویس تهیه شده است. دادههای این مجموعه از حدود ۱۲۰۰۰ فرم ثبت ... ادامه مطلب »
پیکره درختی وابستگی فارسی اوپسالا
کد داده: D3920404a | ثبت در مرجع: ۱۰ تیر ۱۳۹۲ | تعداد بازدید: ۱۹۸۲ پیکره درختی وابستگی فارسی اوپسالا (UPDT) مجموعهای است از جملات فارسی که در آن روابط نحوی کلمات بر مبنای دستور وابستگی مشخص شده است. این پیکره که در دانشگاه اوپسالای سوئد تهیه شده است، حاوی ۶.۰۰۰ جمله برگفته از پیکره فارسی اوپسالا (UPC – نسخهای تغییریافته ... ادامه مطلب »
پیکره قرآنی فرقان
کد داده: D3920326a | ثبت در مرجع: ۲۹ خرداد ۱۳۹۲ | تعداد بازدید: ۲۰۱۴ پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، ... ادامه مطلب »
پیکره – دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان
کد داده: D3920320a | ثبت در مرجع: ۲۱ خرداد ۱۳۹۲ | تعداد بازدید: ۱۷۹۷ دادگان درختی فارسی در چارچوب دستور ساخت سازهای هستهبنیان (HPSG) مجموعهای است شامل بیش از ۱۰۰۰ جمله برچسبخورده با اطلاعات نحوی. ازجمله ویژگیهای دستور ساخت سازهای هستهبنیان این است که علاوه بر ارائه توصیف ساختاری سلسله مراتبی سازهها، دانش واژگانی واژهها مورد استفاده قرار میگیرد، و ... ادامه مطلب »
پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران
کد داده: D3920230a | ثبت در مرجع: ۳۱ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۷۶۱ پیکره تطبیقی فارسی-انگلیسی دانشگاه تهران (UTPECC) از دو مجموعه اخبار متفاوت از دو مبدأ مجزا یعنی اخبار فارسی خبرگزاری همشهری و اخبار انگلیسی خبرگزاری بیبیسی ساخته شده است. همچنین برای همترازی اسناد این دو زبان، علاوه بر تاریخ انتشار اخبار، شباهت محتوای اسناد نیز در نظر گرفته ... ادامه مطلب »
پیکره – تنزیل (پیکره قرآنی)
کد داده: D3920228a | ثبت در مرجع: ۲۸ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۵۳۸ تنزیل یک پروژه بینالمللی قرآنی است که با هدف فراهمسازی نسخهای دقیق از قرآن کریم ایجاد شده است. در این پروژه علاوه بر ارائه نسخه رقومی دقیقی از متن قرآن، بالغ بر ۱۰۰ ترجمه از قرآن کریم برای بیش از ۴۰ زبان دنیا از جمله ۱۱ ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی میزان
کد داده: D3920221a | ثبت در مرجع: ۲۲ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۳۱۲۱ پیکره میزان مجموعهای است حاوی بیش از ۱ میلیون جمله از متون انگلیسی (اغلب در حوزه ادبیات کلاسیک) و ترجمه این جملات به فارسی که توسط دبیرخانه شورای عالی اطلاعرسانی تهیه شده است. از این پیکره میتوان در کاربردهای مختلف پردازش زبان طبیعی و به ویژه در ... ادامه مطلب »
پیکره موازی انگلیسی-فارسی تهران
کد داده: D3920214a | ثبت در مرجع: ۱۴ اردیبهشت ۱۳۹۲ | تعداد بازدید: ۱۶۵۸ پیکره موازی انگلیسی فارسی تهران (TEP) مجموعهای است حاوی بیش از ششصدهزار جمله همترازشده انگلیسی و فارسی که از زیرنویس ۱۶۰۰ فیلم استخراج شدهاند. این پیکره در آزمایشگاه پردازش زبان طبیعی دانشگاه تهران تهیه شده است و در ماشینهای ترجمه و دیگر سیستمهای پردازش زبان طبیعی ... ادامه مطلب »
پیکره – فارسدات تلفنی
کد داده: D3920124c | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۱۴۳۹ دادگان فارسدات تلفنی (TFarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور از طریق خط تلفن بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. تهیه این ... ادامه مطلب »
پیکره – فارسدات
کد داده: D3920124a | ثبت در مرجع: ۲۵ فروردین ۱۳۹۲ | تعداد بازدید: ۲۲۰۷ دادگان فارسدات (FarsDat)، مجموعهای از عبارات و جملات است که توسط گویندگان فارسیزبان از مناطق مختلف کشور بیان شده است. این دادگان در سطح واج (آوا) با دقت میلیثانیه تقطیع و برچسبدهی شده و بصورت فایلهای مجزا ذخیره گردیده است. این دادگان، به عنوان دادگان استاندارد ... ادامه مطلب »
پیکره – پیکره متنی زبان فارسی
کد داده: D3920121a | ثبت در مرجع: ۲۳ فروردین ۱۳۹۲ | تعداد بازدید: ۲۵۳۰ پیکره متنی زبان فارسی، مجموعهای از متون نوشتاری و گفتاری زبان فارسی به صورت رسمی است که از منابع واقعی همچون روزنامهها، سایتها و مستنداتِ از قبل تایپ شده، جمعآوری شده، تصحیح گردیده و برچسب خورده است. حجم این دادگان حدوداً ۱۰۰ میلیون کلمه است و ... ادامه مطلب »
پیکره – فارس نت
کد داده: D3920119a | ثبت در مرجع: ۲۳ فروردین ۱۳۹۲ | تعداد بازدید: ۵۶۲۷ فارس نت (وردنت عمومی زبان فارسی) پایگاه دانشی است كه حاوی اطلاعات درمورد واژهها و ترکیبات زبان (مفاهیم)، اطلاعات نحوی آنها و روابط معنایی میان آنها است و در دو نسخه قابل دسترسی میباشد. نسخۀ اول فارسنت شامل بیش از ۱۷هزار مدخل واژگانی از مقولههای اسم، ... ادامه مطلب »
پیکره – مجموعه همشهری (نسخه ۲)
کد داده: D3920117a | ثبت در مرجع: ۲۰ فروردین ۱۳۹۲ | تعداد بازدید: ۲۰۶۹ مجموعه همشهری پیکرهای است حاوی ۳۱۸ هزار سند مربوط به اخبار سالهای ۱۳۷۵ تا ۱۳۸۶ که با خزش (Crawl) وبسایت همشهری و چندین مرحله پیشپردازش و برچسبگذاری حاصل آمده است. همه اسناد مجموعه همشهری دارای برچسب «Cat» هستند که نشان میدهد هر سند در چه ردهای ... ادامه مطلب »
پیکره – فرهنگ ظرفیت نحوی افعال فارسی (نسخه ۳.۰)
کد داده: D3911212a | ثبت در مرجع: ۲۴ اسفند ۱۳۹۱ | تعداد بازدید: ۳۶۴۸ فرهنگ ظرفیت نحوی افعال فارسی مجموعهای است حاوی اطلاعات مربوط به ظرفیت نحوی بیش از ۴۵۰۰ فعل در زبان فارسی. در این فرهنگ، متممهای اجباری و اختیاری انواع فعلهای ساده، مرکب، پیشوندی و عبارات فعلی مشخص شده است. فراوانی فعلهای مرکب در زبان فارسی، نیاز به ... ادامه مطلب »
پیکره – فرهنگ املایی خط فارسی
کد داده: D3911203c | ثبت در مرجع: ۰۴ اسفند ۱۳۹۱ | تعداد بازدید: ۱۹۷۴ داده حاضر نسخه رقومی فرهنگ املايى خطّ فارسى براساس دستور خطّ فارسی مصوّب فرهنگستان زبان و ادب فارسی است. ازآنجاكه بهخاطر سپردن تمام قواعدى كه در دستور خطّ فارسى مصوّب فرهنگستان زبان و ادب فارسى آمده براى همگان امكانپذير نيست، و ازسوىديگر، عموم نويسندگان، اعم از ... ادامه مطلب »