به دلیل روند رو به گسترش تولید و استفاده از سیستمهای مبتنی بر نویسهخوانی نوری (OCR)، اهمیت وجود بانکهای اطلاعات تصاویر نوشتار فارسی بیش از پیش احساس میشود. این بانکهای اطلاعاتی هم به منظور توسعه و آموزش الگوریتمهای آموزشپذیر و هم به منظور ارزیابی سیستمهای ساخته شده، استفاده میشوند. متن دستنویس گسسته همان نوشتههایی است که حروف آن جدا از هم و به صورت گسسته نوشته شدهاند، مثل نام و نامخانوادگی که در فرمهای آزمون ثبتنام به صورت هر حرف داخل یک کادر نوشته میشوند. بانک اطلاعاتی حروف گسسته دستنویس مشتمل بر ۱۰ میلیون و ۲۳۶ هزار و ۴۰ نمونه تصویر است که حجم کل آن حدود ۱۲۰ گیگابایت میباشد. تصاویر موجود در این بانک در قالب BMP، با وضوح تصویر ۳۰۰ نقطه در اینچ و بهصورت خاکستری ۲۵۶ سطحی عرضه شدهاند.
دبیرخانه شورای عالی اطلاعرسانی
–
– Khosravi, S.; Razzazi, F.; Rezaei, H.; Sadigh, M.R., “A comprehensive handwritten image corpus of isolated persian/arabic characters for OCR development and evaluation,” Signal Processing and Its Applications, 2007. ISSPA 2007. 9th International Symposium on , vol., no., pp.1,4, 12-15 Feb. 2007 (دریافت)
– http://scholar.google.com/scholar?q=related:vNSZycB84asJ:scholar.google.com/&hl=en&as_sdt=0,5
* اگر در پژوهش خود از این داده استفاده کردهاید و یا پژوهش دیگری را میشناسید که از این داده استفاده نموده باشد، لطفاً اطلاعات مربوط به پژوهش را برای ما ارسال فرمایید تا به این لیست اضافه شود.
تعاونی نیرومندسازی تحقیقات جامع ترین مرجع دانلود تحقیق، مقاله، سمینار و پایان نامه


