ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
نتیجه جستجو برای : فشرده سازی
خلاصه سازي خودکار سند مبتني بر کاربر
با گسترش روزافزون حجم اطلاعات موجود در وب و افزايش چشم گير مقالات منتشر شده در زمينه هاي مختلف علمي ، دسترسي درست و مطالعه اطلاعات مورد نياز، همواره يکي از مشکلات محققان و پژوهشگران قرن 21 مي باشد. اينکه چه طور از يک طرف با اين حجم انبوه از داده ها و از طرفي ديگر با زمان محدودي که ... ادامه مطلب »
خلاصه سازي خودکار سند مبتني بر کاربر
خلاصه سازي, خودکار, سند, مبتني بر کاربر, ماشینی,انسانی,ارزیابی, چکیده, استخراجی ادامه مطلب »
مستندی درباره سیستم های توصیه گر
الگوریتم های بکار رفته در سیستم های توصیه گر, مفاهیم موجود در سیستم های توصیه گر , توضیح انواع سیستم های توصیه گر ادامه مطلب »
دسته کننده Rocchio
دستهبندي متن شامل نسبت دادن اسناد به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[1] که معمولاً خصوصيات[2] ناميده ميشود توصيف ميشوند. برخلاف خوشهبندي[3] که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف ... ادامه مطلب »
دسته بندی متن با استفاده از تئوری بیز
توجه شود که در يک مسئله دستهبندي ابتدا بايد هر سند موجود در مجموعه آموزشي داده شده را در متغير مناسبي ذخيره کرد و نام دسته آن سند را که با مشخصه اي خاص مثلا نام سند بدست آورد و سپس تمام توکنهاي سند استخراج و در محل مناسبي ذخيره گردد .حال کلمات توقف را حذف ميشود. چون اين کلمات ... ادامه مطلب »
دسته کننده K نزديکترين مجاور یا KNN
دستهبندي متن شامل نسبت دادن اسناد به يکي از چند گروه از پيش تعيين شده است. براي نايل شدن به اين هدف اسناد ورودي توسط يک مجموعه از مشخصات[1] که معمولاً خصوصيات[2] ناميده ميشود توصيف ميشوند. برخلاف خوشهبندي[3] که شامل آموزش بدون نظارت است، در دستهبندي يک مجموعه آموزشي از دادهها با برچسبگذاري قبلي نياز است (يادگيري ماشين نظارتي). هدف ... ادامه مطلب »
جزوه و اسلایدهای درس طراحی الگوریتم ها
سری اول اسلایدهای درس طراحی الگوریتم ها (با شبه کد های c ++) فصل اول: کارایی ، تحلیل و مرتبه الگوریتم ها فصل دوم: روش تقسیم و حل فصل سوم: برنامه نویسی پویا فصل چهارم: روش حریصانه در طراحی الگوریتم فصل پنجم: راهبرد عقبگرد فصل ششم: راهبرد شاخه و حد فصل هفتم: مقدمه ای بر پیچیدگی محاسباتی مسئله مرتب سازی ... ادامه مطلب »
جزوه و اسلایدهای درس طراحی الگوریتم ها
جزوه و اسلایدهای درس طراحی الگوریتم ها ادامه مطلب »
آموزش کار با چهار چوب jena
جنا یک فریم ورک متن باز برای کار با وب معنایی به زبان جاوا می باشد قسمت اصلی توسعه جنا در شرکت hp صورت گرفته است که البته این شرکت در حال حاضر در این زمینه فعالیت خود را قطع کرده است ، جنا یک راه مناسب برای کار با آنتولوژی ممکن می سازد. معماری جنا از سه لایه تشکیل ... ادامه مطلب »
آموزش کار با چهار چوب jena
آموزش کار با چهار چوب jena ادامه مطلب »
روش هاي ارزيابي خلاصه ساز ها – بخش دوم
ارزيابي بيروني (جعبه سياه) [2] برخلاف ارزيابي دروني ، در ارزيابي بيروني توجه برروي کاربر نهايي معطوف مي شود .درنتيجه در اين روش ميزان مؤثر بودن و قابليت پذيرش خلاصه هاي توليد شده با بعضي روشها ، مثل ارزيابي رابطه اي يا قابليت فهم در خواندن ، سنجيده مي شود. همچنين اگر خلاصه به نوعي شامل مجموعه دستوراتي باشد يک ... ادامه مطلب »
یادگیری هستی شناسی Ontology Learning
وب معنایی یک گام مشخص دیگر در زمینه هستی شناسی است. وب معنایی توسعه یافته وب کنونی است که در آن اطلاعات با توجه به معنی به خوبی تعریف شده است. و انسان و کامپیوتر بهتر قادر خواهندبود باهم همکاری کنند. این همکاری می تواند با استفاده از به اشتراک گذاشتن اجزای دانش بدست بیاید و بنابراین هستی شناسی و ... ادامه مطلب »