سیستم بازیابی اطلاعات[۱] در مجموعه سند[۲]هایی که به فرمتهای گوناگون در پایگاه داده وجود دارد (حال این پایگاه داده ممکن است پایگاه دادة رابطه ای مستقل[۳] یا پایگاه دادة شبکهای ابر متن[۴] مثل اینترنت باشد)، به دنبال اطلاعات مطلوب کاربر میگردد. جستجوی اطلاعات به دو صورت امکان پذیر است:
نگاه کردن کلی[۵] : در مواردی است که خواستة کاربر دقیق نباشد یا اینکه علایق کاربر گسترده باشد.
جست و جو کردن[۶] : در مواردی است که خواستة کاربر دقیق باشد.
۱-۱- مراحل بازیابی اطلاعات
در بازیابی اطلاعات چندین مرحلة مهم وجود دارد :
۱- ایندکسبندی[۱]
۲- خطی سازی سند[۲]
- حذف نشانهها و فرمت[۳]
- نشان گذاری[۴]
۳- فیلتر کردن[۵]
۴- ریشهیابی[۶]
۵- وزن دادن[۷]
۶- رتبه بندی[۸]
[1]- Indexing [2]- Document Linearization [3]- Markup and Format Removal [4]- Tokenization [5]- Filtration [6]- Stemming [7]- Weighting [8]- Ranking [1]-Information Retrieval(IR) System [2]-Document [3]-Relational Stand-Alone Database [4]-Hypertext Networked Database [5]- Browsing [6]- Quering
فهرست مطالب
فهرست مطالب
فصل ۱: بازیابی اطلاعات ۵
۱-۱- سیستم بازیابی اطلاعات ۶
۱-۲- مراحل بازیابی اطلاعات ۷
۱-۲-۱- شاخصگذاری (ایندکسبندی) ۷
۱-۲-۲- خطیسازی سندها ۸
۱-۲-۳- فیلتر کردن ۱۰
۱-۲-۴- ریشهیابی کلمات ۱۲
۱-۲-۵- وزندهی ۱۴
۱-۳- معیارهای صحت و کیفیت در بازیابی ۱۶
۱-۴- الگوهای وزندهی ۱۷
۱-۴-۱- وزندهی با فرکانس کلمات ۱۷
۱-۴-۲- مدل فضای برداری سالتون ۲۲
۱-۴-۳- وزنهای محلی ۲۳
۱-۴-۴- وزنهای سراسری ۲۴
۱-۴-۵- چگالی کلمات کلیدی ۲۵
۱-۴-۶- نارساییهای چگالی کلمه ۲۶
۱-۵- سایر روشهای پیش پردازش زبانی ۲۶
۱-۵-۱- تشخیص زنجیرههای مرجعیتی ۲۷
۱-۵-۲- برچسب زنی معنایی نقش کلمات ۲۸
۱-۵-۳- برچسب زنی نحوی لغات ۲۸
فصل ۲: معرفی ابزار بازیابی اطلاعات Matlab 30
2-1- مقدمه ۳۱
۲-۲- نحوه نصب ابزار TMG 33
2-3- ابزار شاخصگذاری (ایندکسگذاری) ۳۵
۲-۴- ابزار کاهش ابعاد ۳۹
۲-۵- ابزار فاکتورگیری نامنفی ماتریس ۴۲
۲-۶- ابزار بازیابی اطلاعات ۴۵
۲-۷- ابزار خوشهبندی ۴۸
۲-۸- ابزار دستهبندی ۵۰
فصل ۳: ضمائم ۵۳
۳-۱- تبدیل دادهای ۵۴
۳-۱-۱- تجزیه ویژهمقدار ۵۴
۳-۱-۲- شاخصگذاری معنایی پنهان (LSI) 55
3-1-3- فاکتورگیری نامنفی ماتریس (NMF) 61
3-1-4- مقایسه NMF با LSI 62
3-2- خوشهبندی ۷۰
۳-۲-۲- رویه خوشهبندی ۷۱
۳-۲-۳- اندازهگیری شباهت ۷۲
۳-۲-۴- ساختارهای داده ۷۳
۳-۲-۵- ارزیابی ۷۴
۳-۳- خوشهبندی متنی ۷۴
۳-۳-۲- الگوریتم خوشهبندی k-Means 75
3-3-3- الگوریتم خوشهبندی Bisecting Kmeans 77
3-3-4- معیارهای خارجی کیفیت خوشهبندی ۸۰
مراجع ۸۳