سناریوهای ذکر شده در بخش ۱.۲ علمی تخیلی نیستند. برای دستیابی به آنها نیازی به پیشرفت علمی انقلابی نیست. میتوان به صورت منطقی ادعا نمود که چالش در پذیرش فناوری و مهندسی است و نه از لحاظ علمی: راهحلهای جزئی برای همه بخشهای مهم مساله وجود دارد. در حال حاضر بیشترین احتیاجات در زمینههای مجتمعسازی، استاندارد کردن، توسعه ابزار و تطبیق کاربران است. اما البته پیشرفت بیشتر فناوری، به وب معنایی پیشرفتهتری به نسبت آنچه امروزه قابل دستیابی است، منجر میشود.
در بخشهای آتی به چند فناوری ضروری برای دستیابی به عملکردهای ذکر شده اشاره مینماییم.
۱.۳.۱ابر داده صریح
در حال حاضر محتوای وب برای خوانندگان انسان شکل گرفته است تا برای برنامه ها. HTML زبان غالبی است که صفحات وب با آن (به طور مستقیم یا با استفاده از ابزار) نوشته میشوند. بخشی از یک صفحه وب معمول متعلق به یک درمانگر ممکن است به صورت زیر باشد:
<h1>Agilitas Physiotherapy Centre</h1>
Welcome to the Agilitas Physiotherapy Centre home page.
Do you feel pain? Have you had an injury? Let our staff
Lisa Davenport, Kelly Townsend (our lovely secretary)
and Steve Matthews take care of your body and soul.
<h2>Consultation hours</h2>
Mon 11am – 7pm<br>
Tue 11am – 7pm<br>
Wed 3pm – 7pm<br>
Thu 11am – 7pm<br>
Fri 11am – 3pm<p>
But note that we do not offer consultation
during the weeks of the
<a href=”. . .”>State Of Origin</a> games.
برای انسانها اطلاعات به صورت رضایتبخشی ارائه شده است، اما ماشینها مشکلات خود را خواهند داشت. جستجوهای مبتنی بر کلمه کلیدی، کلمات physiotherapy و consultation hours را تشخیص میدهند. و حتی یک عامل هوشمند ممکن است قادر به تشخیص پرسنل مرکز باشد. اما در تشخیص درمانگرها از منشی دچار مشکل خواهد شد و حتی در یافتن ساعات واقعی مشاوره مشکلش حادتر میگردد. (برای این کار نیاز است تا پیوند State Of Origin games را دنبال کند تا زمان برگزاری آنها را بیابد.)
رویکرد وب معنایی برای حل اینگونه مسائل توسعه عاملهای ابرهوشمند نیست. در عوض پیشنهاد میکند از سمت صفحه وب به مشکل حمله شود. اگر HTML با زبان مناسبتری جایگزین گردد، صفحات وب میتوانند محتوای خود را با خود حمل کنند. آنها علاوه بر شمول اطلاعات فرمت که به ایجاد یک سند برای مخاطبان انسان کمک میکند، دارای اطلاعاتی در مورد محتوایشان نیز میباشند. در مثال ما ممکن است اطلاعاتی همانند آنچه در ادامه آمده وجود داشته باشد:
<company>
<treatmentOffered>Physiotherapy</treatmentOffered>
<companyName>Agilitas Physiotherapy Centre</companyName>
<staff>
<therapist>Lisa Davenport</therapist>
<therapist>Steve Matthews</therapist>
<secretary>Kelly Townsend</secretary>
</staff>
</company>
این ارائه به مراتب آسانتر توسط ماشینها قابل پردازش است. لغت ابرداده به چنین اطلاعاتی ارجاع داده میشود: دادههایی درباره دادهها. ابرداده بخش معنای دادهها را در خود دارد، کلمه معنا در وب معنایی از اینجا ناشی شده است.
در سناریوهای نمونه ما در بخش ۱.۲ به نظر میرسید موانعی در برابر دسترسی به اطلاعات صفحات وب از قبیل جزئیات درمان، برنامههای زمانی و قرار ملاقاتها، قیمتها و توصیف محصولات، وجود ندارد. به نظر میرسد تمام اطلاعات میتوانند بطور مستقیم از محتوای وب موجود بازیابی شود. اما همانطور که شرح داده میشود، این اتفاق با استفاده از دستکاری داده مبتنی بر متن رخ نمیدهد بلکه با سودبری از ابرداده قابل پردازش برای ماشین صورت میگیرد.
با توجه به توسعه کنونی در صفحات وب، کاربران نیازی به مهارت در زمینه علوم کامپیوتر برای ایجاد صفحات وب ندارند و میتواننداز طریق ابزاری بدین هدف نایل آیند. هنوز این سوال مطرح است که چرا کاربران باید به اینگونه مسائل اهمیت دهند و چرا باید به خاطر زبانهای وب معنایی HTML را رها کنند. شاید اگر موقعیت امروزی را با دوران آغازی وب مقایسه کنیم، بتوانیم پاسخی خوشبینانه به این سوال دهیم. کاربران ابتدایی HTML را برگزیدند زیرا به صورت یک استاندارد درآمده بود و فوایدی از آن انتظار میرفت که متناسب با پذیرندگان ابتدایی بود. دیگران با توجه به ظهور ابزارهای بهتر و بیشتر به سمت آن رفتند و به زودی HTML تبدیل به استاندارد پذیرفته شده جهانی شد.
به طور مشابه، در حال حاضر پذیرش سریع XML را مشاهده میکنیم. XML اولین قدم مهم است، هرچند برای درک دید وب معنایی کافی نیست. کاربران ابتدایی، احتمالا برخی سازمانهای بزرگی که به مدیریت دانش و تجارت الکترونیک B2B علاقمندند، XML و RDF را به عنوان استانداردهای W3C مرتبط با وب معنایی کنونی میپذیرند. و این شتاب به فروشندگان ابزار و کاربران برگزیننده فناوری بیشتر و بیشتر منجر میگردد.
این یک گام قطعی در سرگذشت وب معنایی خواهد بود، اما همچنان یک چالش است. همانطور که اشاره شد بزرگترین چالش کنونی یک چالش علمی نیست بلکه پذیرش فناوری است.
۱.۳.۲هستان شناسی
واژه هستان شناسی از فلسفه سرچشمه گرفته است. در این زمینه، از آن به عنوان نام یک زیر رشته استفاده میگردد، به عبارت دیگر، مطالعه ماهیت وجود (ترجمه تحت اللفظی از Oντoλoγiα کلمه یونانی) ، شاخه ای از متافیزیک است که در رابطه با شناسایی انواع چیزهایی که در واقع وجود داشته و چگونگی توضیح آنها ، می باشد. به عنوان مثال مشاهده آنکه جهان از اشیاء خاصی ساخته شده است که می تواند به کلاس های انتزاعی، بر اساس خواص مشترک تعهد هستیشناسی معمولی، دسته بندی شود.
با این حال ، در سال های اخیر ، هستیشناسی یکی از کلماتی است که بوسیله علوم کامپیوتر ربوده شده است و یک معنای ویژه فنی پیدا کرده است که بسیار متفاوت با معنای اصلی آن است. در حال حاضر ما برای اهداف خود از واژه “یک هستیشناسی ” بجای هستیشناسی صحبت میکنیم، ما از تعریف T. R. Gruber’s که بعدها توسط R. Studer دوباره تعریف شده است استفاده میکنیم:هستیشناسی بیانی صریح و رسمی از ویژگی های مفاهیم است.
به طور کلی، هستیشناسی یک حوزه از سخن را بطور رسمی توصیف میکند. . به طور معمول ، هستی شناسی شامل یک لیست محدود از اصطلاحات و روابط بین آنهاست. این اصطلاحات، مفاهیم مهم(کلاسهایی از اشیا)را در یک دامنه، مشخص میکند. به عنوان مثال ، در محیط دانشگاه ، کارکنان ، دانش آموزان ، دوره ها ، سالن سخنرانی ، و رشته های برخی از مفاهیم مهم است.
روابط به طور معمول شامل سلسله مراتب کلاس ها است. یک سلسله مراتب مشخص میکند کلاسc زیر کلاسی از کلاس *c است اگر هر جسم در c در *c نیز گنجانده شده باشد. به عنوان مثال ، تمام اعضای هیات علمی عضو کارکنان هستند. شکل ۱.۱ سلسسله مراتب حوزه دانشگاه را نشان میدهد.
به غیر از روابط زیر کلاسی، هستیشناسی ممکن است شامل اطلاعات زیر باشد:
•خصوصیات(x میآموزد به y )،
•محدودیت های مقدار( تنها اعضای هیات علمی میتوانند تدریس کنند)،
•عدم ارتباط وضعیتها (هیات علمی و کارکنان عمومی غیر مرتبط هستند)
•خصوصیات روابط منطقی بین اشیا(هر دانشکده حداقل باید ده عضو هیات علمی داشته باشد)
هستی شناسی در زمینه وب، فهم مشترکی از یک زمینه ارائه میدهد. چنین درک مشترکی برای غلبه بر تفاوت در اصطلاحات لازم است. کاربرد کد زیپ ممکن است مشابه دیگر کاربرد کد در ناحیه باشد. مشکل دیگر این است که دو کاربرد ممکن است از یک اصطلاح مشترک با معانی متفاوت استفاده کنند. در دانشگاه الف ممکن است درس به یک رتبه(مانند علوم کامپیوتر) اشاره کند در حالی که در دانشگاه ب به یک شئ واحد(cs 101) اشاره میکند. چنین مشکلاتی میتواند با نگاشت اصطلاحات خاص به یک هستیشناسی مشترک و یا تعریف یک نگاشت مشترک بین هستیشناسیها مرتفع گردد. در هر حال میتوان به راحتی مشاهده نمود که هستیشناسی از معانی به صورت قابل تفسیری حمایت میکند.
هستیشناسی برای سازماندهی و مسیریابی وب سایتها مفید است. امروزه بسیاری از وب سایتها در سمت چپ صفحات خود سلسله مراتب مفاهیم سطح بالای اصطلاحات خود را به نمایش میگذارند. کاربر ممکن است یکی از آنها را کلیک کند تا بتواند زیر دستههای آن را گسترش دهد.
همچنین ، هستی شناسی برای بهبود دقت جستجوهای وب مفید است. موتورهای جستجو می توانند به دنبال صفحهای بگردند که در هستیشناسی خود به طور دقیق به مفاهیم اشاره میکنند یه جای اینکه در تمام صفحات، که لغات به صورت کلی مبهم اتفاق می افتند، بگردند. بدین ترتیب میتوان بر تفاوت اصطلاحات بین وب سایتها و جستجوها غلبه کرد.
علاوه بر این، جستجوهای وب میتوانند از قابلیت تعمیم دادن/خصوصی ساختن اطلاعات استفاده کنند. اگر یک جستجو در یافتن هر گونه صفحات مرتبط شکست بخورد، موتور جستجو ممکن است یک جستجوی عمومیتر را به کاربر پیشنهاد دهد. حتی ممکن است موتورهای جستجو، چنین جستجوهایی را به طور پیش گستر، به منظور کاهش زمان واکنش در مورد قبول پیشنهاد، توسط کاربر اجرا کند. یا اگر پاسخهای زیادی یافت شد، موتور جستجو ممکن است موارد خاصی را به کاربر پیشنهاد دهد.
در هوش مصنوعی سابقه طولانی از گسترش و استفاده از زبان هستیشناسی وجود دارد. این اساس پژوهشهای وب معنایی است. در حال حاضر مهمترین زبانهای هستیشناسی در وب به شرح زیر میباشند:
•RDF یک مدل دادهای برای اشیا (منابع) و روابط بین آنهاست؛ که مفاهیم سادهای برای این مدل دادهای فراهم میکند؛ این مدل دادهای میتواند به وسیله XML syntax نمایش داده شود.
•RDF Shema یک زبان توصیف لغوی برای تشریح ویژگیها و کلاسهای منابع RDF، همراه با مفاهیمی برای عمومیسازی سلسله مراتب آن ویژگیها و کلاسها است.
•Owl یک زبان توصیف لغوی قویتر برای تشریح ویژگیها و کلاسها است، از قبیل روابط بین کلاسها (مانند” “disjointnes )، cardinality (مثلا “دقیقا یک”
، برابری، انواع غنیتری از ویژگیها، خصوصیات ویژگیها(به عنوان مثال “تقارن”
و کلاسهای شمارش شده.

