كلمه اینترنت مخفف "Interconnected Networks" و به معنی شبكههای بههممرتبط است. اینترنت سیستمی برای توزیع و تبادل اطلاعات در سطح جهان است كه براساس آخرین آمار موجود در حال حاضر ۲۲۶ كشور به آن متصل هستند. این مجموعه به همراه فناوریهای ساده كاربردی، سبب كاهش هزینهء نشر الكترونیكی شده است (۱).در هر صورت، وب یك عنصر منسجم و واضح مستقل نیست، بلكه دو عنصر مجزای وب وجود دارند: وب قابلرویت و دیدنی، و وب نامرئی و غیرقابل رویت(۲).برای فهم كاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد كه از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید میشوند.دو نوع صفحهء وب وجود دارند: استاتیك و دینامیك.صفحات وب استاتیك توسط طراح وب، در خدماتدهندهء وب نصب میشوند و برای هر كس و هر چیزی كه وب سایت را مشاهده كند قابل دسترساندو هر تغییری هم باید به صورت دستی انجام شود.صفحات وب دینامیك توسط رایانه با بهكارگیری دستورهای یك زبان دستنوشته(۱) و اغلب «سیجیآیجاوا»(۲)كه به عنوان پلی بین سرویسگرهای پروتكل انتقال ابرمتن (۳) و كاربران وب عمل میكند، ایجاد می شود.دستورهای یك زبان دستنوشته، نتایج را در یك صفحهء خالی وب جا میدهند و به كاربر، صفحهء وب دینامیك را ارائه میدهند. صفحات وب استاتیك اطلاعات عام و كلی را برای كاربر تهیه میكند، در حالی كه صفحات وب دینامیك، اطلاعات منحصربهفرد را برای كاربر تهیه مینمایند. صفحات وب استاتیك برای همهء كاربران قابل رویتاند و در دسترس می باشند.اولین مطالعه در موسسه تحقیقاتی «انئیسی» در پرینستون آمریكا در دسامبر سال ۱۹۹۷ نشان داد كه صفحات وب قابل رویت، حداقل ۳۲۰ میلیون صفحهء وب را شامل میشوند، در حالی كه دومین مطالعه تخمین زد كه تعداد صفحات وب رشد كرده و به ۸۰۰ میلیون صفحه در فوریه سال ۱۹۹۹ رسیدهاند. در هر صورت، اكثر ناشرین اطلاعاتشان را بر روی وب به وسیلهء پایگاههای اطلاعاتی بزرگ توزیع میكنند. این اطلاعات اساسا جنبه تجاری دارد (۲).
موتورهای جستجوگر(۴) و راهنماهای وب
۲. ۱. راهنماهای وب
چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب:
الف. فهرستی از سایتهای وب كه از قبل تعیین شدهاند، میباشد؛
ب. توسط ویراستاران جمعآوری شده؛
ج. براساس موضوع و عنوان طبقه بندی شده؛
د. انتخابی است.
با توجه به این كه راهنماهای وب توسط افراد جمعآوری میشوند, تصمیمگیری دربارهء كیفیت محتوای هر یك از سایتهای وب قبلا انجام شده است. در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار میگیرند، زیرا كاربران به دنبال موضوعات خاصی در اینترنت هستند كه این راهنماها، نقطهء شروع خوبی در تشخیص بهترینها در وب میباشند.در كاربرد راهنماهای وب، كاربر میتواند در بین فهرستهای راهنما حركت نماید. راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم میدهند. مثلا بزرگترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را میدهد.
سایتهای وبی كه به وسیلهء راهنمای وب نمایهسازی شدهاند، به علت روند تكمیل به صورت دستی، در آن راهنماها باقی میمانند؛ مگر این كه به احتمال بسیار ضعیف به صورت دستی حذف شوند. در حالی كه وجود دائمی یك لیست یا یك فهرست در موتور جستجو همیشه ضمانت نمیشود، اما ساختن و حضور دائمی یك فهرست در یك راهنمای وب مثل «یاهو» امكانپذیر میباشد.
۲ . ۲ .۱. اسپایدرهای موتورهای جستجوگر
پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته میشود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام میشود.«اسپایدرها» برنامههایی هستند كه وب را به دنبال صفحات جدید وب جستجو مینمایند، كلمات را نمایهسازی میكنند و اتصال را به صفحات برقرار مینمایند، سپس كلمات نمایهشده را با آدرسی كه به یك صفحهء وب یا هر منبعی كه بر روی وب جهانی و به طور كلی اینترنت قرار دارد اشاره مینماید,(۶) مقابله میكنند.
۲. ۲ .۲. نمایهء پایگاه اطلاعاتی موتور جستجو
این بخش عنصر اصلی از هر موتور جستجو است. این همان چیزی است كه كاربر به دنبال آن است. در طی سال ۱۹۹۸ تعدادی از تولیدكنندگان موتورهای جستجو آغاز به كار كردند. این شركتها نمایهها را مطابق با معیارهای گوناگون ساختند. بطور مثال می توان از نمایهء «دایركت هیل» و «گوگل» (۷) نام برد و نیز «نمایهء نامهای حقیقی» (۸) كه شركتها را قادر میسازد واژههای كلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
۲ . ۲ . ۳ . نرمافزار بازیابی اطلاعات
تمامی موتورهای جستجوگر، نرمافزار مختص به خود برای پاسخگویی به سوالات دارند.موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل مینمایند: هر سایت وب شامل كلمات یا واژههایی است كه سوءال كاربر را با آنها مقابله میكند. و در صفحهء نمایش، به صورت فهرستوار نمایش میدهد و با توجه به سوال كاربر و ارتباط موضوعی، فهرستی از مطالب را طبقهبندی مینماید. تفاوت مختصری در چگونگی كار الگوریتمها بین موتورهای جستجو وجود دارد، كه دلیلی بر این مدعااست كه كاربران، با یك پرسش واحد, از موتورهای مختلف نتایج متفاوتی را كسب مینمایند. در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجوگر میباشد.
۳ . پورتالها
«پورتال»(۹) ها سایتهای وبی هستند كه خود عرضهكنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایتهای موردعلاقهشان هدایت میكنند. «پورتال» ها نقاط اصلی برای راهبردهای تجارت الكترونیكی هستند و به تدریج از سال ۱۹۹۴ به وسیلهء سه نوع شركت اینترنتی به وجود آمدند. این شركتها كه نقش اساسی در توزیع زنجیرهء اطلاعاتی برای كاربر ایفا میكنند به شرح زیر میباشند:
الف. تولیدكنندگان خدمات اینترنتی(۱۰)
ب. سایتهای جستجو(۱۱)
ج. تولیدكنندگان مرورگر(۱۲)
سایت «اكسایت»(۱۳) نمونهای كه از یك سایت پورتال موفق است(۱).
۴. توسعه و تكامل فناوری جستجو
همهء ما تكامل زندگی بشر بر روی كره خاكی را به خاطر داریم. همانطور كه همگی ما میدانیم، شكلهای مختلف زندگی سلولی برای مدتهای بسیار طولانی قبل از تكامل زیستی وجود داشته است. در هر صورت هنگامی كه به این نقطه از تكامل دست یافتیم، تغییرات به فرم سازمانیافتهء آن در مدت زمان كمتری به انجام رسید.همین مطلب برای فناوری جستجوی وب نیز صادق است. با تاكید بر روی پورتالیزیشن و تجارت الكترونیكی، اولین نسل سایتهای جستجو، عملاً و به تدریج فراموش شدند و این در حالی است كه آنها تا سالهای متمادی، حكومت اصلی را به عهده داشتند؛ اما بدلیل این كه نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدكنندگان جستجو به بهرهبرداری رسیدند.۴ .۱. موتورهای جستجوی ماورا
موتورهای جستجوی ماورا(۱۴) به كاربر این امكان را میدهند كه از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (۲و۳).
محبوبترین موتورهای جستجوی ماورا به شرح زیر میباشند:
- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- ۲Q ( www.۲q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com )
- Webtaxi ( www.webtaxi.com )
۴ .۲. نسل اول موتورهای جستجو كه توسط سایتهای وب بصورت«اسپایدر», نمایهسازی را ایجاد كردند، انبوهی از واژهها و كلمات را تجزیه و تحلیل نمودند. راهنماهای وب به طور دستی گردآوری شدند و از آوریل ۱۹۹۸ مورد بهرهبرداری قرار گرفتند: یكی از این راهنماها به نام «دایركت هیل»(۱۵)یك حركت ریشه ای را آغاز كرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(۱۶) نامید.این راهنمای وب ادعا میكرد كه در زمان جستجو، كنترل با كاربر است و نتایج به صورت طبقهبندی شده بر روی سایت وب نمایان میشوند. این موتور جستجو، آنچنان كه ادعا میكرد نتوانست خدمات منحصربهفردی را ارائه نماید. بنابراین موتور جستجوی دیگری به نام «هاتبات»(۱۷)به جای آن تولید شد (۲).
۴ .۳. جستجوی زبان طبیعی
همانطور كه قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژههایی كه توسط كاربران ارائه میشدند عمل مینمودند. آنها به محتوای واژههای جستجو توجه نمی كردند. برای مثال به ارتباط منطقی بین واژههای جستجو و دیگر معناهای لغوی توجه نمیشد، به علاوه، لغات را به صورت تحتاللفظی جستجو میكردند و به واژهها و توصیفگرهایبولی نظیر and, or, not توجه نداشتند. دو موتور جستجوی جدید یكی پس از دیگری در طول یك هفته آغاز به كار كردند. این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد كردند:
الف.Ask Jeeves www.askjeeves.com
این موتور جستجو در اول ژوئن سال ۱۹۹۸ شروع به كار كرد و به عنوان اولین موتور جستجوی زبان طبیعی بر روی اینترنت معرفی شد. این موتور جستجو سوءال كاربر را با استفاده از پایگاه اطلاعات هفت میلیونی سوءالات، پاسخ میداد. اگر هیچ گونه مقایسهای وجود نداشت، سپس نزدیكترین واژه از پایگاه برای كاربر ارائه میشد و سوءال میشد كه مناسبترین آن را انتخاب كند. این موتور جستجو همچنین كاربر را به موتورهای جستجوی دیگری نیز راهنمایی میكند، مانند «یاهو»، «لیكاس», «اینفوسیك» و «آلتاویستا».
ب. دومین موتور جستجو به نام Electric Monk چند هفته بعد آغاز به كاركرد. این موتور جستجو با استفاده از زبان طبیعی، الگوریتم سوءالات كاربران را پاسخ میگوید. این الگوریتم با استفاده از اصطلاحنامه، به واژههای مرتبط نیز توجه میكند. جستجو از طریق زبان طبیعی در این موتور جستجوگر، سپس به صورت سوءالات مركّب بولی درآمد و به «آلتاویستا» تسلیم شد.
۴ .۴. تجزیه و تحلیل متكی بر اتصال
موتورهای جستجوی نسل اول برای ساخت نمایههای عظیم با هدف پاسخگویی به هر نوع سوال ساخته شدند. آنها به محتوای هر صفحهء خاص تأكید داشتند كه چگونه این صفحات به هم مربوط میشوند و اتصال مییابند. همانطور كه قبلا گفته شد، روش نمایهسازی آنها به دلیل بیتوجهی به تركیب زبان، ساخت جملات و مترادفها با شكست روبرو شد.تجزیه و تحلیل متكی بر اتصال سعی دارد كه با بررسی ارتباط بین صفحات، بر این مشكلات فائق آید. موتورهای جستجوگر متكی بر اتصال به سرعت رشدكردهاند و از نظر كاربران اینترنت در حال حاضر از محبوبیت خاصی برخوردارند.
۴.۴.۱.«گوگل»(۱۸)
این موتور جستجوگر نیز مانند «یاهو» توسط دانشجویان دانشگاه استانفورد ایجاد شد این فناوری با استفاده از روشی با نام «رتبهبندی صفحه»(۱۹) وب، به دیگر موتورهای جستجو متصل میشود. اگر شما، به عنوان یك نویسندهء سایت وب، به دیگر سایتهای وب از جهت اهمیت آن سایتها متصل شوید، می توانید داوریها و پیشنهادهایی دربارهء سایت ارائه دهید. همانطور كه راهنماهای وب نظیر «یاهو» توسط ویراستاران به صورت دستی جمعآوری و تالیف گردیدهاند. «گوگل» هم به دنبال اعلام قضاوت میلیونها نویسندهء سایت وب به صورت خودكار طراحی شد.البته این موتور جستجو در مقایسه با «یاهو» با سایتهای وب بیشتری دسترسی دارد. در حقیقت برخلاف دیگر موتورهای جستجوگر، كه هر چه نمایههای آنها گستردهتر میشود، كمتر مفید واقع میشوند، «گوگل» ادعا دارد كه با گستردگی نمایهها و عظیمتر شدن آنها، به نتایج بهتری دست یافته است. از دیگر موتورهای جستجو كه با استفاده از الگوریتم طبقهبندی عمل مینمایند میتوان از«هاتبات» و «اكسایت» نام برد. «گوگل» تنها موتور جستجویی است كه به طور بسیار گسترده ای جستجوهایش متكی بر اتصال میباشند. تخمین زده شده كه نمایهء این موتور جستجوگر بین ۷۰ تا ۱۰۰ میلیون صفحه میباشد، اما از طریق اتصال، قدرت دسترسی به بیش از ۳۰۰ میلیون صفحهء وب نیز به كاربر اینترنت داده میشود. دسترسی بیشتر و صحت نتایج جستجوی بیشتر سبب گردیده كه این موتور جستجو در ردیف ده موتور جستجوی محبوب در شبكهء اینترنت قرار گیرد.
۴.۴.۲. (۲۰)Clever
با توجه به «نمایهنامهء استنادی علوم»(۲۱) (مطالعهء ارجاعی مقالات علمی با یكدیگر) clever جستجوی واژههای كلیدی را براساس تلفیق كلمات و ارتباط مطالب بررسی مینماید. این موتور جستجوگر نیز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ میدهد. ولی برخلاف «گوگل» ابتدا سوءال را به دیگر موتورهای جستجو نظیر «آلتاویستا» تسلیم میكند و سپس كاربر را به صفحاتی كه از نتایج جستجو كسب شدهاند راهنمایی مینماید. این موتور جستجو توسط شركت «آیبیام» ایجاد شده.۴.۴.۳. Focused Crawler
یكی دیگر از موتورهای جستجویی كه توسط شركت،« آیبیام» ایجاد شده. این موتور جستجو البته به اندازهء clever گسترش پیدا نكرد. برخلاف دیگر موتورهای جستجو نظیر «گوگل» و clever، این موتور جستجو مجموعهای بسیار مناسب و در ارتباط با موضوع را از طریق وب جستجو مینماید. به زبانی دیگر، این موتور جستجو فقط سایتهای وبی را جستجو میكند كه در ارتباط با پرسش كاربر میباشند.
جستجوی گروههای خبری
در حالی كه در حال حاضر وب به مثابه مخزن اولیهء دانش بشری بر روی اینترنت میباشد، تنها مخزن هم به حساب نمیآید. گروههای خبری، محلی است كه گروهی از افراد، تجربیات، افكار و دانش خود را در مورد یك موضوع مورد علاقه، برای بازیابی اطلاعات به اشتراك میگذارند. تفاوت بین وب و گروههای خبری در این است كه وب مجموعهای از دانش بشری را به طور صریح و روشن ارائه میكند. در حالی كه گروههای خبری مجموعهای از دانش بشری را به طور ضمنی و غیرصریح ارائه مینمایند.دانش صریح و روشن میتواند به افراد و موءسسات كمك كند تا از اطلاعات و تجارب گذشته برای برنامهریزی آینده كمك بگیرند، اما دانش غیرصریح و ضمنی مجموعهای از تجارب و عقاید و خلاقیتهایی است كه برای استخراج اطلاعات صریح و روشن مورد نیاز میباشد.
۴.۴.۴. اطلاعات شركتها
سایتهای زیادی دربارهء معرفی شركتها و تولیدكنندگان اطلاعات تجاری وجود دارند. هر محققی میتواند از این سایتها بازدید كند. چنین سایتهایی دارای پایگاههای تجاری میباشند. یك بررسی بر روی نامهای شركتها براساس عملكرد موتورهای جستجوگر پیشرو و راهنماهای وب برای انتقال نتایج مناسب برای پژوهشگراننشاندادكه «سراچ انجین واچ»(۲۲)و«هاتبات» و «گوگل» در ردهبندی، در ردههای ابتدایی قرار میگیرند.در آگوست ۱۹۹۹، موتور جستجوگر «جامپ»(۲۳) آغاز به كار نمود. این موتور جستجوگر دارای یك نمایهء تخصصی است كه بر اطلاعات و خبرهای مربوط به شركتها تأكید دارد. این موتور جستجوگر فهرستی از شركتها، شامل اطلاعاتی نظیر عناوین شركتها، قدمت، زمینهء موضوعی و آدرس پست الكترونیكی و ثبت اختراعات، و شركتهای وابسته به آن شركت را نیز معرفی مینماید (۲و۳).
۴.۴.۵. فایلهای تصویری و چندرسانه ای
تقریباً ۷۰ درصد از صفحات وب غیرمتنی هستند. آنچه مسلم است كاربرد, مفاهیم را به همراه تصاویر بهتر از اطلاعات فقط به صورت متنی درك مینماید. سه موتور جستجوی تخصصی اصلی كه فایلهای تصویری و چندرسانهای را ارائه میدهند، در این زمینه به شرح زیر میباشند.
Ditto ( www.ditto.com )
Scour ( www.scour.net )
Altavista photo finder( www.altavista.com )
مقایسهء ابزارهای جستجو در اینترنت
این روزها اینترنت منبع اصلی تهیهء منابع اطلاعاتی شناخته شده است. ابزارهای مهمی برای كمك به یافتن اطلاعات در این فضای اطلاعاتی وجود دارند. راهنماها و موتورهای جستجوگر پایگاههای اطلاعاتی هستند كه به روند دریافت اطلاعات سرعت میبخشند. این ابزارها اسناد را با استفاده از زبان علامتگذاری ابرمتن(۲۴) جمعآوری، ذخیره و تنظیم مینمایند. قبل از ظهور اینترنت اكثر پایگاههای اطلاعاتی كتابشناختی نقش اصلی را در بازیابی اطلاعات ایفا میكردند. با توسعهء نرمافزارهای جستجو، اطلاعات علمی به راحتی قابل دستیابی شدند. تعداد ابزارهای جستجو در اینترنت به طور مداوم در حال رشد است. در این مقاله تعداد ده ابزار جستجو در اینترنت از قبیل راهنماها و موتورهای جستجوگر براساس تعداد صفحات اتصال، انتخاب شدهاند.نتایج ارزیابی ابزارهای جستجوی اینترنت با توجه به معیارهای اصلی بازیابی اطلاعات در جدول یك نشان داده شده است. شش معیار برای ارزیابی وجود دارد و حداكثر نمره ۶ میباشد.تقریبا همهء ابزارهای جستجو چهار معیار اصلی را دارند. غیر از Nerdworld كه از شش عملگر منطقی بولی فقط از OR استفاده می نماید,و «یاهو» كه عملگر پرانتز را قبول نمی كند, اختلافات دیگری نیز وجود دارند. «اینفوسیك» از عملكرد ستاره (*) استفاده نمیكند و «لیكاس» و «وب كراولر» سیستم را ملزم میكنند كه ستاره را به عنوان اولین حروف كلمات در جستجو استفاده نماید.تنها ابزارهای جستجوی اینترنت كه جستجوی كاملی را ارائه می دهند «لیكاس» و «اینفوسیك» هستند. با توجه به جستجو براساس طبقهبندی موضوعی، فقط دو راهنما یا دایركتوری «یاهو» و Nedworld همهء صفحاتشان طبقهبندی و دستهبندی شده است. و Northen light تنها موتور جستجوگر میباشد كه اجازهء جستجو براساس طبقهبندی را نمی دهد (۲). در «نورثرن لایت» این امكان وجود دارد كه به وسیلهء نواحی (۲۵)، جستجو انجام شود. در دیگر موتورهای جستجوگر این امكان كمتر وجود دارد. با توجه به جدول شماره ۳، «نورثرن لایت» از تعداد ۹ ناحیه شش ناحیه شامل: عنوان, نشانی، «یوآراِل», كشور، زبان، تاریخ، و نوع سازمان را جستجو مینماید.و بالاخره سه ابزار جستجوی باقیمانده یعنیWeb Crawler, Nerdworld and Aolnet findامكان جستجو از طریق نواحی را ارائه نمیدهند.در اینجا باید توجه كرد مهمترین نواحی مورد توجه در ارتباط با جستجو، عنوان، «نشانی» یوآراِل, و زبان میباشند.هیچ اختلافی در میان موتورهای جستجوگر و راهنماها در مورد استفاده از ناحیه وجود ندارد. از تعداد دو راهنما در این مقاله، «یاهو» پنج ناحیهء قابل جستجو را پیشنهاد میكند و «نِرد وُرلد» هیچ ناحیهای را پیشنهاد نمینماید. ضمنا دیگر موتورهای جستجوگر نیز در مورد استفاده از نواحی ناهمگون هستند.با توجه به قابلیت مرور(۲۶) و نظراندازی، موتورهای جستجوگر به شرح زیر امكان مرور و نظراندازی را ارائه میدهند.«اكسایت»، «لیكاس»، «آلتاویستا», «هاتبات»، «نورثرن لایت». به موتورهایجستجوگر نظیر «نورترون لایت» و «آلتاویستا» امكان استفاده از ناحیهء كشوری را ارائه میدهند.سهابزار جستجوكهقادرند دستورها(۲۷) رابه كارببرند شامل «آلتاویستا», «هاتبات» و «اینفوسیك» میباشند. این سه موتور جستجوگر پس از جستجوی یككلمهای، فهرستی از واژههای تركیبی را برای راهنماییهای بعدی و گسترش ارائه میدهند.
درجهبندی موتورهای جستجوگر
نتیجهگیری
مهمترین نتیجهء قابل توجه این است كه هیچ ارتباطی بین محبوبیت و قابلیت جستجوی اطلاعات در میان ابزارهای جستجوی مورد مطالعه وجود ندارد. دو مثال واضح از این یافتهها «نورثرن لایت» و «یاهو» میباشند. اگر چه «نورثرن لایت» كمترین شهرت و محبوبیت را در ردهبندی از نظر اتصال دارا میباشد، این موتور جستجوگر اولین مقام را در ردهبندی از نظر امكانات و قابلیتهای بازیابی اطلاعات كسب نموده است. در حالی كه «یاهو» یكی از محبوبترین ابزارهای جستجو میباشد، ولی از نظر بازیابی اطلاعات، در ردهء پایینی قرار دارد.این بررسی تفاوت عمدهای را بین موتورهای جستجوگر یا راهنماهای وب نشان نداد. در جمعآوری اطلاعات و تجزیه و تحلیل اسناد، راهنماها قابل اعتمادترند، زیرا سیستمهای دستی استفاده میكنند. موتورهایجستجوگر نیز به دلیلاستفاده از دستورهای(۲۸) زبان علامتگذاری فوقمتن یا ابرمتنها(۲۹) اهمیت دارند. هرچند روشن نیست كه نتایج قابلتوجهی را ارائه دهند.اگرچهراهنماهاوموتورهایجستجوگر پایگاههایی هستند كه صفحات زبان علامتگذاری فوقمتن را فهرست میكنند، از نقطه نظر بازیابی اطلاعات، با توجه به دلایل زیر نسبت به پایگاههای اطلاعاتی كتابشناسی معمولی دارای امكانات كمتری هستند.
- تعدادی از ابزارهای جستجو تمامی امكانات موجود در پایگاههای اطلاعاتی كتابشناختی معمولی را ندارند.
- محدود نمودن بازیابی به وسیله نواحی، چندان در ابزارهای جستجو در اینترنت رایج نیست.
- محققین سوءالاتی دربارهء نواحی عنوان نشانی كه به یك صفحهء وب، یا هر منبعی بر روی وب جهانی و به طور كلی اینترنت اشاره میكند دارند، كه تنها در نیمی از ابزارهای جستجو در اینترنت یافت میشوند. نه راهنماها كه اطلاعات را از طریق پرسشنامههای واگذار شده كسب مینمایند و نه موتورهای جستجوگر كه از صفحات زبان علامتگذاری فوقمتن استفاده میكنند، در جستجوهایشان از نواحی استفاده نمیكنند.
- مرور نمایهنامهها یك شكل معمول و رایج نیست.
- استفاده از معانی لغات كنترل شده در ابزارهای جستجوی اینترنت كاربردی ندارد (۲و۳).
پینوشتها
۱-Script
۲-Java common Gateway Interface (Jave Cgi)
۳-Search Engines
۴-Script
۵-Spiders
۶-URL (Uniform Resource Locator)
۷-Direct hill
۸-Google Real Names Index
۹-Portal
۱۰-Intetnet Service/Access Providers
۱۱-Search Sites
۱۲-Browser Providers Ultra Search Engines
۱۳-www.excite.com
۱۴-Ultra Search Engines
۱۵-www.directhil.com
۱۶-The Third way
۱۷-Hotbot
۱۸-www.google.com
۱۹-Page Rank
۲۰-www.almaden.ibm/cs/k۵۳/clever.htm/
۲۱-Science Citation Index
۲۲-Search Engine Watch
۲۳-Jump
۲۴-Hrml (Hypet text Mark up language)
۲۵-Fields
۲۶-Browsing
۲۷-Meta tags
۲۸-Meta Tags
۲۹-hyprtext Mark up Language
تالیف: جیران خوانساری
كارشناس ارشد كتابداری و اطلاعرسانی-مركز اطلاعرسانی كتابخانه توانیر
موتورهای جستجوگر(۴) و راهنماهای وب
۲. ۱. راهنماهای وب
چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب:
الف. فهرستی از سایتهای وب كه از قبل تعیین شدهاند، میباشد؛
ب. توسط ویراستاران جمعآوری شده؛
ج. براساس موضوع و عنوان طبقه بندی شده؛
د. انتخابی است.
با توجه به این كه راهنماهای وب توسط افراد جمعآوری میشوند, تصمیمگیری دربارهء كیفیت محتوای هر یك از سایتهای وب قبلا انجام شده است. در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار میگیرند، زیرا كاربران به دنبال موضوعات خاصی در اینترنت هستند كه این راهنماها، نقطهء شروع خوبی در تشخیص بهترینها در وب میباشند.در كاربرد راهنماهای وب، كاربر میتواند در بین فهرستهای راهنما حركت نماید. راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم میدهند. مثلا بزرگترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را میدهد.
سایتهای وبی كه به وسیلهء راهنمای وب نمایهسازی شدهاند، به علت روند تكمیل به صورت دستی، در آن راهنماها باقی میمانند؛ مگر این كه به احتمال بسیار ضعیف به صورت دستی حذف شوند. در حالی كه وجود دائمی یك لیست یا یك فهرست در موتور جستجو همیشه ضمانت نمیشود، اما ساختن و حضور دائمی یك فهرست در یك راهنمای وب مثل «یاهو» امكانپذیر میباشد.
۲ . ۲ .۱. اسپایدرهای موتورهای جستجوگر
پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته میشود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام میشود.«اسپایدرها» برنامههایی هستند كه وب را به دنبال صفحات جدید وب جستجو مینمایند، كلمات را نمایهسازی میكنند و اتصال را به صفحات برقرار مینمایند، سپس كلمات نمایهشده را با آدرسی كه به یك صفحهء وب یا هر منبعی كه بر روی وب جهانی و به طور كلی اینترنت قرار دارد اشاره مینماید,(۶) مقابله میكنند.
۲. ۲ .۲. نمایهء پایگاه اطلاعاتی موتور جستجو
این بخش عنصر اصلی از هر موتور جستجو است. این همان چیزی است كه كاربر به دنبال آن است. در طی سال ۱۹۹۸ تعدادی از تولیدكنندگان موتورهای جستجو آغاز به كار كردند. این شركتها نمایهها را مطابق با معیارهای گوناگون ساختند. بطور مثال می توان از نمایهء «دایركت هیل» و «گوگل» (۷) نام برد و نیز «نمایهء نامهای حقیقی» (۸) كه شركتها را قادر میسازد واژههای كلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
۲ . ۲ . ۳ . نرمافزار بازیابی اطلاعات
تمامی موتورهای جستجوگر، نرمافزار مختص به خود برای پاسخگویی به سوالات دارند.موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل مینمایند: هر سایت وب شامل كلمات یا واژههایی است كه سوءال كاربر را با آنها مقابله میكند. و در صفحهء نمایش، به صورت فهرستوار نمایش میدهد و با توجه به سوال كاربر و ارتباط موضوعی، فهرستی از مطالب را طبقهبندی مینماید. تفاوت مختصری در چگونگی كار الگوریتمها بین موتورهای جستجو وجود دارد، كه دلیلی بر این مدعااست كه كاربران، با یك پرسش واحد, از موتورهای مختلف نتایج متفاوتی را كسب مینمایند. در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجوگر میباشد.
۳ . پورتالها
«پورتال»(۹) ها سایتهای وبی هستند كه خود عرضهكنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایتهای موردعلاقهشان هدایت میكنند. «پورتال» ها نقاط اصلی برای راهبردهای تجارت الكترونیكی هستند و به تدریج از سال ۱۹۹۴ به وسیلهء سه نوع شركت اینترنتی به وجود آمدند. این شركتها كه نقش اساسی در توزیع زنجیرهء اطلاعاتی برای كاربر ایفا میكنند به شرح زیر میباشند:
الف. تولیدكنندگان خدمات اینترنتی(۱۰)
ب. سایتهای جستجو(۱۱)
ج. تولیدكنندگان مرورگر(۱۲)
سایت «اكسایت»(۱۳) نمونهای كه از یك سایت پورتال موفق است(۱).
۴. توسعه و تكامل فناوری جستجو
همهء ما تكامل زندگی بشر بر روی كره خاكی را به خاطر داریم. همانطور كه همگی ما میدانیم، شكلهای مختلف زندگی سلولی برای مدتهای بسیار طولانی قبل از تكامل زیستی وجود داشته است. در هر صورت هنگامی كه به این نقطه از تكامل دست یافتیم، تغییرات به فرم سازمانیافتهء آن در مدت زمان كمتری به انجام رسید.همین مطلب برای فناوری جستجوی وب نیز صادق است. با تاكید بر روی پورتالیزیشن و تجارت الكترونیكی، اولین نسل سایتهای جستجو، عملاً و به تدریج فراموش شدند و این در حالی است كه آنها تا سالهای متمادی، حكومت اصلی را به عهده داشتند؛ اما بدلیل این كه نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدكنندگان جستجو به بهرهبرداری رسیدند.۴ .۱. موتورهای جستجوی ماورا
موتورهای جستجوی ماورا(۱۴) به كاربر این امكان را میدهند كه از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (۲و۳).
محبوبترین موتورهای جستجوی ماورا به شرح زیر میباشند:
- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- ۲Q ( www.۲q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com )
- Webtaxi ( www.webtaxi.com )
۴ .۲. نسل اول موتورهای جستجو كه توسط سایتهای وب بصورت«اسپایدر», نمایهسازی را ایجاد كردند، انبوهی از واژهها و كلمات را تجزیه و تحلیل نمودند. راهنماهای وب به طور دستی گردآوری شدند و از آوریل ۱۹۹۸ مورد بهرهبرداری قرار گرفتند: یكی از این راهنماها به نام «دایركت هیل»(۱۵)یك حركت ریشه ای را آغاز كرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(۱۶) نامید.این راهنمای وب ادعا میكرد كه در زمان جستجو، كنترل با كاربر است و نتایج به صورت طبقهبندی شده بر روی سایت وب نمایان میشوند. این موتور جستجو، آنچنان كه ادعا میكرد نتوانست خدمات منحصربهفردی را ارائه نماید. بنابراین موتور جستجوی دیگری به نام «هاتبات»(۱۷)به جای آن تولید شد (۲).
۴ .۳. جستجوی زبان طبیعی
همانطور كه قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژههایی كه توسط كاربران ارائه میشدند عمل مینمودند. آنها به محتوای واژههای جستجو توجه نمی كردند. برای مثال به ارتباط منطقی بین واژههای جستجو و دیگر معناهای لغوی توجه نمیشد، به علاوه، لغات را به صورت تحتاللفظی جستجو میكردند و به واژهها و توصیفگرهایبولی نظیر and, or, not توجه نداشتند. دو موتور جستجوی جدید یكی پس از دیگری در طول یك هفته آغاز به كار كردند. این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد كردند:
الف.Ask Jeeves www.askjeeves.com
این موتور جستجو در اول ژوئن سال ۱۹۹۸ شروع به كار كرد و به عنوان اولین موتور جستجوی زبان طبیعی بر روی اینترنت معرفی شد. این موتور جستجو سوءال كاربر را با استفاده از پایگاه اطلاعات هفت میلیونی سوءالات، پاسخ میداد. اگر هیچ گونه مقایسهای وجود نداشت، سپس نزدیكترین واژه از پایگاه برای كاربر ارائه میشد و سوءال میشد كه مناسبترین آن را انتخاب كند. این موتور جستجو همچنین كاربر را به موتورهای جستجوی دیگری نیز راهنمایی میكند، مانند «یاهو»، «لیكاس», «اینفوسیك» و «آلتاویستا».
ب. دومین موتور جستجو به نام Electric Monk چند هفته بعد آغاز به كاركرد. این موتور جستجو با استفاده از زبان طبیعی، الگوریتم سوءالات كاربران را پاسخ میگوید. این الگوریتم با استفاده از اصطلاحنامه، به واژههای مرتبط نیز توجه میكند. جستجو از طریق زبان طبیعی در این موتور جستجوگر، سپس به صورت سوءالات مركّب بولی درآمد و به «آلتاویستا» تسلیم شد.
۴ .۴. تجزیه و تحلیل متكی بر اتصال
موتورهای جستجوی نسل اول برای ساخت نمایههای عظیم با هدف پاسخگویی به هر نوع سوال ساخته شدند. آنها به محتوای هر صفحهء خاص تأكید داشتند كه چگونه این صفحات به هم مربوط میشوند و اتصال مییابند. همانطور كه قبلا گفته شد، روش نمایهسازی آنها به دلیل بیتوجهی به تركیب زبان، ساخت جملات و مترادفها با شكست روبرو شد.تجزیه و تحلیل متكی بر اتصال سعی دارد كه با بررسی ارتباط بین صفحات، بر این مشكلات فائق آید. موتورهای جستجوگر متكی بر اتصال به سرعت رشدكردهاند و از نظر كاربران اینترنت در حال حاضر از محبوبیت خاصی برخوردارند.
۴.۴.۱.«گوگل»(۱۸)
این موتور جستجوگر نیز مانند «یاهو» توسط دانشجویان دانشگاه استانفورد ایجاد شد این فناوری با استفاده از روشی با نام «رتبهبندی صفحه»(۱۹) وب، به دیگر موتورهای جستجو متصل میشود. اگر شما، به عنوان یك نویسندهء سایت وب، به دیگر سایتهای وب از جهت اهمیت آن سایتها متصل شوید، می توانید داوریها و پیشنهادهایی دربارهء سایت ارائه دهید. همانطور كه راهنماهای وب نظیر «یاهو» توسط ویراستاران به صورت دستی جمعآوری و تالیف گردیدهاند. «گوگل» هم به دنبال اعلام قضاوت میلیونها نویسندهء سایت وب به صورت خودكار طراحی شد.البته این موتور جستجو در مقایسه با «یاهو» با سایتهای وب بیشتری دسترسی دارد. در حقیقت برخلاف دیگر موتورهای جستجوگر، كه هر چه نمایههای آنها گستردهتر میشود، كمتر مفید واقع میشوند، «گوگل» ادعا دارد كه با گستردگی نمایهها و عظیمتر شدن آنها، به نتایج بهتری دست یافته است. از دیگر موتورهای جستجو كه با استفاده از الگوریتم طبقهبندی عمل مینمایند میتوان از«هاتبات» و «اكسایت» نام برد. «گوگل» تنها موتور جستجویی است كه به طور بسیار گسترده ای جستجوهایش متكی بر اتصال میباشند. تخمین زده شده كه نمایهء این موتور جستجوگر بین ۷۰ تا ۱۰۰ میلیون صفحه میباشد، اما از طریق اتصال، قدرت دسترسی به بیش از ۳۰۰ میلیون صفحهء وب نیز به كاربر اینترنت داده میشود. دسترسی بیشتر و صحت نتایج جستجوی بیشتر سبب گردیده كه این موتور جستجو در ردیف ده موتور جستجوی محبوب در شبكهء اینترنت قرار گیرد.
۴.۴.۲. (۲۰)Clever
با توجه به «نمایهنامهء استنادی علوم»(۲۱) (مطالعهء ارجاعی مقالات علمی با یكدیگر) clever جستجوی واژههای كلیدی را براساس تلفیق كلمات و ارتباط مطالب بررسی مینماید. این موتور جستجوگر نیز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ میدهد. ولی برخلاف «گوگل» ابتدا سوءال را به دیگر موتورهای جستجو نظیر «آلتاویستا» تسلیم میكند و سپس كاربر را به صفحاتی كه از نتایج جستجو كسب شدهاند راهنمایی مینماید. این موتور جستجو توسط شركت «آیبیام» ایجاد شده.۴.۴.۳. Focused Crawler
یكی دیگر از موتورهای جستجویی كه توسط شركت،« آیبیام» ایجاد شده. این موتور جستجو البته به اندازهء clever گسترش پیدا نكرد. برخلاف دیگر موتورهای جستجو نظیر «گوگل» و clever، این موتور جستجو مجموعهای بسیار مناسب و در ارتباط با موضوع را از طریق وب جستجو مینماید. به زبانی دیگر، این موتور جستجو فقط سایتهای وبی را جستجو میكند كه در ارتباط با پرسش كاربر میباشند.
جستجوی گروههای خبری
در حالی كه در حال حاضر وب به مثابه مخزن اولیهء دانش بشری بر روی اینترنت میباشد، تنها مخزن هم به حساب نمیآید. گروههای خبری، محلی است كه گروهی از افراد، تجربیات، افكار و دانش خود را در مورد یك موضوع مورد علاقه، برای بازیابی اطلاعات به اشتراك میگذارند. تفاوت بین وب و گروههای خبری در این است كه وب مجموعهای از دانش بشری را به طور صریح و روشن ارائه میكند. در حالی كه گروههای خبری مجموعهای از دانش بشری را به طور ضمنی و غیرصریح ارائه مینمایند.دانش صریح و روشن میتواند به افراد و موءسسات كمك كند تا از اطلاعات و تجارب گذشته برای برنامهریزی آینده كمك بگیرند، اما دانش غیرصریح و ضمنی مجموعهای از تجارب و عقاید و خلاقیتهایی است كه برای استخراج اطلاعات صریح و روشن مورد نیاز میباشد.
۴.۴.۴. اطلاعات شركتها
سایتهای زیادی دربارهء معرفی شركتها و تولیدكنندگان اطلاعات تجاری وجود دارند. هر محققی میتواند از این سایتها بازدید كند. چنین سایتهایی دارای پایگاههای تجاری میباشند. یك بررسی بر روی نامهای شركتها براساس عملكرد موتورهای جستجوگر پیشرو و راهنماهای وب برای انتقال نتایج مناسب برای پژوهشگراننشاندادكه «سراچ انجین واچ»(۲۲)و«هاتبات» و «گوگل» در ردهبندی، در ردههای ابتدایی قرار میگیرند.در آگوست ۱۹۹۹، موتور جستجوگر «جامپ»(۲۳) آغاز به كار نمود. این موتور جستجوگر دارای یك نمایهء تخصصی است كه بر اطلاعات و خبرهای مربوط به شركتها تأكید دارد. این موتور جستجوگر فهرستی از شركتها، شامل اطلاعاتی نظیر عناوین شركتها، قدمت، زمینهء موضوعی و آدرس پست الكترونیكی و ثبت اختراعات، و شركتهای وابسته به آن شركت را نیز معرفی مینماید (۲و۳).
۴.۴.۵. فایلهای تصویری و چندرسانه ای
تقریباً ۷۰ درصد از صفحات وب غیرمتنی هستند. آنچه مسلم است كاربرد, مفاهیم را به همراه تصاویر بهتر از اطلاعات فقط به صورت متنی درك مینماید. سه موتور جستجوی تخصصی اصلی كه فایلهای تصویری و چندرسانهای را ارائه میدهند، در این زمینه به شرح زیر میباشند.
Ditto ( www.ditto.com )
Scour ( www.scour.net )
Altavista photo finder( www.altavista.com )
مقایسهء ابزارهای جستجو در اینترنت
این روزها اینترنت منبع اصلی تهیهء منابع اطلاعاتی شناخته شده است. ابزارهای مهمی برای كمك به یافتن اطلاعات در این فضای اطلاعاتی وجود دارند. راهنماها و موتورهای جستجوگر پایگاههای اطلاعاتی هستند كه به روند دریافت اطلاعات سرعت میبخشند. این ابزارها اسناد را با استفاده از زبان علامتگذاری ابرمتن(۲۴) جمعآوری، ذخیره و تنظیم مینمایند. قبل از ظهور اینترنت اكثر پایگاههای اطلاعاتی كتابشناختی نقش اصلی را در بازیابی اطلاعات ایفا میكردند. با توسعهء نرمافزارهای جستجو، اطلاعات علمی به راحتی قابل دستیابی شدند. تعداد ابزارهای جستجو در اینترنت به طور مداوم در حال رشد است. در این مقاله تعداد ده ابزار جستجو در اینترنت از قبیل راهنماها و موتورهای جستجوگر براساس تعداد صفحات اتصال، انتخاب شدهاند.نتایج ارزیابی ابزارهای جستجوی اینترنت با توجه به معیارهای اصلی بازیابی اطلاعات در جدول یك نشان داده شده است. شش معیار برای ارزیابی وجود دارد و حداكثر نمره ۶ میباشد.تقریبا همهء ابزارهای جستجو چهار معیار اصلی را دارند. غیر از Nerdworld كه از شش عملگر منطقی بولی فقط از OR استفاده می نماید,و «یاهو» كه عملگر پرانتز را قبول نمی كند, اختلافات دیگری نیز وجود دارند. «اینفوسیك» از عملكرد ستاره (*) استفاده نمیكند و «لیكاس» و «وب كراولر» سیستم را ملزم میكنند كه ستاره را به عنوان اولین حروف كلمات در جستجو استفاده نماید.تنها ابزارهای جستجوی اینترنت كه جستجوی كاملی را ارائه می دهند «لیكاس» و «اینفوسیك» هستند. با توجه به جستجو براساس طبقهبندی موضوعی، فقط دو راهنما یا دایركتوری «یاهو» و Nedworld همهء صفحاتشان طبقهبندی و دستهبندی شده است. و Northen light تنها موتور جستجوگر میباشد كه اجازهء جستجو براساس طبقهبندی را نمی دهد (۲). در «نورثرن لایت» این امكان وجود دارد كه به وسیلهء نواحی (۲۵)، جستجو انجام شود. در دیگر موتورهای جستجوگر این امكان كمتر وجود دارد. با توجه به جدول شماره ۳، «نورثرن لایت» از تعداد ۹ ناحیه شش ناحیه شامل: عنوان, نشانی، «یوآراِل», كشور، زبان، تاریخ، و نوع سازمان را جستجو مینماید.و بالاخره سه ابزار جستجوی باقیمانده یعنیWeb Crawler, Nerdworld and Aolnet findامكان جستجو از طریق نواحی را ارائه نمیدهند.در اینجا باید توجه كرد مهمترین نواحی مورد توجه در ارتباط با جستجو، عنوان، «نشانی» یوآراِل, و زبان میباشند.هیچ اختلافی در میان موتورهای جستجوگر و راهنماها در مورد استفاده از ناحیه وجود ندارد. از تعداد دو راهنما در این مقاله، «یاهو» پنج ناحیهء قابل جستجو را پیشنهاد میكند و «نِرد وُرلد» هیچ ناحیهای را پیشنهاد نمینماید. ضمنا دیگر موتورهای جستجوگر نیز در مورد استفاده از نواحی ناهمگون هستند.با توجه به قابلیت مرور(۲۶) و نظراندازی، موتورهای جستجوگر به شرح زیر امكان مرور و نظراندازی را ارائه میدهند.«اكسایت»، «لیكاس»، «آلتاویستا», «هاتبات»، «نورثرن لایت». به موتورهایجستجوگر نظیر «نورترون لایت» و «آلتاویستا» امكان استفاده از ناحیهء كشوری را ارائه میدهند.سهابزار جستجوكهقادرند دستورها(۲۷) رابه كارببرند شامل «آلتاویستا», «هاتبات» و «اینفوسیك» میباشند. این سه موتور جستجوگر پس از جستجوی یككلمهای، فهرستی از واژههای تركیبی را برای راهنماییهای بعدی و گسترش ارائه میدهند.
درجهبندی موتورهای جستجوگر
نتیجهگیری
مهمترین نتیجهء قابل توجه این است كه هیچ ارتباطی بین محبوبیت و قابلیت جستجوی اطلاعات در میان ابزارهای جستجوی مورد مطالعه وجود ندارد. دو مثال واضح از این یافتهها «نورثرن لایت» و «یاهو» میباشند. اگر چه «نورثرن لایت» كمترین شهرت و محبوبیت را در ردهبندی از نظر اتصال دارا میباشد، این موتور جستجوگر اولین مقام را در ردهبندی از نظر امكانات و قابلیتهای بازیابی اطلاعات كسب نموده است. در حالی كه «یاهو» یكی از محبوبترین ابزارهای جستجو میباشد، ولی از نظر بازیابی اطلاعات، در ردهء پایینی قرار دارد.این بررسی تفاوت عمدهای را بین موتورهای جستجوگر یا راهنماهای وب نشان نداد. در جمعآوری اطلاعات و تجزیه و تحلیل اسناد، راهنماها قابل اعتمادترند، زیرا سیستمهای دستی استفاده میكنند. موتورهایجستجوگر نیز به دلیلاستفاده از دستورهای(۲۸) زبان علامتگذاری فوقمتن یا ابرمتنها(۲۹) اهمیت دارند. هرچند روشن نیست كه نتایج قابلتوجهی را ارائه دهند.اگرچهراهنماهاوموتورهایجستجوگر پایگاههایی هستند كه صفحات زبان علامتگذاری فوقمتن را فهرست میكنند، از نقطه نظر بازیابی اطلاعات، با توجه به دلایل زیر نسبت به پایگاههای اطلاعاتی كتابشناسی معمولی دارای امكانات كمتری هستند.
- تعدادی از ابزارهای جستجو تمامی امكانات موجود در پایگاههای اطلاعاتی كتابشناختی معمولی را ندارند.
- محدود نمودن بازیابی به وسیله نواحی، چندان در ابزارهای جستجو در اینترنت رایج نیست.
- محققین سوءالاتی دربارهء نواحی عنوان نشانی كه به یك صفحهء وب، یا هر منبعی بر روی وب جهانی و به طور كلی اینترنت اشاره میكند دارند، كه تنها در نیمی از ابزارهای جستجو در اینترنت یافت میشوند. نه راهنماها كه اطلاعات را از طریق پرسشنامههای واگذار شده كسب مینمایند و نه موتورهای جستجوگر كه از صفحات زبان علامتگذاری فوقمتن استفاده میكنند، در جستجوهایشان از نواحی استفاده نمیكنند.
- مرور نمایهنامهها یك شكل معمول و رایج نیست.
- استفاده از معانی لغات كنترل شده در ابزارهای جستجوی اینترنت كاربردی ندارد (۲و۳).
پینوشتها
۱-Script
۲-Java common Gateway Interface (Jave Cgi)
۳-Search Engines
۴-Script
۵-Spiders
۶-URL (Uniform Resource Locator)
۷-Direct hill
۸-Google Real Names Index
۹-Portal
۱۰-Intetnet Service/Access Providers
۱۱-Search Sites
۱۲-Browser Providers Ultra Search Engines
۱۳-www.excite.com
۱۴-Ultra Search Engines
۱۵-www.directhil.com
۱۶-The Third way
۱۷-Hotbot
۱۸-www.google.com
۱۹-Page Rank
۲۰-www.almaden.ibm/cs/k۵۳/clever.htm/
۲۱-Science Citation Index
۲۲-Search Engine Watch
۲۳-Jump
۲۴-Hrml (Hypet text Mark up language)
۲۵-Fields
۲۶-Browsing
۲۷-Meta tags
۲۸-Meta Tags
۲۹-hyprtext Mark up Language
تالیف: جیران خوانساری
كارشناس ارشد كتابداری و اطلاعرسانی-مركز اطلاعرسانی كتابخانه توانیر
هیچ نظری موجود نیست:
ارسال یک نظر