مقدمه
اطلاعات علوم زمین بصورت گستردهای از طریق مؤسسات و شركتهای دولتی، ملی، منطقهای و بینالمللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود میباشند. برخی از مؤسسات نظیر سازمان زمینشناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وبهای خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره مینمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژهای تحقیق میكنند، استفاده از یك موتور كاوش ضروری مینماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه مینماید. اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترسپذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه میگردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست میدهد. بخش دوم روششناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه مینماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی مینماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم میكند و راهكارهایی را كه میتواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار میدهد.
۱- ساختار موتور كاوش
موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت مینمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژههای موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمیدهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.
موتورهای كاوش در سه ردهء اصلی گسترش یافتهاند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ میباشد كه براساس موضوع یا نوع مدرك تنظیم شدهاند. نمونههایی از آنها عبارتند از:
یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژهای)، آرگوس كلیرینگهاوس (مجموعهای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وبهای بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژهای یا روبات خزنده (نرمافزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامههای روباتی یا عنكبوتی را فهرست مینمایند. این برنامهها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق دادهها، پیوندها و متن صفحات وبی، هدایت میشوند. نمونههایی از روباتهای خزنده عبارتند از: هات بات۱۳، كه برنامهای را بكار میبرد كه صفحات وب را كلمه به كلمه فهرست میكند. اینفوسیك كه اطلاعات را از بین فرامین دادهها و پیوندها انتخاب مینماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخهای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو میكند و نتایج تلفیقی را ارائه مینماید.
نمونههایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژهها را برای جستجوی شش فهرست بطور همزمان بكار میبرد و آسك جیوز۱۶ كه پرسشهای زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژهای بطور همزمان، بكار میبرد.
در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژهای و نیز درختهای موضوعی قابل مرور میباشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژهای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتیشان فراهم میكنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.
به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك مینمایند:
۱- پایگاه اطلاعاتی چگونه ایجاد میشود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته میباشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور مینماید.
۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور میكنند، اما در عمل صفحات بیشتری را فهرست مینمایند. موتورهای دیگر هر صفحه را منظور مینمایند.
۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد میشود؟ برنامهریزان، روباتهای خزندهای را طراحی نمودهاند كه بصورت خودكار طبق یك برنامهء منظم كار مینماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.
۴- چه عوامل جستجویی، موتور را حمایت مینمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد مینمایند، در حالیكه برخی دیگر چنین نمیكنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان میباشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمیدهد.
۵- نتایج جستجو چگونه مرتب شده و نمایش داده میشود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار میبرند، نتایج جستجو را نه تنها برای واژههای مشخص بلكه برای مفاهیم مربوطه نیز ارائه مینمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه مینمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست مینمایند. نتایجی كه دیگر موتورهای كاوش ارائه مینمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرستنویسی، معرفی یا اطلاعات مربوط به نویسنده.
اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم میخورد. برای كنترل بیشتر اطلاعیابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسههای جالبی بین موتورهای كاوش اصلی انجام میدهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط«مات اسلات»
http://janus.ambrosiasw.com/~fprefect/matrix/
[Note:Link moved; URL changed ۴/۲/۰۲ by ald]
موتورهای كاوش واچ وب سایت۲۳
( http://searchenginewatch.com /)
و موتورهای كاوش :C&#۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو مینمایند (تهیه شده توسط آندره جی. لئونارد)
http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )
[Note: Broken link removed ۸/۵/۹۸ by ald]
این سایت وبها دارای جداولی میباشند كه در آنها توانائیها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه میگردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفهای دانشگاه كارولینای شمالی
( http://www.it.unc.edu/guides/irg-۰۸.html )
[Note: Broken link removed ۳/۴/۰۱ by ald]
و نیز فهرست موتورهای كاوش یاهو بازدید كنید.
http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).
[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]
۲- روششناسی
فهرستی از موتورهای كاوش مورد بررسی در جدول شمارهء ۱ آورده شده است. در این جدول نام، نشانی اینترنتی، اندازهء پایگاه اطلاعاتی هر موتور و توضیحات كاربر ارائه شده است. ضمناً یك ارزیابی ازدقت موتور جستجو بر مبنای سه نوع جستجوی نمونه نیز، در آن آمده است. سه نمونه پرسش بكار رفته در این تحقیق عبارتند از:
۱) ENSO (نوسان جنوبی EI Ni ?o)
۲) زون گسله مادرید جدید
۳) تولید مس در برزیل
حجم جستجو در این مطالعه، در مقایسه با دیگر مطالعات دقت موتور كاوش (لیتون و اسری و استاوا، ۱۹۹۷) و (تومائیولو و پاكر، ۱۹۹۶)، كم است، لكن با توجه به تأكید بر موضوعات مرتبط با علوم زمین، حائز اهمیت است. برای بررسی نتایج موتور كاوش، پرسشهای نمونه، بر مبنای پرسشهای كلیدواژهای، عبارتی و چند مفهومی انتخاب شده است. جستجوهای سادهای كه شكل تعریف نشدهای از ابزارهای مورد ارزیابی را ارائه میدهند. این بدان علت انجام میگیرد كه راهكارهای جستجوی ابزاری نسبت به راهكارهای جستجوگر، بیشتر مورد استفاده میباشد. موتورهای كاوش انتخاب شده برای این مطالعه، از فهرست موتورهای كاوش در سایتهای مختلف انتخاب شدهاند از قبیل:
Search Engine Watch
( http://searchenginewatch.com/ )
مقاله ۱۹۹۶ وبستر و پاول «ابزارها و فنون جستجوی وب»،
( http://magi.com/~mmelick/it۹۶jan.htm )
و فهرست ابزارهای جستجوی اینترنتی در كتابخانه دانشگاهی شمال غربی
( http://www.library.nwu.edu/resources/internet/search/ )
و مؤسسه فنآوری حرفهای دانشگاه كارولینای شمالی
[ald; Broken link removed ۴/۲/۰۲].
دقت برای سنجش سودمندی موتورهای كاوش بكار رفته است كه بر مبنای نسبت تعداد ركوردهای مربوط در ۱۰ تا ۱۵ ركورد اول بازیابی شده، میباشد. این نسبت به سه درجه تقسیم میگردد: زیاد، متوسط، كم. موتورهای كاوشی كه پیوندهای فعال مرتبط با اطلاعات مربوط به پرسشهای نمونه را ارائه میدهند، دارای درجه دقت زیاد میباشند، به موتورهای كاوشی كه پیوندهای حاشیهای ارائه مینمایند (نظیر اطلاعات مس در كشورهای دیگر)، یك درجه دقت متوسط داده شده است. موتورهای كاوشی كه تعداد بسیار زیادی پیوندهای كاملاً غیرمرتبط و غیرفعال (نظیر محسوب كردن ENSO بعنوان نام یك شركت به جای یك پدیدهء هواشناختی یا پیوندهای حاوی اطلاعاتی در مورد مادرید، اسپانیا) را در ۱۰ تا ۱۵ ركورد اول ارائه مینمایند، دارای درجه دقت ضعیف میباشند. میزان دقت ارائه شده در جداول، بیش از آن كه یك معیار واقعی آماری نسبت باشد، تفسیری از نتایج به شمار میآید. این مطالعه یك نوع ارزیابی آماری از دقت نتایج موتورهای كاوش نیست بلكه عبارت از یك كاوش تفسیری ابزارها و سودمندی آنها در علوم زمین میباشد.در صورتی كه اطلاعات حاصل از نتایج یكدست بوده و دادههای حقیقی را بدست دهد و بتواند در یك فعالیت مرجع بكار رود، آنگاه نتایج حاصله مناسب و مرتبط خواهد بود.كیفیت پیوندهای ارائه شده، به منظور پی بردن به دقت، توانایی، پوشش، روزآمد و منحصر به فرد بودن، بررسی شده است. (رتینگ، ۱۹۹۶؛ تیت و الكساندر، ۱۹۹۶). بعنوان مثال، به صفحاتی كه اطلاعات قابل تأیید را كه مستقیماً با پرسش مربوطه مرتبط میباشد را فراهم مینمایند، امتیاز بالا داده میشود. به صفحاتی كه اطلاعات حاشیهای، غیرقابل تأیید و تكراری را فراهم مینمایند و مستلزم آنند كه كاربر جستجوی اضافی انجام دهد، امتیاز متوسط داده میشود. به موتورهای كاوشی كه پیوندهای كاملاً نامرتبط یا غیرفعال ارائه مینمایند، امتیاز ضعیف داده میشود. در حالی كه مطالعات دیگر، حجم گستردهای را جهت منظور نمودن گرایشات جستجوگر به هنگام تعیین ارتباط پیوندهای ارائه شده، به خود اختصاص میدهد، پژوهش حاضر، مطالعهای تفسیری در یك زمینهء موضوعی خاص است. بنابراین در آن تعدیل گرایشات بالقوه جستجوگر در ارزیابی نتایج، موردنظر قرار نمیگیرد.موتورهای كاوش از نظر اندازه نیز در سه رده جای میگیرند: موتورهای كاوش بزرگ، دارای بیش از ۲۵ میلیون ارل یا صفحات وب، موتورهای كاوش متوسط دارای بین ۱ میلیون و ۲۵ میلیون ارل یا صفحات وب و موتورهای كاوش كوچك دارای كمتر از یك میلیون ارل یا صفحات وب. برخی اندازهها تقریبی میباشند
۳- نتایج
تعیین عناوین ویژه: نتایج فهرست یا راهنما
به هنگام جستجوی عناوین ویژه، نظیر هواشناسی یا چینهشناسی، بهترین نقطه برای شروع عبارت است از: موتورهای كاوش فهرستی یا راهنما كه پیوندهای موضوعی را ارائه میدهند نظیر: یاهو، گالاكسی یا اینترنت اسلوث. هر یك از این ابزارها، درختهای موضوعی چند ردیفه را ارائه میكنند. بعنوان مثال روی صفحهء اصلی گالاكسی، جستجوگر میتواند بیش از ۱۱ رده اصلی و ۱۴۸ زیررده را انتخاب نماید. پیوندهای اطلاعات علوم زمین و محیط زیست میتواند در جاهای متعددی یافت شود: بعنوان مثال زیر رده «محیط زیست» تحت ردههای اصلی «جامعه» و «قانون»؛ «جغرافیا» زیر ردهء «علوم اجتماعی»؛ و «غارشناسی» زیر ردهء «سرگرمی و تفریحات» قرار میگیرند. بیشترین پیوندها برای علوم زمین زیر «علوم زمین» در ردهء «علوم» وجود دارد. صفحهء علوم زمین دارای ۵ رده برای علوم زمین است. شامل: «ژئوشیمی»، «زمینشناسی»، «زمینشناسی دریایی»، «ژئوفیزیك» و «هواشناسی و اقلیمشناسی». بدنبال پیوند برای «هواشناسی و اقلیمشناسی»، جستجوگر پیوندهایی را كه در ردههای زیر گرد آمدهاند، بدست میآورد: مؤسسات آموزشی، مقالات (متن كامل)، نقشهكشی، مجموعهها، راهنماها، سازمانهای دولتی و مؤسسات. در هر بار جستجو، جستجوگر میتواند جستجوهای كلیدواژهای بانك اطلاعاتی یا پیوند با ردههای مرتبط را، در كل سطوح مختلف موتور گالاكسی انجام دهد.بررسی موتورهای چند راهنما یا فهرستی میتواند بیانگر ناكامی برخی از موتورها در استفاده از یك واژگان كنترل شده باشد. Librarians Index و WWW Virtual Catalog هر دو، اطلاعات را از طریق ردههای موضوعی كتابخانهء كنگره (و نه از طریق شمارهء رده LC)، ردهبندی مینمایند. برنامهریزان یاهو به طرح ردهبندی موضوعی بلاواسطه خود میبالند. لوك اسمارت یك فهرست موضوعی ۱۶۰۰۰ تایی را ارائه مینماید. موتورهای كاوش فهرستی، قابلیت استفاده خود را به تحقیقات بزرگ محدود مینمایند (لكن بدون استفاده از اصطلاحنامه اسامی و موضوعی). این نكته بویژه برای آن دسته از ردههای علمی كه پیدا كردن آنها با مرور كردن یا جستجوی كلیدواژهای مشكل است، صادق است. علوم زمین و سایر ردههای علمی غالباً زیر عناوینی چون «آموزش و پرورش»، «مرجع» یا «یادگیری»، مخفی میشوند. اگر یك عنوان مفید، پس از مرور یك یا دو سطح پوشش داده نشود، پرسش از بانك اطلاعاتی توسط كلیدواژهها انجام میشود. جامعترین درختهای موضوعی مرتبط با علوم زمین در دو موتور كاوش یافت میشوند: یاهو و WWW Virtual Library. به كمك این ابزارهای جستجو روی موتورهای كاوش نوع فهرستی میتوان در مقایسه با مرور ساده فهرستهای موضوعی، به دقت بیشتری دست یافت. بعلاوه این ابزارهای جستجو قابلیت انعطاف بیشتری در رابطه با جستجوی متن پایگاه اطلاعاتی، كه در غیاب واژگانهای كنترل شده یا فهرستهای موضوعی برای پایگاههای اطلاعاتی، بسیار مفید میباشند، فراهم مینمایند. موتور كاوش جی اوتو دارای بیشترین دقت در ابزار جستجو میباشد. (ابزارهای آرگوس كلیرینگهاوس و اینفوماین نیز نتایج دقیقی در ارتباط با پرسشهای نمونه ارائه كردهاند. به هر حال در هنگام استفاده از این ابزارها، لازم است جستجوگر نسبت به این نكته كه پایگاههای اطلاعاتی آنها كوچك بوده و اینكه دقت بستگی به وجود یا عدم وجود موضوع مورد پرسش در پایگاه اطلاعاتی دارد، آگاه باشد. بعنوان مثال پرسش «ENSO»، در مقایسه با پرسشهای «زون گسله مادرید» و «تولید مس در برزیل»، نتایج بسیار دقیقتری در موتورهای آرگوس و اینفوماین ارائه میكند).
تعیین اطلاعات ویژه: نتایج كلیدواژهای یا روبات نرمافزاری (خزنده)
نیازهای اطلاعاتی دقیق یا بسیار ویژه، با موتورهای كاوش كلیدواژهای یا چندشاخهای، بهتر تأمین میشود. با این ابزارها جستجوگران میتوانند با استفاده از برخی واژههای جستجوی منحصر به فرد در حد امكان، دقت را افزایش دهند. موتورهای جستجوی كلیدواژهای یا روباتهای نرمافزاری (خزنده) كه دارای بیشترین میزان دقت و مرتبطترین پیوندهای فعال میباشند عبارتند از: اكسایت و اینفوسیك.
جستجوی تعریف نشده اینفوسیك برای «تولید مس در برزیل»، دارای دقت كمی است، در حالی كه جستجو در مورد «زون گسله مادرید جدید» دقت متوسطی دارد. (دقت به كمك جستجوی موردی دقیق بالا میرود، بعنوان مثال «New Madrid fault zone» در مقایسه با «new Madrid fault zone» نتایج دقیقتری بدست میدهد). دقیقترین جستجوی اینفوسیك جستجوی كلیدواژهای روی «ENSO» میباشد. استفاده از گزینههای اصلاحی اینفوسیك، موجب تكمیل نتایج در تمامی جستجوها میگردد. بعنوان مثال، فرمان «pipe»، كه ركوردهای مرتبط را در مجموعهء بزرگتری از ركوردها جستجو میكند، یا «مس &#۶۱۶۹۰;برزیل» كه به مدارك مرتبطتری در مقایسه با جستجوی استاندارد هدایت میكند. در نتیجه پیوندهای «موضوعی مربوط» اینفوسیك، برخی پیوندهای اضافی مرتبط را نشان نمیدهند.اكسایت با استفاده از جستجوهای عبارتی و چند مفهومی در مقایسه با پرسش كلیدواژهای، بهتر عمل میكند. پرسش ساده در ارتباط با «تولید مس در برزیل»، در صفحهء انجمن توسعهء مس، تحت عنوان «مس: بازار و آمار دادهها»، اطلاعیههای رسمی و گزارشات سالانه از شركتهای مرتبط با معادن مس در برزیل، را پیدا نموده است. اكسایت چندین پیوند تكراری را در تمامی پرسشهای نمونه ارائه نموده است، بعنوان مثال در جستجوی «ENSO» صفحهء NOAA-CIRES ENSO را در هر دو آدرس
http://www.cdc.noaa.gov/enso/index.html
http://www.cdc.noaa.gov/eno/
ارائه مینماید. گزینهء «مانند این»۲۵ در اكسایت، هیچ نوع پیوندهای اضافی مرتبط را در هر یك از سؤالات نمونه بازیابی نمیكند.
نتایج اكسایت و اینفوسیك برای پرسش «تولید مس در برزیل»، مشابه میباشند و عمدتاً اطلاعیههای رسمی، گزارشات سالانه و گزارشات فنی شركتهای معدنی و تولیدی را ارائه مینمایند. خطای اصلی در ارتباط با این پرسش، آن است كه مس بعنوان یك مكمل كانی غذایی در نظر گرفته میشود. (با كمال تعجب «زغال سنگ برزیل»، منبع خوبی برای مس میباشد). خطای اصلی در ارتباط با پرسش «ENSO»، شركتهای تحت عنوان ENSO میباشد، در حالیكه معمولترین خطا در ارتباط با پرسش «زون گسله مادرید جدید» عبارت از پیوند با سایتهایی در مورد زونهای لرزهای غیرمرتبط و گسلهها میباشد.
نورترن لایت، یكی دیگر از موتورهای كاوش كلیدواژهای مفید است. این موتور نتایج را بصورت پوشههایی بر مبنای فراوانی و موضوع مرتب مینماید. برخی پوشهها كه با جستجوی نمونه روی تولید مس برزیل ایجاد شدهاند عبارتند از: «سایتهای تجاری»، «صنعت معدنكاری»، «صنعت فلزات»، «زغال سنگ» و «سمشناسی». پوشهها برای جستجوی «ENSO» عبارتند از: «صفحات شخصی»، «آب و هواشناسی» و «www.coaps.fsu.edu». نورترن لایت همچنین چند پایگاه اطلاعاتی «مجموعهء ویژه»۲۶ پیوسته را كه مقالات مجلات را پیدا مینماید، جستجو میكند. این مقالات را میتوان از نورترن لایت، با پرداخت هزینه بین ۲ تا ۶ دلار بسته به حجم و منبع مقاله خریداری نمود. این پیوند اینترنت و پایگاههای اطلاعاتی متون، عاملی در گرایش به بازدید وب میباشد.موتور كاوش پلانت سرچ۲۷، كه میزان دقت متوسط را بدست آورده است، دارای یكی از بهترین نمایشها برای نتایج جستجو میباشد. نتایج پلانت سرچ شامل یك نمودار ستونی جهت تصویر نمودن ارتباط برای هر واژه مورد جستجو در پرسش میباشد. نمودارهای ستونی نه تنها نشاندهنده ارتباط هر واژه برای ركورد پیدا شده میباشند، بلكه نتایج كلی برای جستجوی كامل را نیز نشان میدهند. هر ركورد همچنین دارای گزینهء «پیدا كنید مشابه»، تاریخ ركورد و تعداد كلمات در ركورد میباشد. پلانت سرچ همچنین به جستجوگر اجازه میدهد تا راهنماهای خرید را برای نتایج جستجو و نشانهها ایجاد نماید. پلانت سرچ در نتایج خود، تكراریهایی را به همراه دارد، بعنوان مثال همراه بودن سایتهای فرعی برای فهرست الفبایی گسل كالیفرنیای جنوبی در نتایج «زون گسله مادرید جدید» و نیز سه پیوند به صفحهء اصلی روزنامهء ENSO در نتایج «ENSO».لیكوس میانگین اعمال فوق را با جستجوهای عبارتی و چند مفهومی انجام میدهد، لكن نتایج پرسش كلیدواژهای ضعیف است. وب كرولر و ماژلان (موتور كاوس نوع فهرستی/راهنما)، دارای نتایج یكسان برای هر سه پرسش میباشند. بعلاوه نتایج وب كرولر و ماژلان صرفنظر از نوع آنها، تقریباً بیدقتترین نتایج در بین موتورهای مورد استفاده میباشد. بعنوان مثال، اولین سایت فهرست شده در پرسش «زون گسله مادرید جدید» عبارت است از یك نقشه مادرید، اسپانیا، ضمن آن كه پنجمین پیوند ارائه شده عبارت است از زون ورزشی Soccer: ESPN. هات بات دارای دقت متوسط بوده و فاقد جستجوی «تمام لغات» میباشد، لكن با استفاده از شكل «عبارت درست» همراه با پرسشهای عبارتی و چندمفهومی، دقت تا حدودی افزایش مییابد. وات-یو-سیك۲۸ در ارتباط با جستجوهای عبارتی و چند مفهومی دارای دقت كمی است، اما برای جستجوی كلیدواژهای روی «ENSO»، نتایج نسبتاً دقیقتری دارد. نتایج آلتاویستا در ارتباط با جستجوهای تعریف نشده، متوسط است اما با استفاده از گزینهء «پالایش»۲۹، دقت تا حدودی افزایش مییابد. نتایج آلتاویستا در ارتباط با تمامی پرسشها دارای پیوندهای تكراری میباشد.پوشش گسترده و وسیع: با استفاده از ابرموتورهای كاوش
موتورهای كاوش چند شاخهای، با افزایش اندازهء وب، رایجتر و مناسبتر میگردند. در عین حال استفاده از این موتورها نیز تعدادی پیوندهای ضعیف به همراه دارد. به ویژه، موتورهای چندشاخهای، متكی بوده و كنترلی روی جامعیت و روزآمدی پایگاههای اطلاعاتی كه جستجو مینمایند، ندارند. همچنین این موتورها، پرسشها را به چندین پایگاه اطلاعاتی كه هر یك از نظر ساختار و جستجو متفاوت میباشند، میفرستند. این ابزارها عموماً دارای یك تكذیبنامه پنهان در جایی مانند بخش «درباره» میباشند كه بیانگر آن است كه نتایج حاصل از راهكارهای جستجوی پیچیده بولی-تقریبی و سایر عملگرها نمیتواند تضمین كننده باشد. در عین حال برخی از نتایج موتورهای كاوش چند رشتهای، منابع دقیقی برای جستجوی وب به شمار میآیند.
بیشتر موتورهای كاوش چندشاخهای همانگونه كه در جدول ۱ نشان داده شده دارای نتایج متوسطاند. هیچ یك از موتورهای كاوش چندشاخهای در ارتباط با پرسشهای نمونه بعنوان بهترین ظاهر نشدهاند. بیشتر موتورها با ستجوهای كلیدواژهای بهتر عمل میكنند، در حالیكه برخی دیگر مفیدترین نتایج را با پرسشهای عبارتی یا چند مفهومی ارائه مینمایند. بعنوان مثال، ماما۳۰، پروفوشن۳۱ و متاكرولر با پرسش عبارتی «زون گسله مادرید جدید» و پرسش چندمفهومی «تولید مس در برزیل» بهتر عمل میكنند. اینفرنس فایند۳۲ و آسك جیوز دارای نتایج دقیقتری برای جستجوی كلیدواژهای «ENSO» میباشند.رابط برخی موتورهای جستجوی چندشاخهای به كاربر اجازه تصفیه یا جستجوی مستقیم در سطح بالا را میدهد. بعنوان مثال متاكرولر و ساوی سرچ۳۳ به كاربر اجازه میدهند تا برای واژههای مورد جستجو از «همه» یا «هریك» و نیز «بصورت یك عبارت» استفاده نماید. پروفوشن یك شكل تعریف نشده، یك شكل بولی یا یك شكل عبارتی را ارائه مینماید. در حالیكه ماما به كاربر اجازه میدهد تا برای واژهها «بصورت یك عبارت» را جستجو نماید یا جستجو برای واژهها را تنها به «عناوین مدرك»، محدود نماید.تعدادی از موتورها نظیر متافایند و اینفرس فایند، نتایج جستجوها را بوسیله كلیدواژه دستهبندی میكنند. برخی موتورها نظیر آسك جیوز و ساوی سرچ، نتایج را توسط ابزاری كه پیوندها را ارائه میكند، گروهبندی مینمایند. بیشتر آنها، نتایج را با مرتب كردن ارتباط بر مبنای نسبت جا و زمانی كه واژههای مورد جستجو پیدا میشوند، نمایش میدهند.اینترنت اسلوث كه یك موتور كاوش نوع فهرستی یا راهنما است، نیز میتواند بعنوان یك موتور كاوش چند رشتهای بكار رود. صفحهء اصلی اینترنت اسلوث بیش از ۲۱ رده موضوعی را كه میتواند به آسانی با نمایش زیر ردهها گسترش یابد، ارائه مینمایند. ردهء علوم دارای ۹ زیر رده است كه یكی از آنها «علوم زمین» میباشد. زیر رده «علوم زمین» موتورهای كاوش را برای بیش از ۱۱ نمونه از منابع مختلف علوم زمین نظیر ولكانوورلد و فهرست صفحات فنی SPE ارائه میكند. در حالیكه «علوم زمین» در اینترنت اسلوث یك فهرست جامع را بدست نمیدهد، پیوندها دسترسی به منابع تمام متن با كیفیت بالا را فراهم مینمایند. این دسترسی به موتورهای كاوش موضوعی، منحصر به فرد است. علاوه بر موتورهای جستجوی موضوعی، صفحهء اصلی اینترنت اسلوث نیز فرصتی را برای جستجوی كامل وب همزمان از طریق ۶ موتور كاوش اصلی كاوش (آلتاویستا، اكسایت، اینفوسیك، لیكوس، وب كرولر و یاهو) فراهم مینماید. جستجوگران میتوانند همچنین از موتورهای چند مروره، اخبار، بازرگانی و مالی، نرمافزار و یوزنت بازدید نمایند.آسك جیوز كه پرسشهای زبان طبیعی را بكار میبرد، با پرسش كلیدواژهای در مورد «ENSO» دقت بالای متوسطی را میدهد، لكن با پرسشهای عبارتی و چند مفهومی دقت زیر متوسط دارد. پرسشهای جستجو از طریق یك سیستم تخصصی كه نه تنها راهكارهای متناوب را برای جستجو اولیه پیشنهاد میكند، بلكه پرسش را به موتورهای اكسایت، هات بات، وب كرولر، آلتاویستا و اینفوسیك میفرستد، تقویت میگردد. پرسش نمونه در مورد «ENSO» به شش پرسش اضافی در شكل ۱، منتج شده است. راهكارهای جستجوی متناوب ارائه شده، كاملاً مرتبط با پرسش اولیه میباشد و برای كاربر فرصتی را جهت تمركز جستجو روی یك مفهوم ویژه از واژه مورد جستجو فراهم مینماید. آسك جیوز نیز ده منبع را از هر ۵ موتور كاوشی كه مورد پرسش قرار داده، ارائه مینماید. نتایج آسك جیوز از موتورهای مورد پرسش، با نتایج حاصل از موتورهای كاوش انفرادی هماهنگ میباشد (جدول ۱ را ملاحظه نمائید).
- سیستم تخصصی آسك جیوز كه پرسشهای متناوب را پیشنهاد مینماید
- جدیدترین پوشش خبری روی El Nino چیست؟
- یك El Nino چیست؟
- اطلاعات در مورد El Nino ۹۸-۱۹۹۷ را كجا میتوان پیدا كرد؟
- جدیدترین پوشش خبری در مورد طوفانهای كالیفرنیا چیست؟
- اطلاعات در مورد عناوین هواشناسی El Nino را كجا میتوان پیدا نمود؟
هایوی ۶۱ در ارتباط با جستجوهای عبارتی و چندمفهومی دارای دقت بالای متوسط است. هایوی ۶۱ پرسشها را به ۶ موتور جستجو شامل: یاهو، آلتاویستا، لیكوس، وب كرولر، اینفوسیك و اكسایت میفرستد. تعداد نتایج نمایش داده شده توسط جستجوگر تعیین میشود. وی تعداد موتورهای كاوشی را كه میتواند نتایج را پیدا كرده و نیز تعداد نتایج را به نمایش بگذارد، انتخاب مینماید. نتایج در مورد پرسش نمونه «تولید مس در برزیل» عبارت است از چند گزارش دولتی منحصر به فرد، همچنین بیشترین سایت وبها را از طریق حوزهء برزیل پیدا نموده است.هنگام استفاده از موتورهای كلیدواژهای و چندشاخهای، توجه به اینكه چه بخشهایی از صفحات موتور در حال جستجو بوده و بسط یك عبارت جستجوی دقیق حائز اهمیت است. حجم اطلاعات موجود روی وب، مستلزم استفاده از گزینههای «پیشرفته» یا «پالایش» برای نتایج جستجوی دقیقتر میباشد. بعلاوه جستجوگران باید توصیه ارائه شده از طریق اینفوسیك را در نظر داشته باشند: «پرسشهای بیشتر بهتر جواب میدهد». یك سری واژههای مشخص و واحد را برای بدست آوردن نتایج دقیقتر بكار ببرید. این توصیه برای یافتن اطلاعات علوم زمین و نیز هر جستجوی موضوعی دیگر بر روی وب، معتبر و با ارزش میباشد.
نتیجهگیری
نتایج حاصل از این مطالعه، منطبق با دیگر مطالعات دقت میباشد كه در آن هیچ یك از موتورهای كاوش بعنوان دقیقترین موتور برای یافتن اطلاعات روی وب جهانی ظاهر نشدهاند. حتی در ارتباط با پرسشهای علوم زمین نیز، هیچ از یك ابزارها ممتاز و برجسته نبودهاند. در مطالعه ۱۹۹۶، تومایولووپاكر، آلتاویستا را بعنوان ابزاری كه بیشترین تعداد پیوندهای ارتباطی را بر مبنای اولین ده پیوند بازیابی شده ارائه نموده است، تعیین نمودهاند. یك ارزیابی در ارتباط با میزان دقت پرسشهای مرتبط با علوم زمین بدین صورت است: ۱) اینفوسیك نتایج دقیقتری بدست میدهد. ۲) لیكوس و آلتاویستا به نحو قابل ملاحظهای، دقت كمتری دارند. لیتون و اسریواستاوا كه پیشرفتهترین روششناسی را در مطالعه خود مورد استفاده قرار دادند، نیز به این نتیجه رسیدند كه به طور قاطع دقیقترین موتور كاوش وجود ندارد.به هر حال «یك الگوی مشخص ارائه میگردد. آلتاویستا، اكسایت و اینفوسیك همواره خدماتی با بیشترین امتیاز متوسط ارزیابی شده میباشند» (۱۹۹۷-
http://www.winona.msus.edu/library/webind۲/wi۲pt۳.htm#RESULTS
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
بر مبنای دیگر مطالعات منتشره و نتایج حاصله در مطالعه مرتبط با علوم زمین، به جستجوگرانی كه سعی در یافتن «هر» نوع اطلاعات روی وب جهانی دارند، توصیه میشود از مجموعهای از ابزارها متناسب با نوع پرسش ارائه شده و نوع اطلاعات موردنیاز استفاده نمایند.
همانگونه كه لیتون و اسریواستاوا اظهار داشتهاند، «محاسبه دقت حقیقی (نسبت مدارك مرتبط ارائه شده به تعداد كل مدارك ارائه شده) بسیار دشوار است، چرا كه مستلزم آزمودن تمامی پیوندهای ارائه شده توسط یك سرویس كه میتواند تعداد آن به هزاران یا میلیونها برسد، میباشد».( ۱۹۹۷،http://www.winona.msus.edu/library/webind۲/wi۲pt۲.htm#EVALCRIT ,p۳ of ۸).
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
ضمن قبول نقاط ضعف این مطالعه، امید است كه نتایج حاصله بتواند بعنوان راهنمایی برای استفاده از موتورهای كاوش اینترنت جهت یافتن اطلاعات علوم زمین روی وب جهانی، مفید باشد.
توضیحات نهایی
۱) تمامی پرسشهای مربوط به علوم زمین، در این مطالعه عبارت از پرسشهای كلیدواژهای یا عبارتی میباشند. پرسشها عبارتند از: بهمنها، فعالیت آبهای سرد، زمینلرزه، گرم شدن جهانی، صاعقه، حوادث طبیعی، كاهش ازن، پلاستیك بازیافتی، صفحات تكتونیكی، گردبادها، آتشفشانها و طراحی آب پخشان.
۲) ارزیابی كلی در مطالعه تومایلو و پاركر بدین شرح است: آلتاویستا ۳/۹، اینفوسیك ۳/۸ و لیكوس ۱/۸. از تحلیل پرسشهای مرتبط با علوم زمین، این نتایج حاصل شده: اینفوسیك ۵/۹، لیكوس ۷/۸ و آلتاویستا ۳/۸.
پینوشتها:
۱. Internet Search Engine
۲. GO۲
۳. Infomine
۴. Argus Clearinghouse
۵. Excite
۶. Infoseek
۷. Northern Light
۸. Catalog or directory of search engines
۹. Yahoo!
۱۰. DejaNews
۱۱.Magellan
۱۲. Keyword or crawler search engines
۱۳. HotBot
۱۴.Multi-threaded search engines or meta-crawlers
۱۵. MetaCrawler
۱۶. Ask Jeeves
۱۷.Galaxy
۱۸.Internet Sleuth
۱۹.Lycos
۲۰.”Power” search
۲۱.”Advanced” search
۲۲. Web Matrix
۲۳. Watch Web site
۲۴. Look Smart
۲۵. “More like this”
۲۶. “Special Collection”
۲۷. Planet Search
۲۸. What-U-Seek
۲۹. “Refine”
۳۰. Mamma
۳۱. Profusion
۳۲. Inference Find
۳۳. Savvy Search
۳۴. MetaFind
۳۵. Volcano world
۳۶. Highway۶۱
منابع
Chu, Heting and Rosenthal, Marilyn. ۱۹۹۶. Search engines for the World Wide Web: A comparative study and evaluation methodology. [Online] http://www.asis.org/annual-۹۶/ElectronicPrceddings/chu.html [۲ April ۱۹۹۸].
Ding, Wei and Marchionini, Gary. ۱۹۹۶. A comparative study of web search service performance. In: American Society for Information Science ۱۹۹۶ Annual Conference Proceedings, ۳۳; Global complexity: Information, chaos and control; Baltimore, Maryland, Octorber ۲۱-۲۴, ۱۹۹۶. (Edited by Steve Hardin), pp. ۱۳۶-۱۴۲. Information Today, Medford, NJ.
Lebedev, Alexander, ۱۷ May ۱۹۹۷. Best search engines for finding scienctific information in the web. [Online]. http://ww.chem.msu.su/eng/comparison.html [۲۷ November ۱۹۹۷]. [Note: Broken link removed ۴/۲/۰۲ by ald]
Leighton, Vernon, H. and Srivastava, J. ۱۶ June ۱۹۹۷. Precision among World Wide Web search services (search engines): Alta Vista, Excite, Hotbot, Infoseed, Lycos. [Online]. http://www.winona.msus.edu/library/webind۲.htm [Note: link Moved; URL changed ۸/۵/۹۸ by ald]
Rettig, James. ۱۹۹۶. Beyond cool: Analog models for reviewing digital resources. [Online]. http://www.onlineinc.com/onlinemag/SeptOL/retting۹.html [۳۰ April ۱۹۹۸].
Singh, Amarendra and Lidsky, David. ۱۹۹۶. “All-out search”. PC Magazine ۱۵(۲۱): ۲۱۳-۲۴۹.
Tate, Marsha and Alexander, K. ۱۹۹۶. “Teaching critical evaluation skills for World Wide Web resources.” Computers in Libraries ۱۶(۱۰): ۴۹-۵۵.
Tomaiuolo, Nicholas G. and Packer, Joan G. ۱۹۹۶. Quantitative analysis of five WWW “search engines”. [Online]. [Note: Broken link to http://neal.ctstateu.edu:۲۰۰۱/htdocs/websearch.html removed ۱۲/۲۱/۹۸ by ald] [۱ December ۱۹۹۷].
Webster, Kathleen and Paul, Kathryn. ۱۹۹۶. Beyond surfing: Tools and techniques for searching the web. [Online]. http://magi.com/~mmelick/it۹۶jan.htm [۲۶ November ۱۹۹۷]. [Note: Unable to connect ۴/۲/۰۲]
Lisa Wishard. Percision Among Internet Search Engines: An Earth Sciences Case Study, Issues in Science and Technology Librarianship, Spring ۱۹۹۸
نوشته: لیسا ویشارد
ترجمه: مهری صدیقی
عضو هیئت علمی مركز اطلاعات و مدارك علمی ایران
اطلاعات علوم زمین بصورت گستردهای از طریق مؤسسات و شركتهای دولتی، ملی، منطقهای و بینالمللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود میباشند. برخی از مؤسسات نظیر سازمان زمینشناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وبهای خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره مینمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژهای تحقیق میكنند، استفاده از یك موتور كاوش ضروری مینماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه مینماید. اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترسپذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه میگردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست میدهد. بخش دوم روششناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه مینماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی مینماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم میكند و راهكارهایی را كه میتواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار میدهد.
۱- ساختار موتور كاوش
موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت مینمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژههای موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمیدهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.
موتورهای كاوش در سه ردهء اصلی گسترش یافتهاند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ میباشد كه براساس موضوع یا نوع مدرك تنظیم شدهاند. نمونههایی از آنها عبارتند از:
یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژهای)، آرگوس كلیرینگهاوس (مجموعهای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وبهای بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژهای یا روبات خزنده (نرمافزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامههای روباتی یا عنكبوتی را فهرست مینمایند. این برنامهها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق دادهها، پیوندها و متن صفحات وبی، هدایت میشوند. نمونههایی از روباتهای خزنده عبارتند از: هات بات۱۳، كه برنامهای را بكار میبرد كه صفحات وب را كلمه به كلمه فهرست میكند. اینفوسیك كه اطلاعات را از بین فرامین دادهها و پیوندها انتخاب مینماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخهای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو میكند و نتایج تلفیقی را ارائه مینماید.
نمونههایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژهها را برای جستجوی شش فهرست بطور همزمان بكار میبرد و آسك جیوز۱۶ كه پرسشهای زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژهای بطور همزمان، بكار میبرد.
در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژهای و نیز درختهای موضوعی قابل مرور میباشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژهای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتیشان فراهم میكنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.
به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك مینمایند:
۱- پایگاه اطلاعاتی چگونه ایجاد میشود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته میباشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور مینماید.
۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور میكنند، اما در عمل صفحات بیشتری را فهرست مینمایند. موتورهای دیگر هر صفحه را منظور مینمایند.
۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد میشود؟ برنامهریزان، روباتهای خزندهای را طراحی نمودهاند كه بصورت خودكار طبق یك برنامهء منظم كار مینماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.
۴- چه عوامل جستجویی، موتور را حمایت مینمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد مینمایند، در حالیكه برخی دیگر چنین نمیكنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان میباشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمیدهد.
۵- نتایج جستجو چگونه مرتب شده و نمایش داده میشود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار میبرند، نتایج جستجو را نه تنها برای واژههای مشخص بلكه برای مفاهیم مربوطه نیز ارائه مینمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه مینمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست مینمایند. نتایجی كه دیگر موتورهای كاوش ارائه مینمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرستنویسی، معرفی یا اطلاعات مربوط به نویسنده.
اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم میخورد. برای كنترل بیشتر اطلاعیابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسههای جالبی بین موتورهای كاوش اصلی انجام میدهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط«مات اسلات»
http://janus.ambrosiasw.com/~fprefect/matrix/
[Note:Link moved; URL changed ۴/۲/۰۲ by ald]
موتورهای كاوش واچ وب سایت۲۳
( http://searchenginewatch.com /)
و موتورهای كاوش :C&#۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو مینمایند (تهیه شده توسط آندره جی. لئونارد)
http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )
[Note: Broken link removed ۸/۵/۹۸ by ald]
این سایت وبها دارای جداولی میباشند كه در آنها توانائیها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه میگردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفهای دانشگاه كارولینای شمالی
( http://www.it.unc.edu/guides/irg-۰۸.html )
[Note: Broken link removed ۳/۴/۰۱ by ald]
و نیز فهرست موتورهای كاوش یاهو بازدید كنید.
http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).
[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]
۲- روششناسی
فهرستی از موتورهای كاوش مورد بررسی در جدول شمارهء ۱ آورده شده است. در این جدول نام، نشانی اینترنتی، اندازهء پایگاه اطلاعاتی هر موتور و توضیحات كاربر ارائه شده است. ضمناً یك ارزیابی ازدقت موتور جستجو بر مبنای سه نوع جستجوی نمونه نیز، در آن آمده است. سه نمونه پرسش بكار رفته در این تحقیق عبارتند از:
۱) ENSO (نوسان جنوبی EI Ni ?o)
۲) زون گسله مادرید جدید
۳) تولید مس در برزیل
حجم جستجو در این مطالعه، در مقایسه با دیگر مطالعات دقت موتور كاوش (لیتون و اسری و استاوا، ۱۹۹۷) و (تومائیولو و پاكر، ۱۹۹۶)، كم است، لكن با توجه به تأكید بر موضوعات مرتبط با علوم زمین، حائز اهمیت است. برای بررسی نتایج موتور كاوش، پرسشهای نمونه، بر مبنای پرسشهای كلیدواژهای، عبارتی و چند مفهومی انتخاب شده است. جستجوهای سادهای كه شكل تعریف نشدهای از ابزارهای مورد ارزیابی را ارائه میدهند. این بدان علت انجام میگیرد كه راهكارهای جستجوی ابزاری نسبت به راهكارهای جستجوگر، بیشتر مورد استفاده میباشد. موتورهای كاوش انتخاب شده برای این مطالعه، از فهرست موتورهای كاوش در سایتهای مختلف انتخاب شدهاند از قبیل:
Search Engine Watch
( http://searchenginewatch.com/ )
مقاله ۱۹۹۶ وبستر و پاول «ابزارها و فنون جستجوی وب»،
( http://magi.com/~mmelick/it۹۶jan.htm )
و فهرست ابزارهای جستجوی اینترنتی در كتابخانه دانشگاهی شمال غربی
( http://www.library.nwu.edu/resources/internet/search/ )
و مؤسسه فنآوری حرفهای دانشگاه كارولینای شمالی
[ald; Broken link removed ۴/۲/۰۲].
دقت برای سنجش سودمندی موتورهای كاوش بكار رفته است كه بر مبنای نسبت تعداد ركوردهای مربوط در ۱۰ تا ۱۵ ركورد اول بازیابی شده، میباشد. این نسبت به سه درجه تقسیم میگردد: زیاد، متوسط، كم. موتورهای كاوشی كه پیوندهای فعال مرتبط با اطلاعات مربوط به پرسشهای نمونه را ارائه میدهند، دارای درجه دقت زیاد میباشند، به موتورهای كاوشی كه پیوندهای حاشیهای ارائه مینمایند (نظیر اطلاعات مس در كشورهای دیگر)، یك درجه دقت متوسط داده شده است. موتورهای كاوشی كه تعداد بسیار زیادی پیوندهای كاملاً غیرمرتبط و غیرفعال (نظیر محسوب كردن ENSO بعنوان نام یك شركت به جای یك پدیدهء هواشناختی یا پیوندهای حاوی اطلاعاتی در مورد مادرید، اسپانیا) را در ۱۰ تا ۱۵ ركورد اول ارائه مینمایند، دارای درجه دقت ضعیف میباشند. میزان دقت ارائه شده در جداول، بیش از آن كه یك معیار واقعی آماری نسبت باشد، تفسیری از نتایج به شمار میآید. این مطالعه یك نوع ارزیابی آماری از دقت نتایج موتورهای كاوش نیست بلكه عبارت از یك كاوش تفسیری ابزارها و سودمندی آنها در علوم زمین میباشد.در صورتی كه اطلاعات حاصل از نتایج یكدست بوده و دادههای حقیقی را بدست دهد و بتواند در یك فعالیت مرجع بكار رود، آنگاه نتایج حاصله مناسب و مرتبط خواهد بود.كیفیت پیوندهای ارائه شده، به منظور پی بردن به دقت، توانایی، پوشش، روزآمد و منحصر به فرد بودن، بررسی شده است. (رتینگ، ۱۹۹۶؛ تیت و الكساندر، ۱۹۹۶). بعنوان مثال، به صفحاتی كه اطلاعات قابل تأیید را كه مستقیماً با پرسش مربوطه مرتبط میباشد را فراهم مینمایند، امتیاز بالا داده میشود. به صفحاتی كه اطلاعات حاشیهای، غیرقابل تأیید و تكراری را فراهم مینمایند و مستلزم آنند كه كاربر جستجوی اضافی انجام دهد، امتیاز متوسط داده میشود. به موتورهای كاوشی كه پیوندهای كاملاً نامرتبط یا غیرفعال ارائه مینمایند، امتیاز ضعیف داده میشود. در حالی كه مطالعات دیگر، حجم گستردهای را جهت منظور نمودن گرایشات جستجوگر به هنگام تعیین ارتباط پیوندهای ارائه شده، به خود اختصاص میدهد، پژوهش حاضر، مطالعهای تفسیری در یك زمینهء موضوعی خاص است. بنابراین در آن تعدیل گرایشات بالقوه جستجوگر در ارزیابی نتایج، موردنظر قرار نمیگیرد.موتورهای كاوش از نظر اندازه نیز در سه رده جای میگیرند: موتورهای كاوش بزرگ، دارای بیش از ۲۵ میلیون ارل یا صفحات وب، موتورهای كاوش متوسط دارای بین ۱ میلیون و ۲۵ میلیون ارل یا صفحات وب و موتورهای كاوش كوچك دارای كمتر از یك میلیون ارل یا صفحات وب. برخی اندازهها تقریبی میباشند
۳- نتایج
تعیین عناوین ویژه: نتایج فهرست یا راهنما
به هنگام جستجوی عناوین ویژه، نظیر هواشناسی یا چینهشناسی، بهترین نقطه برای شروع عبارت است از: موتورهای كاوش فهرستی یا راهنما كه پیوندهای موضوعی را ارائه میدهند نظیر: یاهو، گالاكسی یا اینترنت اسلوث. هر یك از این ابزارها، درختهای موضوعی چند ردیفه را ارائه میكنند. بعنوان مثال روی صفحهء اصلی گالاكسی، جستجوگر میتواند بیش از ۱۱ رده اصلی و ۱۴۸ زیررده را انتخاب نماید. پیوندهای اطلاعات علوم زمین و محیط زیست میتواند در جاهای متعددی یافت شود: بعنوان مثال زیر رده «محیط زیست» تحت ردههای اصلی «جامعه» و «قانون»؛ «جغرافیا» زیر ردهء «علوم اجتماعی»؛ و «غارشناسی» زیر ردهء «سرگرمی و تفریحات» قرار میگیرند. بیشترین پیوندها برای علوم زمین زیر «علوم زمین» در ردهء «علوم» وجود دارد. صفحهء علوم زمین دارای ۵ رده برای علوم زمین است. شامل: «ژئوشیمی»، «زمینشناسی»، «زمینشناسی دریایی»، «ژئوفیزیك» و «هواشناسی و اقلیمشناسی». بدنبال پیوند برای «هواشناسی و اقلیمشناسی»، جستجوگر پیوندهایی را كه در ردههای زیر گرد آمدهاند، بدست میآورد: مؤسسات آموزشی، مقالات (متن كامل)، نقشهكشی، مجموعهها، راهنماها، سازمانهای دولتی و مؤسسات. در هر بار جستجو، جستجوگر میتواند جستجوهای كلیدواژهای بانك اطلاعاتی یا پیوند با ردههای مرتبط را، در كل سطوح مختلف موتور گالاكسی انجام دهد.بررسی موتورهای چند راهنما یا فهرستی میتواند بیانگر ناكامی برخی از موتورها در استفاده از یك واژگان كنترل شده باشد. Librarians Index و WWW Virtual Catalog هر دو، اطلاعات را از طریق ردههای موضوعی كتابخانهء كنگره (و نه از طریق شمارهء رده LC)، ردهبندی مینمایند. برنامهریزان یاهو به طرح ردهبندی موضوعی بلاواسطه خود میبالند. لوك اسمارت یك فهرست موضوعی ۱۶۰۰۰ تایی را ارائه مینماید. موتورهای كاوش فهرستی، قابلیت استفاده خود را به تحقیقات بزرگ محدود مینمایند (لكن بدون استفاده از اصطلاحنامه اسامی و موضوعی). این نكته بویژه برای آن دسته از ردههای علمی كه پیدا كردن آنها با مرور كردن یا جستجوی كلیدواژهای مشكل است، صادق است. علوم زمین و سایر ردههای علمی غالباً زیر عناوینی چون «آموزش و پرورش»، «مرجع» یا «یادگیری»، مخفی میشوند. اگر یك عنوان مفید، پس از مرور یك یا دو سطح پوشش داده نشود، پرسش از بانك اطلاعاتی توسط كلیدواژهها انجام میشود. جامعترین درختهای موضوعی مرتبط با علوم زمین در دو موتور كاوش یافت میشوند: یاهو و WWW Virtual Library. به كمك این ابزارهای جستجو روی موتورهای كاوش نوع فهرستی میتوان در مقایسه با مرور ساده فهرستهای موضوعی، به دقت بیشتری دست یافت. بعلاوه این ابزارهای جستجو قابلیت انعطاف بیشتری در رابطه با جستجوی متن پایگاه اطلاعاتی، كه در غیاب واژگانهای كنترل شده یا فهرستهای موضوعی برای پایگاههای اطلاعاتی، بسیار مفید میباشند، فراهم مینمایند. موتور كاوش جی اوتو دارای بیشترین دقت در ابزار جستجو میباشد. (ابزارهای آرگوس كلیرینگهاوس و اینفوماین نیز نتایج دقیقی در ارتباط با پرسشهای نمونه ارائه كردهاند. به هر حال در هنگام استفاده از این ابزارها، لازم است جستجوگر نسبت به این نكته كه پایگاههای اطلاعاتی آنها كوچك بوده و اینكه دقت بستگی به وجود یا عدم وجود موضوع مورد پرسش در پایگاه اطلاعاتی دارد، آگاه باشد. بعنوان مثال پرسش «ENSO»، در مقایسه با پرسشهای «زون گسله مادرید» و «تولید مس در برزیل»، نتایج بسیار دقیقتری در موتورهای آرگوس و اینفوماین ارائه میكند).
تعیین اطلاعات ویژه: نتایج كلیدواژهای یا روبات نرمافزاری (خزنده)
نیازهای اطلاعاتی دقیق یا بسیار ویژه، با موتورهای كاوش كلیدواژهای یا چندشاخهای، بهتر تأمین میشود. با این ابزارها جستجوگران میتوانند با استفاده از برخی واژههای جستجوی منحصر به فرد در حد امكان، دقت را افزایش دهند. موتورهای جستجوی كلیدواژهای یا روباتهای نرمافزاری (خزنده) كه دارای بیشترین میزان دقت و مرتبطترین پیوندهای فعال میباشند عبارتند از: اكسایت و اینفوسیك.
جستجوی تعریف نشده اینفوسیك برای «تولید مس در برزیل»، دارای دقت كمی است، در حالی كه جستجو در مورد «زون گسله مادرید جدید» دقت متوسطی دارد. (دقت به كمك جستجوی موردی دقیق بالا میرود، بعنوان مثال «New Madrid fault zone» در مقایسه با «new Madrid fault zone» نتایج دقیقتری بدست میدهد). دقیقترین جستجوی اینفوسیك جستجوی كلیدواژهای روی «ENSO» میباشد. استفاده از گزینههای اصلاحی اینفوسیك، موجب تكمیل نتایج در تمامی جستجوها میگردد. بعنوان مثال، فرمان «pipe»، كه ركوردهای مرتبط را در مجموعهء بزرگتری از ركوردها جستجو میكند، یا «مس &#۶۱۶۹۰;برزیل» كه به مدارك مرتبطتری در مقایسه با جستجوی استاندارد هدایت میكند. در نتیجه پیوندهای «موضوعی مربوط» اینفوسیك، برخی پیوندهای اضافی مرتبط را نشان نمیدهند.اكسایت با استفاده از جستجوهای عبارتی و چند مفهومی در مقایسه با پرسش كلیدواژهای، بهتر عمل میكند. پرسش ساده در ارتباط با «تولید مس در برزیل»، در صفحهء انجمن توسعهء مس، تحت عنوان «مس: بازار و آمار دادهها»، اطلاعیههای رسمی و گزارشات سالانه از شركتهای مرتبط با معادن مس در برزیل، را پیدا نموده است. اكسایت چندین پیوند تكراری را در تمامی پرسشهای نمونه ارائه نموده است، بعنوان مثال در جستجوی «ENSO» صفحهء NOAA-CIRES ENSO را در هر دو آدرس
http://www.cdc.noaa.gov/enso/index.html
http://www.cdc.noaa.gov/eno/
ارائه مینماید. گزینهء «مانند این»۲۵ در اكسایت، هیچ نوع پیوندهای اضافی مرتبط را در هر یك از سؤالات نمونه بازیابی نمیكند.
نتایج اكسایت و اینفوسیك برای پرسش «تولید مس در برزیل»، مشابه میباشند و عمدتاً اطلاعیههای رسمی، گزارشات سالانه و گزارشات فنی شركتهای معدنی و تولیدی را ارائه مینمایند. خطای اصلی در ارتباط با این پرسش، آن است كه مس بعنوان یك مكمل كانی غذایی در نظر گرفته میشود. (با كمال تعجب «زغال سنگ برزیل»، منبع خوبی برای مس میباشد). خطای اصلی در ارتباط با پرسش «ENSO»، شركتهای تحت عنوان ENSO میباشد، در حالیكه معمولترین خطا در ارتباط با پرسش «زون گسله مادرید جدید» عبارت از پیوند با سایتهایی در مورد زونهای لرزهای غیرمرتبط و گسلهها میباشد.
نورترن لایت، یكی دیگر از موتورهای كاوش كلیدواژهای مفید است. این موتور نتایج را بصورت پوشههایی بر مبنای فراوانی و موضوع مرتب مینماید. برخی پوشهها كه با جستجوی نمونه روی تولید مس برزیل ایجاد شدهاند عبارتند از: «سایتهای تجاری»، «صنعت معدنكاری»، «صنعت فلزات»، «زغال سنگ» و «سمشناسی». پوشهها برای جستجوی «ENSO» عبارتند از: «صفحات شخصی»، «آب و هواشناسی» و «www.coaps.fsu.edu». نورترن لایت همچنین چند پایگاه اطلاعاتی «مجموعهء ویژه»۲۶ پیوسته را كه مقالات مجلات را پیدا مینماید، جستجو میكند. این مقالات را میتوان از نورترن لایت، با پرداخت هزینه بین ۲ تا ۶ دلار بسته به حجم و منبع مقاله خریداری نمود. این پیوند اینترنت و پایگاههای اطلاعاتی متون، عاملی در گرایش به بازدید وب میباشد.موتور كاوش پلانت سرچ۲۷، كه میزان دقت متوسط را بدست آورده است، دارای یكی از بهترین نمایشها برای نتایج جستجو میباشد. نتایج پلانت سرچ شامل یك نمودار ستونی جهت تصویر نمودن ارتباط برای هر واژه مورد جستجو در پرسش میباشد. نمودارهای ستونی نه تنها نشاندهنده ارتباط هر واژه برای ركورد پیدا شده میباشند، بلكه نتایج كلی برای جستجوی كامل را نیز نشان میدهند. هر ركورد همچنین دارای گزینهء «پیدا كنید مشابه»، تاریخ ركورد و تعداد كلمات در ركورد میباشد. پلانت سرچ همچنین به جستجوگر اجازه میدهد تا راهنماهای خرید را برای نتایج جستجو و نشانهها ایجاد نماید. پلانت سرچ در نتایج خود، تكراریهایی را به همراه دارد، بعنوان مثال همراه بودن سایتهای فرعی برای فهرست الفبایی گسل كالیفرنیای جنوبی در نتایج «زون گسله مادرید جدید» و نیز سه پیوند به صفحهء اصلی روزنامهء ENSO در نتایج «ENSO».لیكوس میانگین اعمال فوق را با جستجوهای عبارتی و چند مفهومی انجام میدهد، لكن نتایج پرسش كلیدواژهای ضعیف است. وب كرولر و ماژلان (موتور كاوس نوع فهرستی/راهنما)، دارای نتایج یكسان برای هر سه پرسش میباشند. بعلاوه نتایج وب كرولر و ماژلان صرفنظر از نوع آنها، تقریباً بیدقتترین نتایج در بین موتورهای مورد استفاده میباشد. بعنوان مثال، اولین سایت فهرست شده در پرسش «زون گسله مادرید جدید» عبارت است از یك نقشه مادرید، اسپانیا، ضمن آن كه پنجمین پیوند ارائه شده عبارت است از زون ورزشی Soccer: ESPN. هات بات دارای دقت متوسط بوده و فاقد جستجوی «تمام لغات» میباشد، لكن با استفاده از شكل «عبارت درست» همراه با پرسشهای عبارتی و چندمفهومی، دقت تا حدودی افزایش مییابد. وات-یو-سیك۲۸ در ارتباط با جستجوهای عبارتی و چند مفهومی دارای دقت كمی است، اما برای جستجوی كلیدواژهای روی «ENSO»، نتایج نسبتاً دقیقتری دارد. نتایج آلتاویستا در ارتباط با جستجوهای تعریف نشده، متوسط است اما با استفاده از گزینهء «پالایش»۲۹، دقت تا حدودی افزایش مییابد. نتایج آلتاویستا در ارتباط با تمامی پرسشها دارای پیوندهای تكراری میباشد.پوشش گسترده و وسیع: با استفاده از ابرموتورهای كاوش
موتورهای كاوش چند شاخهای، با افزایش اندازهء وب، رایجتر و مناسبتر میگردند. در عین حال استفاده از این موتورها نیز تعدادی پیوندهای ضعیف به همراه دارد. به ویژه، موتورهای چندشاخهای، متكی بوده و كنترلی روی جامعیت و روزآمدی پایگاههای اطلاعاتی كه جستجو مینمایند، ندارند. همچنین این موتورها، پرسشها را به چندین پایگاه اطلاعاتی كه هر یك از نظر ساختار و جستجو متفاوت میباشند، میفرستند. این ابزارها عموماً دارای یك تكذیبنامه پنهان در جایی مانند بخش «درباره» میباشند كه بیانگر آن است كه نتایج حاصل از راهكارهای جستجوی پیچیده بولی-تقریبی و سایر عملگرها نمیتواند تضمین كننده باشد. در عین حال برخی از نتایج موتورهای كاوش چند رشتهای، منابع دقیقی برای جستجوی وب به شمار میآیند.
بیشتر موتورهای كاوش چندشاخهای همانگونه كه در جدول ۱ نشان داده شده دارای نتایج متوسطاند. هیچ یك از موتورهای كاوش چندشاخهای در ارتباط با پرسشهای نمونه بعنوان بهترین ظاهر نشدهاند. بیشتر موتورها با ستجوهای كلیدواژهای بهتر عمل میكنند، در حالیكه برخی دیگر مفیدترین نتایج را با پرسشهای عبارتی یا چند مفهومی ارائه مینمایند. بعنوان مثال، ماما۳۰، پروفوشن۳۱ و متاكرولر با پرسش عبارتی «زون گسله مادرید جدید» و پرسش چندمفهومی «تولید مس در برزیل» بهتر عمل میكنند. اینفرنس فایند۳۲ و آسك جیوز دارای نتایج دقیقتری برای جستجوی كلیدواژهای «ENSO» میباشند.رابط برخی موتورهای جستجوی چندشاخهای به كاربر اجازه تصفیه یا جستجوی مستقیم در سطح بالا را میدهد. بعنوان مثال متاكرولر و ساوی سرچ۳۳ به كاربر اجازه میدهند تا برای واژههای مورد جستجو از «همه» یا «هریك» و نیز «بصورت یك عبارت» استفاده نماید. پروفوشن یك شكل تعریف نشده، یك شكل بولی یا یك شكل عبارتی را ارائه مینماید. در حالیكه ماما به كاربر اجازه میدهد تا برای واژهها «بصورت یك عبارت» را جستجو نماید یا جستجو برای واژهها را تنها به «عناوین مدرك»، محدود نماید.تعدادی از موتورها نظیر متافایند و اینفرس فایند، نتایج جستجوها را بوسیله كلیدواژه دستهبندی میكنند. برخی موتورها نظیر آسك جیوز و ساوی سرچ، نتایج را توسط ابزاری كه پیوندها را ارائه میكند، گروهبندی مینمایند. بیشتر آنها، نتایج را با مرتب كردن ارتباط بر مبنای نسبت جا و زمانی كه واژههای مورد جستجو پیدا میشوند، نمایش میدهند.اینترنت اسلوث كه یك موتور كاوش نوع فهرستی یا راهنما است، نیز میتواند بعنوان یك موتور كاوش چند رشتهای بكار رود. صفحهء اصلی اینترنت اسلوث بیش از ۲۱ رده موضوعی را كه میتواند به آسانی با نمایش زیر ردهها گسترش یابد، ارائه مینمایند. ردهء علوم دارای ۹ زیر رده است كه یكی از آنها «علوم زمین» میباشد. زیر رده «علوم زمین» موتورهای كاوش را برای بیش از ۱۱ نمونه از منابع مختلف علوم زمین نظیر ولكانوورلد و فهرست صفحات فنی SPE ارائه میكند. در حالیكه «علوم زمین» در اینترنت اسلوث یك فهرست جامع را بدست نمیدهد، پیوندها دسترسی به منابع تمام متن با كیفیت بالا را فراهم مینمایند. این دسترسی به موتورهای كاوش موضوعی، منحصر به فرد است. علاوه بر موتورهای جستجوی موضوعی، صفحهء اصلی اینترنت اسلوث نیز فرصتی را برای جستجوی كامل وب همزمان از طریق ۶ موتور كاوش اصلی كاوش (آلتاویستا، اكسایت، اینفوسیك، لیكوس، وب كرولر و یاهو) فراهم مینماید. جستجوگران میتوانند همچنین از موتورهای چند مروره، اخبار، بازرگانی و مالی، نرمافزار و یوزنت بازدید نمایند.آسك جیوز كه پرسشهای زبان طبیعی را بكار میبرد، با پرسش كلیدواژهای در مورد «ENSO» دقت بالای متوسطی را میدهد، لكن با پرسشهای عبارتی و چند مفهومی دقت زیر متوسط دارد. پرسشهای جستجو از طریق یك سیستم تخصصی كه نه تنها راهكارهای متناوب را برای جستجو اولیه پیشنهاد میكند، بلكه پرسش را به موتورهای اكسایت، هات بات، وب كرولر، آلتاویستا و اینفوسیك میفرستد، تقویت میگردد. پرسش نمونه در مورد «ENSO» به شش پرسش اضافی در شكل ۱، منتج شده است. راهكارهای جستجوی متناوب ارائه شده، كاملاً مرتبط با پرسش اولیه میباشد و برای كاربر فرصتی را جهت تمركز جستجو روی یك مفهوم ویژه از واژه مورد جستجو فراهم مینماید. آسك جیوز نیز ده منبع را از هر ۵ موتور كاوشی كه مورد پرسش قرار داده، ارائه مینماید. نتایج آسك جیوز از موتورهای مورد پرسش، با نتایج حاصل از موتورهای كاوش انفرادی هماهنگ میباشد (جدول ۱ را ملاحظه نمائید).
- سیستم تخصصی آسك جیوز كه پرسشهای متناوب را پیشنهاد مینماید
- جدیدترین پوشش خبری روی El Nino چیست؟
- یك El Nino چیست؟
- اطلاعات در مورد El Nino ۹۸-۱۹۹۷ را كجا میتوان پیدا كرد؟
- جدیدترین پوشش خبری در مورد طوفانهای كالیفرنیا چیست؟
- اطلاعات در مورد عناوین هواشناسی El Nino را كجا میتوان پیدا نمود؟
هایوی ۶۱ در ارتباط با جستجوهای عبارتی و چندمفهومی دارای دقت بالای متوسط است. هایوی ۶۱ پرسشها را به ۶ موتور جستجو شامل: یاهو، آلتاویستا، لیكوس، وب كرولر، اینفوسیك و اكسایت میفرستد. تعداد نتایج نمایش داده شده توسط جستجوگر تعیین میشود. وی تعداد موتورهای كاوشی را كه میتواند نتایج را پیدا كرده و نیز تعداد نتایج را به نمایش بگذارد، انتخاب مینماید. نتایج در مورد پرسش نمونه «تولید مس در برزیل» عبارت است از چند گزارش دولتی منحصر به فرد، همچنین بیشترین سایت وبها را از طریق حوزهء برزیل پیدا نموده است.هنگام استفاده از موتورهای كلیدواژهای و چندشاخهای، توجه به اینكه چه بخشهایی از صفحات موتور در حال جستجو بوده و بسط یك عبارت جستجوی دقیق حائز اهمیت است. حجم اطلاعات موجود روی وب، مستلزم استفاده از گزینههای «پیشرفته» یا «پالایش» برای نتایج جستجوی دقیقتر میباشد. بعلاوه جستجوگران باید توصیه ارائه شده از طریق اینفوسیك را در نظر داشته باشند: «پرسشهای بیشتر بهتر جواب میدهد». یك سری واژههای مشخص و واحد را برای بدست آوردن نتایج دقیقتر بكار ببرید. این توصیه برای یافتن اطلاعات علوم زمین و نیز هر جستجوی موضوعی دیگر بر روی وب، معتبر و با ارزش میباشد.
نتیجهگیری
نتایج حاصل از این مطالعه، منطبق با دیگر مطالعات دقت میباشد كه در آن هیچ یك از موتورهای كاوش بعنوان دقیقترین موتور برای یافتن اطلاعات روی وب جهانی ظاهر نشدهاند. حتی در ارتباط با پرسشهای علوم زمین نیز، هیچ از یك ابزارها ممتاز و برجسته نبودهاند. در مطالعه ۱۹۹۶، تومایولووپاكر، آلتاویستا را بعنوان ابزاری كه بیشترین تعداد پیوندهای ارتباطی را بر مبنای اولین ده پیوند بازیابی شده ارائه نموده است، تعیین نمودهاند. یك ارزیابی در ارتباط با میزان دقت پرسشهای مرتبط با علوم زمین بدین صورت است: ۱) اینفوسیك نتایج دقیقتری بدست میدهد. ۲) لیكوس و آلتاویستا به نحو قابل ملاحظهای، دقت كمتری دارند. لیتون و اسریواستاوا كه پیشرفتهترین روششناسی را در مطالعه خود مورد استفاده قرار دادند، نیز به این نتیجه رسیدند كه به طور قاطع دقیقترین موتور كاوش وجود ندارد.به هر حال «یك الگوی مشخص ارائه میگردد. آلتاویستا، اكسایت و اینفوسیك همواره خدماتی با بیشترین امتیاز متوسط ارزیابی شده میباشند» (۱۹۹۷-
http://www.winona.msus.edu/library/webind۲/wi۲pt۳.htm#RESULTS
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
بر مبنای دیگر مطالعات منتشره و نتایج حاصله در مطالعه مرتبط با علوم زمین، به جستجوگرانی كه سعی در یافتن «هر» نوع اطلاعات روی وب جهانی دارند، توصیه میشود از مجموعهای از ابزارها متناسب با نوع پرسش ارائه شده و نوع اطلاعات موردنیاز استفاده نمایند.
همانگونه كه لیتون و اسریواستاوا اظهار داشتهاند، «محاسبه دقت حقیقی (نسبت مدارك مرتبط ارائه شده به تعداد كل مدارك ارائه شده) بسیار دشوار است، چرا كه مستلزم آزمودن تمامی پیوندهای ارائه شده توسط یك سرویس كه میتواند تعداد آن به هزاران یا میلیونها برسد، میباشد».( ۱۹۹۷،http://www.winona.msus.edu/library/webind۲/wi۲pt۲.htm#EVALCRIT ,p۳ of ۸).
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
ضمن قبول نقاط ضعف این مطالعه، امید است كه نتایج حاصله بتواند بعنوان راهنمایی برای استفاده از موتورهای كاوش اینترنت جهت یافتن اطلاعات علوم زمین روی وب جهانی، مفید باشد.
توضیحات نهایی
۱) تمامی پرسشهای مربوط به علوم زمین، در این مطالعه عبارت از پرسشهای كلیدواژهای یا عبارتی میباشند. پرسشها عبارتند از: بهمنها، فعالیت آبهای سرد، زمینلرزه، گرم شدن جهانی، صاعقه، حوادث طبیعی، كاهش ازن، پلاستیك بازیافتی، صفحات تكتونیكی، گردبادها، آتشفشانها و طراحی آب پخشان.
۲) ارزیابی كلی در مطالعه تومایلو و پاركر بدین شرح است: آلتاویستا ۳/۹، اینفوسیك ۳/۸ و لیكوس ۱/۸. از تحلیل پرسشهای مرتبط با علوم زمین، این نتایج حاصل شده: اینفوسیك ۵/۹، لیكوس ۷/۸ و آلتاویستا ۳/۸.
پینوشتها:
۱. Internet Search Engine
۲. GO۲
۳. Infomine
۴. Argus Clearinghouse
۵. Excite
۶. Infoseek
۷. Northern Light
۸. Catalog or directory of search engines
۹. Yahoo!
۱۰. DejaNews
۱۱.Magellan
۱۲. Keyword or crawler search engines
۱۳. HotBot
۱۴.Multi-threaded search engines or meta-crawlers
۱۵. MetaCrawler
۱۶. Ask Jeeves
۱۷.Galaxy
۱۸.Internet Sleuth
۱۹.Lycos
۲۰.”Power” search
۲۱.”Advanced” search
۲۲. Web Matrix
۲۳. Watch Web site
۲۴. Look Smart
۲۵. “More like this”
۲۶. “Special Collection”
۲۷. Planet Search
۲۸. What-U-Seek
۲۹. “Refine”
۳۰. Mamma
۳۱. Profusion
۳۲. Inference Find
۳۳. Savvy Search
۳۴. MetaFind
۳۵. Volcano world
۳۶. Highway۶۱
منابع
Chu, Heting and Rosenthal, Marilyn. ۱۹۹۶. Search engines for the World Wide Web: A comparative study and evaluation methodology. [Online] http://www.asis.org/annual-۹۶/ElectronicPrceddings/chu.html [۲ April ۱۹۹۸].
Ding, Wei and Marchionini, Gary. ۱۹۹۶. A comparative study of web search service performance. In: American Society for Information Science ۱۹۹۶ Annual Conference Proceedings, ۳۳; Global complexity: Information, chaos and control; Baltimore, Maryland, Octorber ۲۱-۲۴, ۱۹۹۶. (Edited by Steve Hardin), pp. ۱۳۶-۱۴۲. Information Today, Medford, NJ.
Lebedev, Alexander, ۱۷ May ۱۹۹۷. Best search engines for finding scienctific information in the web. [Online]. http://ww.chem.msu.su/eng/comparison.html [۲۷ November ۱۹۹۷]. [Note: Broken link removed ۴/۲/۰۲ by ald]
Leighton, Vernon, H. and Srivastava, J. ۱۶ June ۱۹۹۷. Precision among World Wide Web search services (search engines): Alta Vista, Excite, Hotbot, Infoseed, Lycos. [Online]. http://www.winona.msus.edu/library/webind۲.htm [Note: link Moved; URL changed ۸/۵/۹۸ by ald]
Rettig, James. ۱۹۹۶. Beyond cool: Analog models for reviewing digital resources. [Online]. http://www.onlineinc.com/onlinemag/SeptOL/retting۹.html [۳۰ April ۱۹۹۸].
Singh, Amarendra and Lidsky, David. ۱۹۹۶. “All-out search”. PC Magazine ۱۵(۲۱): ۲۱۳-۲۴۹.
Tate, Marsha and Alexander, K. ۱۹۹۶. “Teaching critical evaluation skills for World Wide Web resources.” Computers in Libraries ۱۶(۱۰): ۴۹-۵۵.
Tomaiuolo, Nicholas G. and Packer, Joan G. ۱۹۹۶. Quantitative analysis of five WWW “search engines”. [Online]. [Note: Broken link to http://neal.ctstateu.edu:۲۰۰۱/htdocs/websearch.html removed ۱۲/۲۱/۹۸ by ald] [۱ December ۱۹۹۷].
Webster, Kathleen and Paul, Kathryn. ۱۹۹۶. Beyond surfing: Tools and techniques for searching the web. [Online]. http://magi.com/~mmelick/it۹۶jan.htm [۲۶ November ۱۹۹۷]. [Note: Unable to connect ۴/۲/۰۲]
Lisa Wishard. Percision Among Internet Search Engines: An Earth Sciences Case Study, Issues in Science and Technology Librarianship, Spring ۱۹۹۸
نوشته: لیسا ویشارد
ترجمه: مهری صدیقی
عضو هیئت علمی مركز اطلاعات و مدارك علمی ایران
هیچ نظری موجود نیست:
ارسال یک نظر