۱۰.۰۷.۱۳۸۹

دقت موتورهای کاوش اینترنتی: مطالعه‌ای موردی در ارتباط با علوم زمین

مقدمه
اطلاعات علوم زمین بصورت گسترده‌ای از طریق مؤسسات و شركتهای دولتی، ملی، منطقه‌ای و بین‌المللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود می‌باشند. برخی از مؤسسات نظیر سازمان زمین‌شناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وب‌های خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره می‌نمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژه‌ای تحقیق می‌كنند، استفاده از یك موتور كاوش ضروری می‌نماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه می‌نماید. اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترس‌پذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه می‌گردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست می‌دهد. بخش دوم روش‌شناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه می‌نماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی می‌نماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم می‌كند و راهكارهایی را كه می‌تواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار می‌دهد.
۱- ساختار موتور كاوش
موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت می‌نمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژه‌های موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمی‌دهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.
موتورهای كاوش در سه ردهء اصلی گسترش یافته‌اند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ می‌باشد كه براساس موضوع یا نوع مدرك تنظیم شده‌اند. نمونه‌هایی از آنها عبارتند از:
یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژه‌ای)، آرگوس كلیرینگهاوس (مجموعه‌ای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وب‌های بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژه‌ای یا روبات خزنده (نرم‌افزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامه‌های روباتی یا عنكبوتی را فهرست می‌نمایند. این برنامه‌ها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق داده‌ها، پیوندها و متن صفحات وبی، هدایت می‌شوند. نمونه‌هایی از روبات‌های خزنده عبارتند از: هات بات۱۳، كه برنامه‌ای را بكار می‌برد كه صفحات وب را كلمه به كلمه فهرست می‌كند. اینفوسیك كه اطلاعات را از بین فرامین داده‌ها و پیوندها انتخاب می‌نماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخه‌ای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو می‌كند و نتایج تلفیقی را ارائه می‌نماید.
نمونه‌هایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژه‌ها را برای جستجوی شش فهرست بطور همزمان بكار می‌برد و آسك جیوز۱۶ كه پرسش‌های زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژه‌ای بطور همزمان، بكار می‌برد.
در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژه‌ای و نیز درختهای موضوعی قابل مرور می‌باشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژه‌ای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتی‌شان فراهم می‌كنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.
به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك می‌نمایند:
۱- پایگاه اطلاعاتی چگونه ایجاد می‌شود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته می‌باشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور می‌نماید.
۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور می‌كنند، اما در عمل صفحات بیشتری را فهرست می‌نمایند. موتورهای دیگر هر صفحه را منظور می‌نمایند.
۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد می‌شود؟ برنامه‌ریزان، روباتهای خزنده‌ای را طراحی نموده‌اند كه بصورت خودكار طبق یك برنامهء منظم كار می‌نماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.
۴- چه عوامل جستجویی، موتور را حمایت می‌نمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد می‌نمایند، در حالیكه برخی دیگر چنین نمی‌كنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان می‌باشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمی‌دهد.
۵- نتایج جستجو چگونه مرتب شده و نمایش داده می‌شود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار می‌برند، نتایج جستجو را نه تنها برای واژه‌های مشخص بلكه برای مفاهیم مربوطه نیز ارائه می‌نمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه می‌نمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست می‌نمایند. نتایجی كه دیگر موتورهای كاوش ارائه می‌نمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرست‌نویسی، معرفی یا اطلاعات مربوط به نویسنده.
اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم می‌خورد. برای كنترل بیشتر اطلاع‌یابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسه‌های جالبی بین موتورهای كاوش اصلی انجام می‌دهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط‌«مات اسلات»
http://janus.ambrosiasw.com/~fprefect/matrix/
[Note:Link moved; URL changed ۴/۲/۰۲ by ald]
موتورهای كاوش واچ وب سایت۲۳
( http://searchenginewatch.com /)
و موتورهای كاوش :C&#۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو می‌نمایند (تهیه شده توسط آندره جی. لئونارد)
http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )
[Note: Broken link removed ۸/۵/۹۸ by ald]
این سایت وب‌ها دارای جداولی می‌باشند كه در آنها توانائی‌ها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه می‌گردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفه‌ای دانشگاه كارولینای شمالی
( http://www.it.unc.edu/guides/irg-۰۸.html )
[Note: Broken link removed ۳/۴/۰۱ by ald]
و نیز فهرست موتورهای كاوش یاهو بازدید كنید.
http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).
[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]
۲- روش‌شناسی
فهرستی از موتورهای كاوش مورد بررسی در جدول شمارهء ۱ آورده شده است. در این جدول نام، نشانی اینترنتی، اندازهء پایگاه اطلاعاتی هر موتور و توضیحات كاربر ارائه شده است. ضمناً یك ارزیابی ازدقت موتور جستجو بر مبنای سه نوع جستجوی نمونه نیز، در آن آمده است. سه نمونه پرسش بكار رفته در این تحقیق عبارتند از:
۱) ENSO (نوسان جنوبی EI Ni ?o)
۲) زون گسله مادرید جدید
۳) تولید مس در برزیل
حجم جستجو در این مطالعه، در مقایسه با دیگر مطالعات دقت موتور كاوش (لیتون و اسری و استاوا، ۱۹۹۷) و (تومائیولو و پاكر، ۱۹۹۶)، كم است، لكن با توجه به تأكید بر موضوعات مرتبط با علوم زمین، حائز اهمیت است. برای بررسی نتایج موتور كاوش، پرسش‌های نمونه، بر مبنای پرسش‌های كلیدواژه‌ای، عبارتی و چند مفهومی انتخاب شده است. جستجوهای ساده‌ای كه شكل تعریف نشده‌ای از ابزارهای مورد ارزیابی را ارائه می‌دهند. این بدان علت انجام می‌گیرد كه راهكارهای جستجوی ابزاری نسبت به راهكارهای جستجوگر، بیشتر مورد استفاده می‌باشد. موتورهای كاوش انتخاب شده برای این مطالعه، از فهرست موتورهای كاوش در سایت‌های مختلف انتخاب شده‌اند از قبیل:
Search Engine Watch
( http://searchenginewatch.com/ )
مقاله ۱۹۹۶ وبستر و پاول «ابزارها و فنون جستجوی وب»،
( http://magi.com/~mmelick/it۹۶jan.htm )
و فهرست ابزارهای جستجوی اینترنتی در كتابخانه دانشگاهی شمال غربی
( http://www.library.nwu.edu/resources/internet/search/ )
و مؤسسه فن‌آوری حرفه‌ای دانشگاه كارولینای شمالی
[ald; Broken link removed ۴/۲/۰۲].
دقت برای سنجش سودمندی موتورهای كاوش بكار رفته است كه بر مبنای نسبت تعداد ركوردهای مربوط در ۱۰ تا ۱۵ ركورد اول بازیابی شده، می‌باشد. این نسبت به سه درجه تقسیم می‌گردد: زیاد، متوسط، كم. موتورهای كاوشی كه پیوندهای فعال مرتبط با اطلاعات مربوط به پرسش‌های نمونه را ارائه می‌دهند، دارای درجه دقت زیاد می‌باشند، به موتورهای كاوشی كه پیوندهای حاشیه‌ای ارائه می‌نمایند (نظیر اطلاعات مس در كشورهای دیگر)، یك درجه دقت متوسط داده شده است. موتورهای كاوشی كه تعداد بسیار زیادی پیوندهای كاملاً غیرمرتبط و غیرفعال (نظیر محسوب كردن ENSO بعنوان نام یك شركت به جای یك پدیدهء هواشناختی یا پیوندهای حاوی اطلاعاتی در مورد مادرید، اسپانیا) را در ۱۰ تا ۱۵ ركورد اول ارائه می‌نمایند، دارای درجه دقت ضعیف می‌باشند. میزان دقت ارائه شده در جداول، بیش از آن كه یك معیار واقعی آماری نسبت باشد، تفسیری از نتایج به شمار می‌آید. این مطالعه یك نوع ارزیابی آماری از دقت نتایج موتورهای كاوش نیست بلكه عبارت از یك كاوش تفسیری ابزارها و سودمندی آنها در علوم زمین می‌باشد.در صورتی كه اطلاعات حاصل از نتایج یكدست بوده و داده‌های حقیقی را بدست دهد و بتواند در یك فعالیت مرجع بكار رود، آنگاه نتایج حاصله مناسب و مرتبط خواهد بود.كیفیت پیوندهای ارائه شده، به منظور پی بردن به دقت، توانایی، پوشش، روزآمد و منحصر به فرد بودن، بررسی شده است. (رتینگ، ۱۹۹۶؛ تیت و الكساندر، ۱۹۹۶). بعنوان مثال، به صفحاتی كه اطلاعات قابل تأیید را كه مستقیماً با پرسش مربوطه مرتبط می‌باشد را فراهم می‌نمایند، امتیاز بالا داده می‌شود. به صفحاتی كه اطلاعات حاشیه‌ای، غیرقابل تأیید و تكراری را فراهم می‌نمایند و مستلزم آنند كه كاربر جستجوی اضافی انجام دهد، امتیاز متوسط داده می‌شود. به موتورهای كاوشی كه پیوندهای كاملاً نامرتبط یا غیرفعال ارائه می‌نمایند، امتیاز ضعیف داده می‌شود. در حالی كه مطالعات دیگر، حجم گسترده‌ای را جهت منظور نمودن گرایشات جستجوگر به هنگام تعیین ارتباط پیوندهای ارائه شده، به خود اختصاص می‌دهد، پژوهش حاضر، مطالعه‌ای تفسیری در یك زمینهء موضوعی خاص است. بنابراین در آن تعدیل گرایشات بالقوه جستجوگر در ارزیابی نتایج، موردنظر قرار نمی‌گیرد.موتورهای كاوش از نظر اندازه نیز در سه رده جای می‌گیرند: موتورهای كاوش بزرگ، دارای بیش از ۲۵ میلیون ارل یا صفحات وب، موتورهای كاوش متوسط دارای بین ۱ میلیون و ۲۵ میلیون ارل یا صفحات وب و موتورهای كاوش كوچك دارای كمتر از یك میلیون ارل یا صفحات وب. برخی اندازه‌ها تقریبی می‌باشند
۳- نتایج
تعیین عناوین ویژه: نتایج فهرست یا راهنما
به هنگام جستجوی عناوین ویژه، نظیر هواشناسی یا چینه‌شناسی، بهترین نقطه برای شروع عبارت است از: موتورهای كاوش فهرستی یا راهنما كه پیوندهای موضوعی را ارائه می‌دهند نظیر: یاهو، گالاكسی یا اینترنت اسلوث. هر یك از این ابزارها، درختهای موضوعی چند ردیفه را ارائه می‌كنند. بعنوان مثال روی صفحهء اصلی گالاكسی، جستجوگر می‌تواند بیش از ۱۱ رده اصلی و ۱۴۸ زیررده را انتخاب نماید. پیوندهای اطلاعات علوم زمین و محیط زیست می‌تواند در جاهای متعددی یافت شود: بعنوان مثال زیر رده «محیط زیست» تحت رده‌های اصلی «جامعه» و «قانون»؛ «جغرافیا» زیر ردهء «علوم اجتماعی»؛ و «غارشناسی» زیر ردهء «سرگرمی و تفریحات» قرار می‌گیرند. بیشترین پیوندها برای علوم زمین زیر «علوم زمین» در ردهء «علوم» وجود دارد. صفحهء علوم زمین دارای ۵ رده برای علوم زمین است. شامل: «ژئوشیمی»، «زمین‌شناسی»، «زمین‌شناسی دریایی»، «ژئوفیزیك» و «هواشناسی و اقلیم‌شناسی». بدنبال پیوند برای «هواشناسی و اقلیم‌شناسی»، جستجوگر پیوندهایی را كه در رده‌های زیر گرد آمده‌اند، بدست می‌آورد: مؤسسات آموزشی، مقالات (متن كامل)، نقشه‌كشی، مجموعه‌ها، راهنماها، سازمان‌های دولتی و مؤسسات. در هر بار جستجو، جستجوگر می‌تواند جستجوهای كلیدواژه‌ای بانك اطلاعاتی یا پیوند با رده‌های مرتبط را، در كل سطوح مختلف موتور گالاكسی انجام دهد.بررسی موتورهای چند راهنما یا فهرستی می‌تواند بیانگر ناكامی برخی از موتورها در استفاده از یك واژگان كنترل شده باشد. Librarians Index و WWW Virtual Catalog هر دو، اطلاعات را از طریق رده‌های موضوعی كتابخانهء كنگره (و نه از طریق شمارهء رده LC)، رده‌بندی می‌نمایند. برنامه‌ریزان یاهو به طرح رده‌بندی موضوعی بلاواسطه خود می‌بالند. لوك اسمارت یك فهرست موضوعی ۱۶۰۰۰ تایی را ارائه می‌نماید. موتورهای كاوش فهرستی، قابلیت استفاده خود را به تحقیقات بزرگ محدود می‌نمایند (لكن بدون استفاده از اصطلاحنامه اسامی و موضوعی). این نكته بویژه برای آن دسته از رده‌های علمی كه پیدا كردن آنها با مرور كردن یا جستجوی كلیدواژه‌ای مشكل است، صادق است. علوم زمین و سایر رده‌های علمی غالباً زیر عناوینی چون «آموزش و پرورش»، «مرجع» یا «یادگیری»، مخفی می‌شوند. اگر یك عنوان مفید، پس از مرور یك یا دو سطح پوشش داده نشود، پرسش از بانك اطلاعاتی توسط كلیدواژه‌ها انجام می‌شود. جامع‌ترین درختهای موضوعی مرتبط با علوم زمین در دو موتور كاوش یافت می‌شوند: یاهو و WWW Virtual Library. به كمك این ابزارهای جستجو روی موتورهای كاوش نوع فهرستی می‌توان در مقایسه با مرور ساده فهرستهای موضوعی، به دقت بیشتری دست یافت. بعلاوه این ابزارهای جستجو قابلیت انعطاف بیشتری در رابطه با جستجوی متن پایگاه اطلاعاتی، كه در غیاب واژگان‌های كنترل شده یا فهرست‌های موضوعی برای پایگاه‌های اطلاعاتی، بسیار مفید می‌باشند، فراهم می‌نمایند. موتور كاوش جی اوتو دارای بیشترین دقت در ابزار جستجو می‌باشد. (ابزارهای آرگوس كلیرینگهاوس و اینفوماین نیز نتایج دقیقی در ارتباط با پرسش‌های نمونه ارائه كرده‌اند. به هر حال در هنگام استفاده از این ابزارها، لازم است جستجوگر نسبت به این نكته كه پایگاه‌های اطلاعاتی آنها كوچك بوده و اینكه دقت بستگی به وجود یا عدم وجود موضوع مورد پرسش در پایگاه اطلاعاتی دارد، آگاه باشد. بعنوان مثال پرسش «ENSO»، در مقایسه با پرسش‌های «زون گسله مادرید» و «تولید مس در برزیل»، نتایج بسیار دقیق‌تری در موتورهای آرگوس و اینفوماین ارائه می‌كند).
تعیین اطلاعات ویژه: نتایج كلیدواژه‌ای یا روبات نرم‌افزاری (خزنده)
نیازهای اطلاعاتی دقیق یا بسیار ویژه، با موتورهای كاوش كلیدواژه‌ای یا چندشاخه‌ای، بهتر تأمین می‌شود. با این ابزارها جستجوگران می‌توانند با استفاده از برخی واژه‌های جستجوی منحصر به فرد در حد امكان، دقت را افزایش دهند. موتورهای جستجوی كلیدواژه‌ای یا روبات‌های نرم‌افزاری (خزنده) كه دارای بیشترین میزان دقت و مرتبط‌ترین پیوندهای فعال می‌باشند عبارتند از: اكسایت و اینفوسیك.
جستجوی تعریف نشده اینفوسیك برای «تولید مس در برزیل»، دارای دقت كمی است، در حالی كه جستجو در مورد «زون گسله مادرید جدید» دقت متوسطی دارد. (دقت به كمك جستجوی موردی دقیق بالا می‌رود، بعنوان مثال «New Madrid fault zone» در مقایسه با «new Madrid fault zone» نتایج دقیق‌تری بدست می‌دهد). دقیق‌ترین جستجوی اینفوسیك جستجوی كلیدواژه‌ای روی «ENSO» می‌باشد. استفاده از گزینه‌های اصلاحی اینفوسیك، موجب تكمیل نتایج در تمامی جستجوها می‌گردد. بعنوان مثال، فرمان «pipe»، كه ركوردهای مرتبط را در مجموعهء بزرگتری از ركوردها جستجو می‌كند، یا «مس &#۶۱۶۹۰;برزیل» كه به مدارك مرتبط‌تری در مقایسه با جستجوی استاندارد هدایت می‌كند. در نتیجه پیوندهای «موضوعی مربوط» اینفوسیك، برخی پیوندهای اضافی مرتبط را نشان نمی‌دهند.اكسایت با استفاده از جستجوهای عبارتی و چند مفهومی در مقایسه با پرسش كلیدواژه‌ای، بهتر عمل می‌كند. پرسش ساده در ارتباط با «تولید مس در برزیل»، در صفحهء انجمن توسعهء مس، تحت عنوان «مس: بازار و آمار داده‌ها»، اطلاعیه‌های رسمی و گزارشات سالانه از شركتهای مرتبط با معادن مس در برزیل، را پیدا نموده است. اكسایت چندین پیوند تكراری را در تمامی پرسش‌های نمونه ارائه نموده است، بعنوان مثال در جستجوی «ENSO» صفحهء NOAA-CIRES ENSO را در هر دو آدرس
http://www.cdc.noaa.gov/enso/index.html
http://www.cdc.noaa.gov/eno/
ارائه می‌نماید. گزینهء «مانند این»۲۵ در اكسایت، هیچ نوع پیوندهای اضافی مرتبط را در هر یك از سؤالات نمونه بازیابی نمی‌كند.
نتایج اكسایت و اینفوسیك برای پرسش «تولید مس در برزیل»، مشابه می‌باشند و عمدتاً اطلاعیه‌های رسمی، گزارشات سالانه و گزارشات فنی شركتهای معدنی و تولیدی را ارائه می‌نمایند. خطای اصلی در ارتباط با این پرسش، آن است كه مس بعنوان یك مكمل كانی غذایی در نظر گرفته می‌شود. (با كمال تعجب «زغال سنگ برزیل»، منبع خوبی برای مس می‌باشد). خطای اصلی در ارتباط با پرسش «ENSO»، شركتهای تحت عنوان ENSO می‌باشد، در حالیكه معمولترین خطا در ارتباط با پرسش «زون گسله مادرید جدید» عبارت از پیوند با سایتهایی در مورد زونهای لرزه‌ای غیرمرتبط و گسله‌ها می‌باشد.
نورترن لایت، یكی دیگر از موتورهای كاوش كلیدواژه‌ای مفید است. این موتور نتایج را بصورت پوشه‌هایی بر مبنای فراوانی و موضوع مرتب می‌نماید. برخی پوشه‌ها كه با جستجوی نمونه روی تولید مس برزیل ایجاد شده‌اند عبارتند از: «سایت‌های تجاری»، «صنعت معدن‌كاری»، «صنعت فلزات»، «زغال سنگ» و «سم‌شناسی». پوشه‌ها برای جستجوی «ENSO» عبارتند از: «صفحات شخصی»، «آب و هواشناسی» و «www.coaps.fsu.edu». نورترن لایت همچنین چند پایگاه اطلاعاتی «مجموعهء ویژه»۲۶ پیوسته را كه مقالات مجلات را پیدا می‌نماید، جستجو می‌كند. این مقالات را می‌توان از نورترن لایت، با پرداخت هزینه بین ۲ تا ۶ دلار بسته به حجم و منبع مقاله خریداری نمود. این پیوند اینترنت و پایگاه‌های اطلاعاتی متون، عاملی در گرایش به بازدید وب می‌باشد.موتور كاوش پلانت سرچ۲۷، كه میزان دقت متوسط را بدست آورده است، دارای یكی از بهترین نمایش‌ها برای نتایج جستجو می‌باشد. نتایج پلانت سرچ شامل یك نمودار ستونی جهت تصویر نمودن ارتباط برای هر واژه مورد جستجو در پرسش می‌باشد. نمودارهای ستونی نه تنها نشان‌دهنده ارتباط هر واژه برای ركورد پیدا شده می‌باشند، بلكه نتایج كلی برای جستجوی كامل را نیز نشان می‌دهند. هر ركورد همچنین دارای گزینهء «پیدا كنید مشابه»، تاریخ ركورد و تعداد كلمات در ركورد می‌باشد. پلانت سرچ همچنین به جستجوگر اجازه می‌دهد تا راهنماهای خرید را برای نتایج جستجو و نشانه‌ها ایجاد نماید. پلانت سرچ در نتایج خود، تكراری‌هایی را به همراه دارد، بعنوان مثال همراه بودن سایت‌های فرعی برای فهرست الفبایی گسل كالیفرنیای جنوبی در نتایج «زون گسله مادرید جدید» و نیز سه پیوند به صفحهء اصلی روزنامهء ENSO در نتایج «ENSO».لیكوس میانگین اعمال فوق را با جستجوهای عبارتی و چند مفهومی انجام می‌دهد، لكن نتایج پرسش كلیدواژه‌ای ضعیف است. وب كرولر و ماژلان (موتور كاوس نوع فهرستی/راهنما)، دارای نتایج یكسان برای هر سه پرسش می‌باشند. بعلاوه نتایج وب كرولر و ماژلان صرفنظر از نوع آنها، تقریباً بی‌دقت‌ترین نتایج در بین موتورهای مورد استفاده می‌باشد. بعنوان مثال، اولین سایت فهرست شده در پرسش «زون گسله مادرید جدید» عبارت است از یك نقشه مادرید، اسپانیا، ضمن آن كه پنجمین پیوند ارائه شده عبارت است از زون ورزشی Soccer: ESPN. هات بات دارای دقت متوسط بوده و فاقد جستجوی «تمام لغات» می‌باشد، لكن با استفاده از شكل «عبارت درست» همراه با پرسش‌های عبارتی و چندمفهومی، دقت تا حدودی افزایش می‌یابد. وات-یو-سیك۲۸ در ارتباط با جستجوهای عبارتی و چند مفهومی دارای دقت كمی است، اما برای جستجوی كلیدواژه‌ای روی «ENSO»، نتایج نسبتاً دقیقتری دارد. نتایج آلتاویستا در ارتباط با جستجوهای تعریف نشده، متوسط است اما با استفاده از گزینهء «پالایش»۲۹، دقت تا حدودی افزایش می‌یابد. نتایج آلتاویستا در ارتباط با تمامی پرسش‌ها دارای پیوندهای تكراری می‌باشد.پوشش گسترده و وسیع: با استفاده از ابرموتورهای كاوش
موتورهای كاوش چند شاخه‌ای، با افزایش اندازهء وب، رایج‌تر و مناسب‌تر می‌گردند. در عین حال استفاده از این موتورها نیز تعدادی پیوندهای ضعیف به همراه دارد. به ویژه، موتورهای چندشاخه‌ای، متكی بوده و كنترلی روی جامعیت و روزآمدی پایگاههای اطلاعاتی كه جستجو می‌نمایند، ندارند. همچنین این موتورها، پرسش‌ها را به چندین پایگاه اطلاعاتی كه هر یك از نظر ساختار و جستجو متفاوت می‌باشند، می‌فرستند. این ابزارها عموماً دارای یك تكذیب‌نامه پنهان در جایی مانند بخش «درباره» می‌باشند كه بیانگر آن است كه نتایج حاصل از راهكارهای جستجوی پیچیده بولی-تقریبی و سایر عملگرها نمی‌تواند تضمین كننده باشد. در عین حال برخی از نتایج موتورهای كاوش چند رشته‌ای، منابع دقیقی برای جستجوی وب به شمار می‌آیند.
بیشتر موتورهای كاوش چندشاخه‌ای همانگونه كه در جدول ۱ نشان داده شده دارای نتایج متوسط‌اند. هیچ یك از موتورهای كاوش چندشاخه‌ای در ارتباط با پرسش‌های نمونه بعنوان بهترین ظاهر نشده‌اند. بیشتر موتورها با ستجوهای كلیدواژه‌ای بهتر عمل می‌كنند، در حالیكه برخی دیگر مفیدترین نتایج را با پرسش‌های عبارتی یا چند مفهومی ارائه می‌نمایند. بعنوان مثال، ماما۳۰، پروفوشن۳۱ و متاكرولر با پرسش عبارتی «زون گسله مادرید جدید» و پرسش چندمفهومی «تولید مس در برزیل» بهتر عمل می‌كنند. اینفرنس فایند۳۲ و آسك جیوز دارای نتایج دقیق‌تری برای جستجوی كلیدواژه‌ای «ENSO» می‌باشند.رابط برخی موتورهای جستجوی چندشاخه‌ای به كاربر اجازه تصفیه یا جستجوی مستقیم در سطح بالا را می‌دهد. بعنوان مثال متاكرولر و ساوی سرچ۳۳ به كاربر اجازه می‌دهند تا برای واژه‌های مورد جستجو از «همه» یا «هریك» و نیز «بصورت یك عبارت» استفاده نماید. پروفوشن یك شكل تعریف نشده، یك شكل بولی یا یك شكل عبارتی را ارائه می‌نماید. در حالیكه ماما به كاربر اجازه می‌دهد تا برای واژه‌ها «بصورت یك عبارت» را جستجو نماید یا جستجو برای واژه‌ها را تنها به «عناوین مدرك»، محدود نماید.تعدادی از موتورها نظیر متافایند و اینفرس فایند، نتایج جستجوها را بوسیله كلیدواژه دسته‌بندی می‌كنند. برخی موتورها نظیر آسك جیوز و ساوی سرچ، نتایج را توسط ابزاری كه پیوندها را ارائه می‌كند، گروه‌بندی می‌نمایند. بیشتر آنها، نتایج را با مرتب كردن ارتباط بر مبنای نسبت جا و زمانی كه واژه‌های مورد جستجو پیدا می‌شوند، نمایش می‌دهند.اینترنت اسلوث كه یك موتور كاوش نوع فهرستی یا راهنما است، نیز می‌تواند بعنوان یك موتور كاوش چند رشته‌ای بكار رود. صفحهء اصلی اینترنت اسلوث بیش از ۲۱ رده موضوعی را كه می‌تواند به آسانی با نمایش زیر رده‌ها گسترش یابد، ارائه می‌نمایند. ردهء علوم دارای ۹ زیر رده است كه یكی از آنها «علوم زمین» می‌باشد. زیر رده «علوم زمین» موتورهای كاوش را برای بیش از ۱۱ نمونه از منابع مختلف علوم زمین نظیر ولكانوورلد و فهرست صفحات فنی SPE ارائه می‌كند. در حالیكه «علوم زمین» در اینترنت اسلوث یك فهرست جامع را بدست نمی‌دهد، پیوندها دسترسی به منابع تمام متن با كیفیت بالا را فراهم می‌نمایند. این دسترسی به موتورهای كاوش موضوعی، منحصر به فرد است. علاوه بر موتورهای جستجوی موضوعی، صفحهء اصلی اینترنت اسلوث نیز فرصتی را برای جستجوی كامل وب همزمان از طریق ۶ موتور كاوش اصلی كاوش (آلتاویستا، اكسایت، اینفوسیك، لیكوس، وب كرولر و یاهو) فراهم می‌نماید. جستجوگران می‌توانند همچنین از موتورهای چند مروره، اخبار، بازرگانی و مالی، نرم‌افزار و یوزنت بازدید نمایند.آسك جیوز كه پرسش‌های زبان طبیعی را بكار می‌برد، با پرسش كلیدواژه‌ای در مورد «ENSO» دقت بالای متوسطی را می‌دهد، لكن با پرسشهای عبارتی و چند مفهومی دقت زیر متوسط دارد. پرسش‌های جستجو از طریق یك سیستم تخصصی كه نه تنها راهكارهای متناوب را برای جستجو اولیه پیشنهاد می‌كند، بلكه پرسش را به موتورهای اكسایت، هات بات، وب كرولر، آلتاویستا و اینفوسیك می‌فرستد، تقویت می‌گردد. پرسش نمونه در مورد «ENSO» به شش پرسش اضافی در شكل ۱، منتج شده است. راهكارهای جستجوی متناوب ارائه شده، كاملاً مرتبط با پرسش اولیه می‌باشد و برای كاربر فرصتی را جهت تمركز جستجو روی یك مفهوم ویژه از واژه مورد جستجو فراهم می‌نماید. آسك جیوز نیز ده منبع را از هر ۵ موتور كاوشی كه مورد پرسش قرار داده، ارائه می‌نماید. نتایج آسك جیوز از موتورهای مورد پرسش، با نتایج حاصل از موتورهای كاوش انفرادی هماهنگ می‌باشد (جدول ۱ را ملاحظه نمائید).
- سیستم تخصصی آسك جیوز كه پرسش‌های متناوب را پیشنهاد می‌نماید
- جدیدترین پوشش خبری روی El Nino چیست؟
- یك El Nino چیست؟
- اطلاعات در مورد El Nino ۹۸-۱۹۹۷ را كجا می‌توان پیدا كرد؟
- جدیدترین پوشش خبری در مورد طوفانهای كالیفرنیا چیست؟
- اطلاعات در مورد عناوین هواشناسی El Nino را كجا می‌توان پیدا نمود؟
های‌وی ۶۱ در ارتباط با جستجوهای عبارتی و چندمفهومی دارای دقت بالای متوسط است. های‌وی ۶۱ پرسش‌ها را به ۶ موتور جستجو شامل: یاهو، آلتاویستا، لیكوس، وب كرولر، اینفوسیك و اكسایت می‌فرستد. تعداد نتایج نمایش داده شده توسط جستجوگر تعیین می‌شود. وی تعداد موتورهای كاوشی را كه می‌تواند نتایج را پیدا كرده و نیز تعداد نتایج را به نمایش بگذارد، انتخاب می‌نماید. نتایج در مورد پرسش نمونه «تولید مس در برزیل» عبارت است از چند گزارش دولتی منحصر به فرد، همچنین بیشترین سایت وب‌ها را از طریق حوزهء برزیل پیدا نموده است.هنگام استفاده از موتورهای كلیدواژه‌ای و چندشاخه‌ای، توجه به اینكه چه بخش‌هایی از صفحات موتور در حال جستجو بوده و بسط یك عبارت جستجوی دقیق حائز اهمیت است. حجم اطلاعات موجود روی وب، مستلزم استفاده از گزینه‌های «پیشرفته» یا «پالایش» برای نتایج جستجوی دقیق‌تر می‌باشد. بعلاوه جستجوگران باید توصیه ارائه شده از طریق اینفوسیك را در نظر داشته باشند: «پرسش‌های بیشتر بهتر جواب می‌دهد». یك سری واژه‌های مشخص و واحد را برای بدست آوردن نتایج دقیق‌تر بكار ببرید. این توصیه برای یافتن اطلاعات علوم زمین و نیز هر جستجوی موضوعی دیگر بر روی وب، معتبر و با ارزش می‌باشد.
نتیجه‌گیری
نتایج حاصل از این مطالعه، منطبق با دیگر مطالعات دقت می‌باشد كه در آن هیچ یك از موتورهای كاوش بعنوان دقیق‌ترین موتور برای یافتن اطلاعات روی وب جهانی ظاهر نشده‌اند. حتی در ارتباط با پرسش‌های علوم زمین نیز، هیچ از یك ابزارها ممتاز و برجسته نبوده‌اند. در مطالعه ۱۹۹۶، تومایولووپاكر، آلتاویستا را بعنوان ابزاری كه بیشترین تعداد پیوندهای ارتباطی را بر مبنای اولین ده پیوند بازیابی شده ارائه نموده است، تعیین نموده‌اند. یك ارزیابی در ارتباط با میزان دقت پرسش‌های مرتبط با علوم زمین بدین صورت است: ۱) اینفوسیك نتایج دقیق‌تری بدست می‌دهد. ۲) لیكوس و آلتاویستا به نحو قابل ملاحظه‌ای، دقت كمتری دارند. لیتون و اسریواستاوا كه پیشرفته‌ترین روش‌شناسی را در مطالعه خود مورد استفاده قرار دادند، نیز به این نتیجه رسیدند كه به طور قاطع دقیق‌ترین موتور كاوش وجود ندارد.به هر حال «یك الگوی مشخص ارائه می‌گردد. آلتاویستا، اكسایت و اینفوسیك همواره خدماتی با بیشترین امتیاز متوسط ارزیابی شده می‌باشند» (۱۹۹۷-
http://www.winona.msus.edu/library/webind۲/wi۲pt۳.htm#RESULTS
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
بر مبنای دیگر مطالعات منتشره و نتایج حاصله در مطالعه مرتبط با علوم زمین، به جستجوگرانی كه سعی در یافتن «هر» نوع اطلاعات روی وب جهانی دارند، توصیه می‌شود از مجموعه‌ای از ابزارها متناسب با نوع پرسش ارائه شده و نوع اطلاعات موردنیاز استفاده نمایند.
همانگونه كه لیتون و اسریواستاوا اظهار داشته‌اند، «محاسبه دقت حقیقی (نسبت مدارك مرتبط ارائه شده به تعداد كل مدارك ارائه شده) بسیار دشوار است، چرا كه مستلزم آزمودن تمامی پیوندهای ارائه شده توسط یك سرویس كه می‌تواند تعداد آن به هزاران یا میلیونها برسد، می‌باشد».( ۱۹۹۷،http://www.winona.msus.edu/library/webind۲/wi۲pt۲.htm#EVALCRIT ,p۳ of ۸).
[Note: Link moved; URL changed ۸/۵/۹۸ by ald]
ضمن قبول نقاط ضعف این مطالعه، امید است كه نتایج حاصله بتواند بعنوان راهنمایی برای استفاده از موتورهای كاوش اینترنت جهت یافتن اطلاعات علوم زمین روی وب جهانی، مفید باشد.
توضیحات نهایی
۱) تمامی پرسشهای مربوط به علوم زمین، در این مطالعه عبارت از پرسشهای كلیدواژه‌ای یا عبارتی می‌باشند. پرسشها عبارتند از: بهمن‌ها، فعالیت آبهای سرد، زمین‌لرزه، گرم شدن جهانی، صاعقه، حوادث طبیعی، كاهش ازن، پلاستیك بازیافتی، صفحات تكتونیكی، گردبادها، آتشفشانها و طراحی آب پخشان.
۲) ارزیابی كلی در مطالعه تومایلو و پاركر بدین شرح است: آلتاویستا ۳/۹، اینفوسیك ۳/۸ و لیكوس ۱/۸. از تحلیل پرسشهای مرتبط با علوم زمین، این نتایج حاصل شده: اینفوسیك ۵/۹، لیكوس ۷/۸ و آلتاویستا ۳/۸.
پی‌نوشت‌ها:
۱. Internet Search Engine
۲. GO۲
۳. Infomine
۴. Argus Clearinghouse
۵. Excite
۶. Infoseek
۷. Northern Light
۸. Catalog or directory of search engines
۹. Yahoo!
۱۰. DejaNews
۱۱.Magellan
۱۲. Keyword or crawler search engines
۱۳. HotBot
۱۴.Multi-threaded search engines or meta-crawlers
۱۵. MetaCrawler
۱۶. Ask Jeeves
۱۷.Galaxy
۱۸.Internet Sleuth
۱۹.Lycos
۲۰.”Power” search
۲۱.”Advanced” search
۲۲. Web Matrix
۲۳. Watch Web site
۲۴. Look Smart
۲۵. “More like this”
۲۶. “Special Collection”
۲۷. Planet Search
۲۸. What-U-Seek
۲۹. “Refine”
۳۰. Mamma
۳۱. Profusion
۳۲. Inference Find
۳۳. Savvy Search
۳۴. MetaFind
۳۵. Volcano world
۳۶. Highway۶۱
منابع
Chu, Heting and Rosenthal, Marilyn. ۱۹۹۶. Search engines for the World Wide Web: A comparative study and evaluation methodology. [Online] http://www.asis.org/annual-۹۶/ElectronicPrceddings/chu.html [۲ April ۱۹۹۸].
Ding, Wei and Marchionini, Gary. ۱۹۹۶. A comparative study of web search service performance. In: American Society for Information Science ۱۹۹۶ Annual Conference Proceedings, ۳۳; Global complexity: Information, chaos and control; Baltimore, Maryland, Octorber ۲۱-۲۴, ۱۹۹۶. (Edited by Steve Hardin), pp. ۱۳۶-۱۴۲. Information Today, Medford, NJ.
Lebedev, Alexander, ۱۷ May ۱۹۹۷. Best search engines for finding scienctific information in the web. [Online]. http://ww.chem.msu.su/eng/comparison.html [۲۷ November ۱۹۹۷]. [Note: Broken link removed ۴/۲/۰۲ by ald]
Leighton, Vernon, H. and Srivastava, J. ۱۶ June ۱۹۹۷. Precision among World Wide Web search services (search engines): Alta Vista, Excite, Hotbot, Infoseed, Lycos. [Online]. http://www.winona.msus.edu/library/webind۲.htm [Note: link Moved; URL changed ۸/۵/۹۸ by ald]
Rettig, James. ۱۹۹۶. Beyond cool: Analog models for reviewing digital resources. [Online]. http://www.onlineinc.com/onlinemag/SeptOL/retting۹.html [۳۰ April ۱۹۹۸].
Singh, Amarendra and Lidsky, David. ۱۹۹۶. “All-out search”. PC Magazine ۱۵(۲۱): ۲۱۳-۲۴۹.
Tate, Marsha and Alexander, K. ۱۹۹۶. “Teaching critical evaluation skills for World Wide Web resources.” Computers in Libraries ۱۶(۱۰): ۴۹-۵۵.
Tomaiuolo, Nicholas G. and Packer, Joan G. ۱۹۹۶. Quantitative analysis of five WWW “search engines”. [Online]. [Note: Broken link to http://neal.ctstateu.edu:۲۰۰۱/htdocs/websearch.html removed ۱۲/۲۱/۹۸ by ald] [۱ December ۱۹۹۷].
Webster, Kathleen and Paul, Kathryn. ۱۹۹۶. Beyond surfing: Tools and techniques for searching the web. [Online]. http://magi.com/~mmelick/it۹۶jan.htm [۲۶ November ۱۹۹۷]. [Note: Unable to connect ۴/۲/۰۲]
Lisa Wishard. Percision Among Internet Search Engines: An Earth Sciences Case Study, Issues in Science and Technology Librarianship, Spring ۱۹۹۸

نوشته: لیسا ویشارد
ترجمه: مهری صدیقی
عضو هیئت علمی مركز اطلاعات و مدارك علمی ایران

هیچ نظری موجود نیست:

http://up.iranblog.com/images/0z5dgraxwa4j49a5ts77.gif http://up.iranblog.com/images/gv83ah5giec9g8jkopmc.gif