۹.۲۹.۱۳۸۹

ابزارهای جستجو در اینترنت

ابزارهای جستجو در اینترنت



ابزارهای جستجو در اینترنت



▪ سؤال:
موتورهای جستجو چیستند؟
ـ جواب:
موتورهای جستجو ابزارهایی برای پیدا كردن اطلاعات بر روی شبكه هستند. این ابزارها از زمانی كه شبكه اینترنت به عنوان شاهراه و منبع اطلاعاتی مطرح شد بوجود آمدند تا به كاربران در جستجوی اطلاعات مورد نظر در میان انبوه اطلاعات موجود در شبكه كمك ‌كنند. در حالی كه میزان اطلاعات در شبكه به شدت افزایش می‌یابد و هم اكنون از مرز ۸۰۰ میلیون صفحه گذشته است استفاده از موتورهای جستجو برای هر كاربر، امری اجتناب‌‌ناپذیر می‌نماید.
▪ سؤال:
موتورهای جستجو با دایركتوری‌ها(فهرست‌ها) چه تفاوتی دارند؟
ـ موتورهای جستجو( مانندAlta Vista)،‌از نظر توانایی در جمع‌آوری اطلاعات و مرتب‌سازی اتوماتیك آنها در خصوص موضوع مورد جستجو با فهرست‌ها (مانند(Yahoo! تفاوت دارند. دایركتوری‌ها لیست‌هایی از پایگاه‌های اینترنتی هستند كه بوسیله افراد تنظیم شده‌اند. نتیجه جستجوی شما بر روی یك موضوع قسمتی از این لیست‌های تنظیم شده توسط انسان است كه در ارتباط با موضوع مورد نظر شما است. با وجود این كه مجموعه‌جواب یا نتیجه جستجوی به دست آمده در فهرست‌ها(Directories) بسیار كوچكتر ازنتیجه جستجو در موتورهای جستجو است اما نتیجه به دست آمده در دایركتوری‌ها بیشتر مرتبط به موضوع می‌باشد و به همین دلیل از موتورهای جستجو بیشتر در پیدا كردن مطالب نادر و تخصصی و یا در تحقیقات جامع و كلی، استفاده می‌شود.
▪ سؤال:
موتورهای جستجو چگونه كار می‌كنند؟
ـ موتورهای جستجو از ۳ جزء اصلی تشكیل شده‌اند.
۱) برنامه‌عنكبوتی
robot ,Crawler, bot) (۲- بانك اطلاعاتی
۳) صفحه اصلی و رابط‌های جستجو.
موتورهای جستجو، بوسیله فرستادن برنامه رهیاب (برنامه‌های عنكبوتی) بر روی صفحات Web به بررسی متون صفحات زیر نویس عكس‌ها و كدها پرداخته و پس از جمع‌آوری اطلاعات، برنامه عنكبوتی صفحاتی را كه در آنها مطالبی دربارهٔ ‌موضوع مورد جستجو وجود دارد مشخص كرده و در بانك اطلاعاتی خود قرار می‌دهد. موتور، اطلاعات موجود را بر اساس موضوع به ترتیب الفبا یا هر طبقه‌بندی دیگری كه مورد نظر طراح و برنامه‌نویس موتور جستجو است،مرتب می‌سازد. وقتی كاربر لغت مورد نظر را مشخص كرده و كلید جستجو (Search) را فشار می‌دهد موتور جستجو یك بانك اطلاعاتی كه حاوی لیست‌آدرس‌ها و پیوندهای (Link) پایگاه‌هایی كه مطالبی در ارتباط با كلمه مورد نظر یا كلمات وابسته به آن را دارا هستند، نمایش می‌دهد. موتورهای جستجوی مختلف روش خاص خود را برای نشان دادن لیست‌های مربوط به موضوع جستجو دارند. بعضی موتورها ترتیب لیست‌های خود را بر اساس ارتباط با موضوع و همچنین محبوبیت پایگاه‌های مختلف مرتب می‌كنند. بعضی دیگر بر اساس تعداد دفعاتی كه لغت مورد جستجو در صفحه آن پایگاه به كار رفته است. ولی اكثر موتورهای جستجو تركیبی از این فاكتورها را در نظر گرفته و لیست خود را مرتب می‌كنند.
▪ سؤال:
موتورهای جستجو چه مقداری از كل صفحات Web را برای پیدا كردن پاسخ، جستجو می‌كنند؟
یك محدویت مهم در موتورهای جستجو یا دایركتوری‌ها این است كه تنها درصد كوچكی از Web توسط آنها برای پیدا كردن صفحات مربوطه به كلمه مورد جستجو بررسی می‌گردد. اگر چه برنامه‌های رهیاب (bot) اطلاعات بسیار بیشتری نسبت به دایركتوری‌ها درباره ‌مورد جستجو جمع‌آوری می‌كنند با این وجود باز هم مقدار بسیار كوچكی از كل Web تحت جستجوی این برنامه‌ها قرار می‌گیرد. تحقیقات جدید دربارهٔ موتورهای جستجو كه جدیدا" توسط مؤسسه تحقیقاتی NEC انجام گرفته است بیان می‌كند كه حتی بزرگترین موتورهای جستجو كمتر از ۲۰% كل وب را مرور می‌كنند. برنامه‌نویسان و طراحانAll the Web, Excite و دیگر موتورهای جستجو شدیدا" تلاش می‌كنند تا درصد بررسی صفحات وب و همچنین میزان وابستگی موضوع صفحات با مورد جستجو را بالا ببرند.
▪ سؤال:
چرا نتایج به دست آمده توسط موتورهای جستجوی گوناگون متفاوت است؟
دلیل تفاوت در نتایج، استفاده كردن موتورهای جستجو از برنامه‌های رهیابِ (bot) متفاوت، می‌باشد. هر برنامه Bot در نوع اطلاعاتی كه از صفحات وب جمع‌آوری می‌كند و یا به عبارتی «خزیدن» آن بر روی صفحات وب روش خاصی دارد. بعضی از برنامه‌های رهیاب قبل از این كه به آدرس بعدی بروند تمام اطلاعات موجود در صفحه جاری را بررسی می‌كنند. بعضی تنها پیوندهای (Link) موجود در روی صفحه را بررسی می‌كنند. برخی برای بررسی اطلاعات وارد شده جدید، هر روز و یا هر هفته و هر ماه صفحات Web را چك كنند. اطلاعاتی كه برنامه‌رهیاب منعكس می‌كند، از نظر لغات كلیدی(keyword) ، اطلاعات مربوط به آدرس پایگاه وتازگی صفحات مربوطه متغیر می‌باشد.
▪ سؤال:
چه راه‌كارهایی برای كوتاه كردن مسیر جستجو وجود دارد؟
حتی بهترین لغات كلیدی برای جستجوی یك مطلب در محیط اینترنت باعث به دست آمدن تعداد بسیار زیادی جواب شده كه امكان بررسی همهٔ آنها برای كاربر تقریبا" ‌غیر ممكن است. اما چند روش برای كوتاه كردن مسیر جستجو یعنی پیدا كردن نزدیكترین جواب‌ها برای موضوع مورد جستجو وجود دارد. استفاده از عملگرهای منطقی، یك راه حل بسیار معمول و قابل استفاده برای این مشكل است. یعنی با استفاده از لغات NOT,OR,AND در میان لغات كلیدی مطمئن شوید كه نتایج به دست آمده حاوی همه، حداقل یكی یا هیچكدام از لغات وارد شده به عنوان موضوع جستجو است.
برای مثال یك جستجو برای اتومبیل‌های روی اینترنت دارای جواب‌های بسیار زیادی می‌باشد اما اگر ما بخواهیم به دنبال پایگاه‌هایی كه دربارهٔ‌اتومبیل و منحصرا" BMW هستند بگردیم می‌توانیم از لغت كلیدی Car AND BMW استفاده كنیم یا اگر پایگاه‌هایی را كه دربارهٔ اتومبیل‌هایی بجز BMW هستند را بخواهیم، لغت كلیدی موردنظر Car NOT BMW خواهد بود. علامات و لغات دیگری نیز برای گوناگون كردن مسیر وجود داشته كه با توجه به نوع برنامه جستجو‌گر متغیر است. برای اطلاع از این علامات در محیط جستجوگر می‌توانید به گزینه Help در خودِ محیط جستجوگر مراجعه كنید .

هیچ نظری موجود نیست: