۱۰.۰۵.۱۳۸۹

تکنیک های جست وجو در اینترنت

اینترنت را به زباله دانی بزرگ تشبیه کردهاند که در آن قطعات الماس یافت می شود منتهی اگر کسی روش زباله گردی در فضای اینترنت را نداند، احتمالا روزها و ماه ها در میان انبوه اطلاعات به درد نخور سرگردان خواهد شد و سرانجام بدون هیچ نتیجه مثبتی آن جا را ترک خواهد کرد.معمولا سخنی که از این دسته افراد شنیده می شود این است: اطلاعات مناسبی وجود نداشت. اما وبگردهای حرفه ای و کسانی که با روش ها و فوت و فن های جست وجو در اینترنت آشنایی دارند، هیچ وقت دست خالی از این فضای مجازی برنمی گردند آن ها همواره قطعات الماس را در میان انبوه زباله های اطلاعاتی تشخیص می دهند.
مهم ترین روش های جست وجو در اینترنت را تشریح کرده ایم:ابزارهای کاوش و جست وجو در وب را می توان به چند گروه تقسیم کرد که عبارت است از:
۱) فهرست راهنما یا دایرکتوری Directory
۲) شاهراه اطلاعاتی Gateway
۳) موتور جست وجو engine Search
۴) فراموتور جست وجو
۵) درگاه یا مدخل Metasearch
۶) وب نامرئی Wed Invisidle
● فهرست راهنما یا دایرکتوری
فهرست راهنما یا دایرکتوری که به آن فهرست موضوعی نیز گفته می شود، سایتی است که صفحات و سایت های مربوط به موضوعات گوناگون علمی و غیرعلمی را شناسایی و به صورت دستی دستهبندی می کند، از این رو اطلاعات طبقه بندی شده در فهرست راهنما از کیفیت خوبی برخوردار است و نتایج نامربوط در بین آن ها بسیار اندک می باشد. به جرات می توان گفت بزرگ ترین و معتبرترین فهرست راهنمای اینترنت در حال حاضر project birectory open می باشد که نشانی آنorg .zbmo.www است. جالب است بدانید بسیاری از موتورهای جست وجو مانند گوگل و Altavista در دایرکتوری خود از همین فهرست راهنما استفاده می کنند. از جمله فهرست های راهنمای دیگر می توان به com.adout و com.Yahoo اشاره کرد.
● شاهراه اطلاعاتی
شاهراه اطلاعاتی در واقع نوع تخصصی دایرکتوری است. یعنی اطلاعات طبقه بندی شده در شاهراه محدود به یک موضوع می باشد. مانند شاهراه اطلاعاتی جامعه شناسی. اما دایرکتوری یا فهرست راهنما در همه زمینه ها به جمع آوری و طبقه بندی اطلاعات می پردازد. معمولا شاهراه اطلاعاتی را استادان فن ارائه می کنند. از این نظر هرچند که ممکن است نشانی های موجود در آن اندک باشد، اما از اعتبار علمی بسیار بالایی برخوردار است. سایت com.acabemicinfo فهرستی از شاهراه های اطلاعاتی مربوط به رشته های مختلف علمی را دسته بندی کرده است.
● موتور جست وجو
"موتور جست وجو برنامه ای نرم افزاری است که با استفاده از کلیدواژه به جست وجوی منابع اطلاعاتی اینترنت می پردازد و فهرستی از مدارک واجد آن کلیدواژه را ارائه می دهد." موتورهای جست وجو نرم افزارهایی است که توسط رایانه ساخته شده و اطلاعات آن طبقه بندی موضوعی نشده است تمامی صفحات پشتیبانی شده براساس الگوریتم مشخص مرتب می شود و دارای اطلاعات وسیع عظیم و ارزیابی نشده می باشد.
محتویات یک موتور جست وجو در واقع همان بانک اطلاعات آن است. اما موتورهای جست وجو از شیوه های مختلفی برای جمع آوری و تشکیل بانک اطلاعاتی خویش بهره می برند و به همین دلیل نتایج جست وجوی یک واژه یا عبارت در موتورهای مختلف یکسان نیست.هر موتور جست وجو برای تعیین میزان تناسب و ارتباط واژگان جست وجو با صفحات واجد آن ها، از یک یا چند ملاک معتبر استفاده می کند. اما از بین معیارهای متعدد و رایج در میان موتورهای جست وجو ۲ معیار از اهمیت بیشتری برخوردار است.
▪ محل درج کلیدواژه:
چنان چه پیشتر نیز گفتم، یک صفحه وب از اجزا و عناصر مختلفی تشکیل شده است که اهمیت همه آن ها یکسان نیست. به طور کلی واژگان موجود در عنوان و خطوط اول صفحه یا سرتیتر در مقایسه با متن از اهمیت بیشتری برخوردار است.
▪ تعداد تکرار:
در اغلب موتورهای جست وجو در صفحاتی که واژگان جست وجو تکرار بیشتری داشته باشد، صفحات متناسبتر و مرتبط تر به حساب می آید.
▪ نوار ابزار جست وجو:
به جای مراجعه مستقیم به سایت اصلی جست وجوگر، می توانید نوار ابزار آن را در زیر نوار اصلی IE بگذارید. گوگل چنین ابزاری را به صورت یک on-abb دراختیار شما قرار می دهد.(به نشانی com.google.tooldar سربزنید) این ابزار امکانات دیگری مانند متوقف کننده popupها را نیز دارد.
▪ حذف از جست وجوها:
همه موتورهای جست وجو به شما این امکان را می دهد که نتایج جست وجو را به نحو مناسب محدود کنید. به عنوان مثال، وقتی در گوگل لغت خاصی را جست وجو می کنید، هزاران نتیجه به شما نشان داده می شود.راه حل محدود کردن نتایج جست وجو این است که از علامت ویژه در کنار عباراتی که مورد نظر شما نیست، استفاده کنید. به عنوان مثال بنویسید bogs-cats یعنی نتایج مرتبط با کلمه cats ▪ بدون bogsدر نظر گرفتن کلمات:
برخی جست وجوگرها برای محدود کردن نتایج جست وجو، کلمات اضافه و لغات کوچک را هنگام جست وجو مورد توجه قرار نمی دهند. به طور مثال از to، the،is،from صرف نظر می کنند. چنانچه فکر می کنید این کلمات در جست وجوی شما موثر است و منجر به کسب نتیجه بهتری از جست وجو می شود، می توانید آن ها را با گذاشتن یک علامت«» مشخص کنید.
▪ استفاده از گیومه:
وقتی که شما در جست وجویتان به دنبال یافتن یک عبارت مشخص هستید، ساده تر آن است که عبارت را داخل گیومه قرار دهید. به طور مثال عبارت مورد نظرتان را به صورت «.............»وارد کنید. نتیجه جست وجو فقط شامل عبارت داخل گیومه خواهد شد.
▪ به دنبال یک آدرس خاص:
چنان چه فقط بخشی از آدرس اینترنتی صفحه مورد نظرتان را می دانید، برای انجام جست وجوی سریع تر، می توانید کلمه ای را که مطمئن هستید در آدرس سایت وجود دارد، وارد کنید، به طور مثال عبارت worb:url را در جستوجوگر وارد کنید. نتایج جست وجو تنها شامل آدرس های اینترنتی خواهد شد که این کلمه خاص را در خود دارد.
▪ پیدا کردن سایت خودتان:
اگر یک سایت دارید، آیامی دانید که چه طور باید سایت هایی را که به سایت شما لینک داده اند، پیدا کنید در موتور جست وجو عبارتcom.yourwedabbress.www را وارد کنید و آدرس تمام سایت هایی که لینکی به سایت شما داده اند، ملاحظه کنید.
▪ پیدا کردن فایل:
در بسیاری از مواقع شما به فایلی احتیاج دارید که مشکلی از سیستم تان را برطرف می کند. برای یافتن آن نیازی نیست که هزاران صفحه وب را زیرورو کنید. با تایپ عبارت filename the:file در کادر جست وجو، یک فهرست از همه وب سایت هایی که نسخه ای از فایل مذکور را دارد، نمایش داده می شود. کاربرد این روش برای پیدا کردن فایل های تصویری نیز بسیار مفید است.
▪ ترفند پنهانی گوگل:
نوعی جست وجوی خاص نیز در گوگل وجود دارد، اگرچه همه از جزئیات آن خبر ندارند. گوگل به شما کمک می کند که در یک صفحه وب به دنبال کلمه بگردید که هم در URL و هم در آن صفحه وجود دارد. برای این منظور تایپ کنید Keyworb:url
▪ پیدا کردن تصاویر:
وقتی شما از موتور جست وجویی استفاده می کنید که برای جست وجوی تصاویر، پیش نمایشی از آن ها را نشان نمی دهد، ممکن است آدرس سایت هایی را برایتان بیابد که شامل عکس مورد نظرتان نباشد. برای نتیجه گیری سریع تر می توانید به نشانی com.google.image مراجعه کنید. در این جا کافی است نام شخص یا موضوع مورد نظر را وارد کنید. گوگل تصاویر بندانگشتی(thumdnail) در این رابطه را نمایش خواهد داد.
▪ پاسخی به سوالات:
به سایت com.ask.www سربزنید و پاسخ همه سوالات خود را در آن پیدا کنید. همچنین می توانید در این سایت به بیشترین مواردی که دیگران جست وجو کرده اند نیز نگاهی بیندازید.
▪ راهنمای گوگل:
در صفحه اصلی گوگل، گزینه جست وجوی پیشرفته(search Abvanceb) را کلیک کنید. در این جا می توانید نتایج جست وجویتان را محدود کنید. در بعضی مواقع دیدن صفحات وبی که مربوط به ۲یا۳سال قبل است، دیگر فایده ای ندارد. در این جا می توانید برای پیدا کردن صفحات جدیدتر گزینه ۳ماه، ۶ماه یا یک سال را انتخاب کنید.
▪ فراموتورهای جست وجو:
جست وجوی ترکیبی یا فراموتورها یا Metasearch برای حل مشکل جست وجوگرهای معمولی به کار گرفته می شود.برای مثال وب سایت داگ پایل(Dogpile) یا موتور آل دوب(allthewed) که در واقع نوعی جست وجوگر ترکیبی است، به شما امکان می دهد به آسانی در تمام جست وجوگرهای شناخته شده اینترنت، متن، عکس، صدا، فیلم، خبر یا کالای مورد نظر خود را بیابید. یافته های داگ پایل را می توان براساس نام جستوجوگری که آن اطلاعات را پیدا کرده است و یا براساس نزدیکی یافته ها به عبارت مورد نظر شما تفکیک کرد. همین طور در سمت چپ صفحه فهرستی از کلید واژه های مرتبط با چیزی که شما دنبال آن می گردید، ارائه می شود که خیلی وقت ها به کمک می آید. برای کسانی که در پی اطلاعات مربوط به شخص یا شرکت یا فروشگاهی به خصوص می گردند، جست وجو در کتاب های زرد و سفید هم امکان پذیر است.داگ پایل ابزار جست وجوی کوچکی هم دارد که اگر مایل باشید، می توانید به بالای صفحه مرورگر وبتان اضافه کنید تا جست وجو در آن آسان تر شود.
● موتورهای جست وجوی فارسی
انتخاب موتور جست وجو عامل مهمی در فرآیند جست وجو است. در حال حاضر ابزارهای کاوش مختلفی در ایران ظهور پیدا کرده است. لیکن ابزارهای جست وجویی که امکان جست وجوی اطلاعات به زبان فارسی را ارائه می کند، محدود است. از طرف دیگر،امکانات و قابلیت آن ها برای بازیابی موثر و مناسب اطلاعات متغیر است. برخی از ابزارهای کاوش با امکانات جست وجوی فارسی عبارت است از: ایران هو Iranhoo، پارسیکParseek، گوگل گوگلدر بین این ابزارهای کاوش، تنها موتور کاوش گوگل دارای برنامه روبات به منظور شناسایی و نمایه سازی صفحات یا سایت های وب به زبان فارسی و نمایه سازی خودکار می باشد و قادر است صفحات فارسی را در قالب یونی کد شناسایی و در پایگاه خود نمایه کند. سایت پارسیک نیز از پایگاه گوگل برای جست وجو و بازیابی اطلاعات استفاده می کند.
● وب نامرئی
اصطلاح "وب نامرئی" برای اطلاعاتی به کار می رود که روی شبکه جهانی وب است، اما با استفاده از موتورهای جست وجوی همه منظوره یافت نمی شود. وب نامرئی به ۲دلیل کمی و کیفی اهمیت دارد. کمی از این نظر که موتورهای جست وجو فقط قادر است حدود ۱۶درصد از اطلاعات موجود در اینترنت را بازیابی کند واندازه وب نامرئی تقریبا ۵۰۰برابر وب مرئی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید است و در بسیاری از موارد پاسخگوی نیاز کاربران می باشد. آشنایی با ابزارهایی که برای شناسایی منابع وب نامرئی به وجود آمده است، باعث دسترسی به این بخش عظیم از اطلاعات مفید وارزشمند می شود، مثل سایت Invisidlewed که فهرستی از منابع نامرئی و سایت Completeplaset که فهرستی از تقریبا ۴۰هزار پایگاه اطلاعاتی وب نامرئی را ارائه می دهد.بهتر است بدانید بهترین موتورهای جست وجو فقط قادر است حدود ۱۴درصد از اطلاعاتی را که روی شبکه جهانی وب قرار دارد، در دسترس قرار دهد. بنابراین ۸۶درصد اطلاعات خارج از دسترس موتورهای جست وجو است، اندازه وب پنهان۵۵۰بیلیون بزرگ تر از وب آشکار است.

هیچ نظری موجود نیست:

http://up.iranblog.com/images/0z5dgraxwa4j49a5ts77.gif http://up.iranblog.com/images/gv83ah5giec9g8jkopmc.gif