انجمن انفورماتیک ایران انجمن انفورماتیک ایران انجمن انفورماتیک ایران
گزارش کامپیوتر شماره 234, ویژه مرداد و شهریور ماه 96 منتشر شد. شنبه  ٢٧/٠٨/١٣٩٦ ساعت ١٥:١٦
 

وب نامرئی

 


1- وب نامرئی چیست؟
عبارت «وب نامرئی» به مخزن اطلاعاتی عظیمی گفته می‌شود که جویشگرها 1 و فهرست‌های راهنما 2، دستیابی مستقیمی به آن‌ها ندارند. به عنوان مثال، می‌توان به دادگان‌ها 3 اشاره کرد. اطلاعاتی که در دادگان‌ها وجود دارند برخلاف صفحاتی که در وب مرئی قرار دارند (یعنی، صفحاتی که از طریق جویشگرها و فهرست‌های راهنما قابل دستیابی می‌باشند) معمولاً برای نرم‌افزارهایی که نمایه‌های 4 جویشگرها را می‌سازند، قابل دستیابی نمی‌باشند.

2- حجم وب نامرئی چقدر است؟
اگر بخواهیم در یک کلمه پاسخ این سؤال را بدهیم باید بگوییم «خیلی زیاد». تخمین زده می‌شود که وب نامرئی در حدود 500 برابر وب مرئی یا وب قابل جستجوست. اگر در نظر بگیرید که جویشگر گوگل به تنهایی در حدود 8 میلیارد صفحه را پوشش می‌دهد، در این‌صورت حتی تصوّر حجم وب نامرئی هم برایتان دشوار می‌شود.

3- چرا به آن «وب نامرئی» گفته می‌شود؟
عنکبوت‌ها 5 این طرف و آن طرف وب سرک می‌کشند و نشانی صفحاتی که می‌یابند را نمایه‌بندی می‌کنند. هنگامی‌که این نرم‌افزارها به صفحه‌ای در وب نامرئی برمی‌خورند، دقیقاً نمی‌دانند که با آن چکار کنند. عنکبوت‌ها می‌توانند نشانی را ثبت کنند امّا نمی‌توانند به شما بگویند که محتویات آن صفحه شامل چه اطلاعاتی می‌شود. چرا؟
البته عوامل زیادی وجود دارد امّا عمدتاً بدین‌خاطر است که آن‌ها یا درگیر مشکلات فنی می‌شوند و یا مالکان وبگاه‌ها عمداً صفحاتشان را از دسترس عنکبوت‌های جویشگرها خارج می‌سازند. برای نمونه، وبگاه کتابخانه‌های دانشگاه‌هاکه نیازمند گذرواژه 6 برای دستیابی به اطلاعات است در نتایج جستجوی جویشگرها قرار نمی‌گیرد و نیز صفحات اسکریپتی به آسانی توسط عنکبوت‌های جویشگرها قابل خواندن نمی‌باشند.

4- چرا وب نامرئی اهمیت دارد؟
شاید شما فکر کنید که بهتر است به همان اطلاعاتی که گوگل یا یاهو می‌توانند پیدا کنند بچسبید و قید بقیه چیزها را بزنید. شاید، امّا همیشه یافتن اطلاعاتی که به دنبالش هستید از طریق جویشگرها آسان نیست. به‌ویژه اگر به دنبال چیزی مبهم یا کمی پیچیده باشید. به وب به‌صورت یک کتابخانه عظیم فکر کنید. شما انتظار ندارید که از در جلوئی وارد شوید و بلافاصله بتوانید اطلاعاتی در مورد سابقه گیره کاغذی که روی میز افتاده است به دست آورید. درست است؟ باید برای به دست آوردن چنین اطلاعاتی کاوش کنید. اینجا جایی است که جویشگرها لزوماً نمی‌توانند کمکی به شما بکنند امّا وب نامرئی می‌تواند.
به‌علاوه، این واقعیت که «جویشگرها تنها بخش بسیار کوچکی از وب را مورد جستجو قرار می‌دهند»، وب نامرئی را به عنوان یک منبع خیلی وسوسه‌انگیز و جذاب مطرح می‌سازد. اطلاعاتی که در آنجا وجود دارد بسیار بیشتراز آن است که ما تصوّرش را می‌کنیم.

5- چگونه می‌شود از اطلاعات وب نامرئی استفاده کرد؟
خوشبختانه عده بسیاری، پیش از من و شما، همین سؤال را از خود پرسیده‌اند و وبگاه‌های جالبی را فراهم آورده‌اند که به مثابه نقطه پرتاب به وب نامرئی عمل می‌کنند. برخی از این دروازه‌ها 7 به قرار زیرند:

  • یکی از بهترین دروازه‌ها، وبگاه Direct Search است که توسط گری‌پرایس، کتابدار و مشاور اطلاعاتی، فراهم آمده است. این وبگاه، رده‌های قابل جستجو را به زیبایی سازماندهی کرده است و به‌طور مرتب نیز به‌روز رسانی می‌شود.
  • یک منبع خوب دیگر Invisible Web Directory به نشانی www.invisible-web.net است که این هم توسط گری‌پرایس و یک فرد خبره دیگر به نام کریس شرمن، فراهم آمده است. این وبگاه، فهرست راهنمایی از دادگان‌های قابل جستجو که براساس موضوع سازماندهی شده‌اند را در اختیار می‌گذارد.
  • Resource Discovery Network به نشانی www.rdn.ac.uk دارای منابعی عمدتاً از انگلستان است و دارای سازماندهی و قابلیت جستجوی بسیار خوبی می‌باشد.
  • Infomine به نشانی http://infomine.ucr.edu توسط دانشگاه کالیفرنیا در ریورساید طراحی شده و بالغ‌بر صد هزار پیوند 8به هزاران دادگان را در اختیار می‌گذارد.
  • استفاده از Virtual Library به نشانی http://vlib.org ساده و آسان است. پیوندهای موضوعی فراوانی با شرح و توضیح دارد که باعث کاستن از زمان جستجو می‌گردد.

6- چه منابع دیگری برای وب نامرئی وجود دارند؟
وبگاه‌های بسیار زیادی برای کاوش در وب نامرئی به وجود آمده‌اند. به عنوان مثال، فراجویشگر 9Profusion دانشگاه کانزاس، به نشانی www.profusion.com ، جستجوهای عمیق موضوعی را امکانپذیر می‌سازد. CompletePlanet.com به نشانی http://aip.completeplanet.com فهرست راهنمای بالغ‌بر 700 هزار دادگان قابل جستجو و جویشگرهای خاص را در اختیار می‌گذارد.
اغلب اطلاعات موجود در وب نامرئی توسط مراکز دانشگاهی نگهداری می‌شوند و کیفیت بسیار بالاتری نسبت‌به نتایج جویشگرها دارند. چند «دروازه دانشگاهی» نیز وجود دارد که می‌تواند به شما در یافتن این اطلاعات کمک کند. SJSU Academy Gateway به نشانی www.sjlibrary.org منبع فوق‌العاده‌ای است که شما را قادر می‌سازد تا نه تنها به کتابخانه‌های عمومی سن‌حوزه، بلکه به کتابخانه دانشگاه ایالتی سن‌حوزه نیز دستیابی داشته باشید. افزون بر این، چند دادگان دولتی (آمریکا) مانند (http://askeric.org) Ask Eric نیز وجود دارند که دستیابی به بیش‌از 3000 منبع آموزشی (به‌صورت طبقه‌بندی شده) را فراهم می‌سازند.

7- نکته پایانی در مورد وب نامرئی
آنچه گفته شد تنها نوک کوه یخی را نشان می‌دهد. پیوندهایی که در این مقاله به آن‌ها اشاره شد تنها نقطه شروعی است برای دستیابی به منابع موجود در وب نامرئی. هرچه زمان می‌گذرد، عمق وب نیز بیشتر و بیشتر می‌شود و بنابراین بهتر است از همین حالا یاد بگیریم که چگونه از آن استفاده کنیم.

1. search engines
2.directories
3.databases
4. indexes
5.spiders
6.password
7. gateways
8.link
9.metasearch engine

ترجمه ابراهیم نقیب‌زاده مشایخ

منبع

٭ “The Invisible Web”, Wendy Boswell,
http://websearch.about.com