Bagaimana Search Engine Bekerja
Search Engine sering menggunakan hal-hal umum untuk memaparkan kedua jenis search engine yang berbeda (crawler-based dan human-powered directories).
Crawler-Based Search Engines
Seperti HotBot, membuat daftar secara otomatis. Mereka 'crawl' atau menjerat situs, sehingga pencarian berhasil. Jika terjadi perubahan pada situs, search engine crawler-based dapat menemukan perubahannya dan akan berakibat pada daftar situs. Judul halaman, body copy dan elemen yang digunakan lainnya.
Human-Powered Directories
Sebuah human-powered directory, seperti Yahoo, bergantung pada manusia untuk daftar list situs. Jika Anda memasukkan kata kunci yang pendek untuk masuk ke directory, pencarian akan mencocokkan dengan deskripsi (kata kunci) yang telah dimasukkan. Perubahan halaman situs tidak berpengaruh pada daftar. Hal-hal yang berguna untuk mengembangkan daftar pada search engine tidak berakibat pada pengembangan sebuah daftar pada directory.
"Hybrid Search Engines" Atau Mixed Results
Belakangan ini, banyak search engine yang menggunakan kedua tipe, crawler-based danhuman-powered dinamakan hybrid search engine.
Bagian dari Crawler-Based Search Engine
Crawler-based search engine memiliki tiga elemen utama. Pertama adalah spider (menjerat) yang juga dinamakan crawler. Spider mengunjungi situs, membacanya, dan kemudian menyambungkan link menuju halaman lain melalui site. Hal ini berarti ketika seseorang mengacu sebuah situs, berarti akan menjadi spider atau crawler. Spider akan mengembalikan situs dalam bentuk umum, dalam waktu satu atau dua bulan, untuk melihat perubahan.
Semua yang ditemukan oleh spider akan menuju bagian kedua, yaitu index. Index, terkadang disebut katalog, seperti buku raksasa yang terdiri dari salinan beberapa situs yang bisa ditemukan spider. Jika halaman situs berubah kemudian buku ini akan mengikuti perubahan.
Terkadang memerlukan waktu untuk melihat halaman yang sudah berubah agar spider menemukan penambahan pada index. Dengan demikian, halaman situs bila sudah di 'spider' tapi belum di 'index', halaman barunya tidak akan terlihat hingga semua di'index'kan -ditambahkan pada index.
Software search engine merupakan bagian ketiga. Program ini menyaring berjuta-juta halaman situs yang tersimpan di index untuk dicari kesamaan dari pencarian dan mengurutkannya dalam urutan yang kira-kira relevan dengan kata kunci diskripsi.
Semua yang ditemukan oleh spider akan menuju bagian kedua, yaitu index. Index, terkadang disebut katalog, seperti buku raksasa yang terdiri dari salinan beberapa situs yang bisa ditemukan spider. Jika halaman situs berubah kemudian buku ini akan mengikuti perubahan.
Terkadang memerlukan waktu untuk melihat halaman yang sudah berubah agar spider menemukan penambahan pada index. Dengan demikian, halaman situs bila sudah di 'spider' tapi belum di 'index', halaman barunya tidak akan terlihat hingga semua di'index'kan -ditambahkan pada index.
Software search engine merupakan bagian ketiga. Program ini menyaring berjuta-juta halaman situs yang tersimpan di index untuk dicari kesamaan dari pencarian dan mengurutkannya dalam urutan yang kira-kira relevan dengan kata kunci diskripsi.
Search Engines Utama: Sama, tapi Berbeda
Semua crawler-based search memiliki bagian dasar yang sama dan sudah dipaparkan di atas, tapi terdapat perbedaan dalam penggunaannya. Hal inilah yang menyebabkan tiap search engine menghasilkan result yang berbeda.
No comments:
Post a Comment