Web Search Engine atau biasa di sebut mesin pencari web yang dirancang untuk mencari informasi di World Wide Web. Hasil pencarian biasanya disajikan dalam daftar hasil dan umumnya disebut hits. Informasi dapat terdiri dari halaman web, gambar, informasi dan jenis file lainnya. Beberapa mesin pencari juga tambang data yang tersedia dalam database atau direktori terbuka. Tidak seperti direktori Web yang diselenggarakan oleh editor seseorang.
Mesin pencari web bekerja dengan menyimpan informasi tentang banyak halaman web, yang mana mereka mengambil dari html itu sendiri. Halaman ini diambil oleh crawler Web (kadang-kadang juga dikenal sebagai laba-laba) – Web browser otomatis yang mengikuti setiap link di situs. Pengecualian dapat dilakukan dengan menggunakan robots.txt.
Kinerja Masin Pencari
Sebuah mesin pencari bekerja, dalam urutan berikut
- Web crawling
- Indexing
- Searching
Isi setiap halaman lalu dianalisis untuk menentukan bagaimana harus diindeks (misalnya, kata-kata diambil dari judul, judul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam query nanti. query bisa menjadi kata tunggal. Tujuan dari indeks adalah untuk memungkinkan informasi dapat ditemukan secepat mungkin. Beberapa mesin pencari, seperti Google, menyimpan semua atau sebagian dari halaman sumber (disebut sebagai cache) maupun informasi tentang halaman web, sedangkan yang lain, seperti AltaVista, menyimpan setiap kata dari setiap halaman yang mereka temukan. Cache halaman ini selalu memegang pencarian teks yang sebenarnya karena merupakan salah satu yang sebenarnya diindeks, sehingga dapat menjadi sangat berguna ketika isi dari halaman saat ini telah diperbarui dan istilah pencarian tidak lagi di dalamnya. Masalah ini mungkin dianggap sebagai bentuk ringan linkrot, dan penanganan Google untuk meningkatkan kegunaan dengan memenuhi harapan pengguna bahwa istilah pencarian akan berada pada halaman web dikembalikan. Ini memenuhi prinsip keheranan tidaknya sejak pengguna biasanya mengharapkan istilah pencarian berada di halaman kembali. relevansi pencarian Peningkatan membuat halaman-halaman cache yang sangat berguna, bahkan di luar fakta bahwa mereka mungkin berisi data yang mungkin tidak lagi tersedia di tempat lain.
Ketika pengguna memasukkan kueri ke dalam mesin pencari (biasanya dengan menggunakan kata-kata kunci), mesin memeriksa indeks dan memberikan daftar halaman web yang paling cocok menurut kriteria, biasanya dengan ringkasan pendek berisi judul dokumen dan kadang-kadang bagian teks. Indeks dibangun dari informasi yang tersimpan dengan data dan metode yang informasi diindeks. Sayangnya, tidak ada satu search engine yang memungkinkan untuk mencari dokumen berdasarkan tanggal. Kebanyakan mesin pencari mendukung penggunaan operator boolean AND, OR dan NOT untuk lebih menentukan permintaan pencarian. operator Boolean adalah untuk pencarian literal yang memungkinkan pengguna untuk memperbaiki dan memperluas syarat-syarat pencarian. Mesin mencari kata atau frasa persis seperti masuk. Beberapa mesin pencari menyediakan fitur pencarian kedekatan disebut canggih yang memungkinkan pengguna untuk menentukan jarak antara kata kunci.
Ada juga konsep berbasis mencari dimana penelitian melibatkan menggunakan analisis statistik pada halaman yang berisi kata atau frasa yang Anda cari. Selain itu, pertanyaan bahasa alam memungkinkan pengguna untuk mengetik pertanyaan dalam satu bentuk yang sama akan meminta kepada manusia. Sebuah situs seperti ini akan ask.com.
Kegunaan dari mesin pencari bergantung pada relevansi hasil set itu memberi kembali. Meskipun mungkin ada jutaan halaman web yang mencakup kata tertentu atau frase, sebagian halaman mungkin lebih relevan, populer, atau otoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan metode untuk menentukan peringkat hasil untuk memberikan yang “terbaik” . Bagaimana mesin pencari yang memutuskan halaman yang paling cocok, dan apa pesanan hasilnya harus ditunjukkan, sangat bervariasi dari satu mesin ke mesin yang lain. Metode juga berubah dari waktu ke waktu sebagai perubahan penggunaan internet dan teknik baru berkembang. Ada dua jenis utama mesin pencari yang telah berevolusi: satu adalah sistem kata kunci standar dan hirarki memerintahkan bahwa manusia telah diprogram secara ekstensif. Yang lainnya adalah sistem yang menghasilkan sebuah “indeks terbalik” dengan menganalisis teks ini menempatkan. Bentuk kedua jauh lebih banyak bergantung pada komputer itu sendiri untuk melakukan sebagian besar pekerjaan.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung oleh pendapatan iklan dan, sebagai hasilnya, beberapa mempekerjakan praktek memungkinkan pengiklan untuk membayar uang untuk memiliki daftar mereka peringkat lebih tinggi dalam hasil pencarian. mesin pencari Mereka yang tidak menerima uang untuk hasil mesin pencari mereka menghasilkan uang dengan menjalankan iklan pencarian terkait di samping hasil mesin pencarian biasa. Mesin pencari menghasilkan uang setiap kali seseorang mengklik salah satu iklan tersebut.