Perkembangan Search Engine
Search
Engine atau Mesin Pencari adalah program komputer yang dirancang untuk
melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp,
publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer
peladendalam suatu jaringan. Search engine merupakan perangkat pencari
informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya
ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat
akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits.
Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam
jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas
lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi
atas data yang tersimpan dalam suatu basisdata ataupun direktori web.
Sebagian
besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan
algoritma kepemilikan dan basis data tertutup, di antaranya yang paling populer
adalah Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan
mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig,
Nutch, Egothor dan OpenFTS.
Saat
awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang berisikan
daftar situs web yang ada di internet melalui peladen web CERN. Sejarah yang
mencatat sejak tahun 1992 masih ada hingga kini. Dengan semakin banyaknya situs
web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh
manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian
di internet adalah Archie yang berasal dari kata "archive" tanpa
menggunakan huruf "v". Archie dibuat tahun 1990 oleh Alan Emtage,
Bill Heelan dan J. Peter Deutsch, saat itu adalah mahasiswa ilmu komputer
Universitas McGill, Amerika Serikat. Cara kerja program tersebut adalah
mengunduh daftar direktori serta berkas yang terdapat pada layanan ftp publik
(anonim) kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.
Mesin
pencari lainnya seperti Aliweb, muncul di 1993 dan masih berjalan hingga saat
ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha
komersial yang cukup besar adalah Lycos, yang dimulai di Carnegie Mellon
University sebagai proyek riset di tahun 1994.
Segera
setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan
popularitas. Termasuk di antaranya adalah WebCrawler, Hotbot, Excite, Infoseek,
Inktomi, dan AltaVista. Masing-masing bersaing dengan menambahkan
layakan-layanan tambahan seperti yang dilakukan oleh Yahoo.
Tahun
2002 Yahoo! mengakuisisi Inktomi, setahun kemudian mengakuisisi AlltheWeb dan
Altavista kemudian meluncurkan mesin pencari sendiri yang didasarkan pada
teknologi gabungan dari mesin-mesin pencari yang telah diakuisisinya serta
memberikan layanan yang mengutamakan pencarian Web daripada layanan-layanan
lainnya.
Di
bulan desember 2003, Orase menerbitkan versi pertama dari teknologi pencari
waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja
yang jauh lebih baik.
Mesin
pencari juga dikenal sebagai target investasi internet yang terjadi pada akhir
tahun 1990-an. Beberapa perusahaan mesin pencari yang masuk ke dalam pasar
saham diketahui mencatat keuntungan besar. Sebagian lagi sama sekali
menonaktifkan layanan mesin pencari, dan hanya memasarkannya pada edisi-edisi
enterprise saja, contoh Northern Light sebelumnya diketahui merupakan salah
satu perintis layanan mesin pencari di internet.
Buku
Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on the Internet
menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya
Google. Mesin-mesin pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves,
Clusty, Gigablast, Teoma,Wisenut, GoHook, Kartoo, dan Vivisimo.
Mesin
pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web,
yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawler
— browser web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi
setiap halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya,
kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta
tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk
digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google,
menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun
informasi tentang halaman web itu sendiri.
Selain
halaman web, Mesin pencari juga menyimpan dan memberikan informasi hasil
pencarian berupa pranala yang merujuk pada file, seperti file audio, file
video, gambar, foto dan sebagainya, serta informasi tentang seseorang, suatu
produk, layanan, dan informasi beragam lainnya yang semakin terus berkembang
sesuai dengan perkembangan teknologi informasi.
Ketika
seseorang mengunjungi mesin pencari dan memasukkan query, biasanya dengan
memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web
yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat
mengenai judul dokumen dan kadang-kadang sebagian teksnya.
Ada
jenis mesin pencari lain: mesin pencari real-time, seperti Orase. Mesin seperti
ini tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya
dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis
indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul
dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala mati,
dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan
hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian
lebih lama rampungnya.
Manfaat
mesin pencari bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun
mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa, sebagian
halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain.
Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat
hasil pencarian agar mampu memberikan hasil "terbaik" lebih dahulu.
Cara mesin menentukan halaman mana yang paling sesuai, dan urutan
halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode nya juga
berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya
teknik-teknik baru.
Sebagian
besar mesin pencari web adalah usaha komersial yang didukung pemasukan iklan
dan karenanya sebagian menjalankan praktik kontroversial, yaitu membolehkan
pengiklan membayar agar halaman mereka diberi peringkat lebih tinggi dalam
hasil pencarian.
Sumber
Komentar
Posting Komentar