Sejak masa awal kelahiran kepustakawanan, indeks (index) dan pengindeksan (indexing, pembuatan indeks) selalu merupakan hal penting, sebab efisiensi penyimpanan buku dan dokumen hanya dapat dicapai jika ada cara paling singkat untuk menemukan kembali buku atau dokumen tersebut ketika diperlukan.

Selama masa yang amat lama, pembuatan indeks adalah monopoli manusia, dan dilakukan oleh profesi khusus, baik penulis maupun pustakawan, Ketika terjadi “ledakan informasi” dan kecepatan pertumbuhan dokumen semakin tak terkendali, maka sulit sekali mengandalkan tenaga manusia untuk melakukan pengindeksan. Upaya menyerahkan pekerjaan ini ke mesin komputer pun menjadi semakin sering dilakukan dan melahirkan kajian teori maupun aplikasi yang akhirnya secara umum dikelompokkan sebagai bidang information retrieval[DG01].

Sebuah indeks secara sederhana adalah sebuah daftar berisi penunjuk (pointers). Lebih tepatnya lagi, indeks adalah sebuah daftar yang sistematis, mengandung istilah atau frasa (menyatakan pengarang, judul, konsep, dan sebagainya) yang dilengkapi dengan penunjuk ke isi satu atau serangkaian dokumen, ke lokasi istilah atau frasa itu dapat ditemukan. Indeks dan pengindeksan biasanya dikaitkan dengan pembuatan katalog dan klasifikasi. Namun, berbeda dari katalogisasi dan klasifikasi yang lebih berkonsentrasi pada
isi tentang dokumen, maka pengindeksan lebih terfokus pada ekstraksi atau pengambilan kata atau istilah yang ada di dalam dokumen di halaman tertentu, lalu menempatkannya dalam daftar indeks secara terstruktur. Struktur inilah yang memungkinkan sebuah buku “merujuk” pembacanya ke bagian-bagian dari teks yang relevan untuk keperluannya[DG01].Sistem temu kembali informasi (information retrieval system) digunakan untuk menemukan kembali (retrieve) informasi informasi yang relevan trhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis (mandala,2004)


Mandala (2002, hal:2) menyatakan bahwa system temu kembali informasi terutama berhubungan dengan pencarian informasi yang isinya tidak memiliki struktur. Hal ini yang membedakan system temu kembali informasi dengan system basis data. Dokumen adalah contoh informasi yang tidak terstruktur. Isi suatu dokumen sangat tergantung pada pembuat dokumen tersebut. System temu kembali informasi sebgai system yang berfungsi untuk menemukan informasi  yang relevan dengan kebutuhan pemakai, merupakan salah satu tipe system informasi. Salah satu hal yang perlu diingat adalah bahwa informasi yang diproses terkandung dalam sebuah dokumen yang bersifat tekstual. Koleksi dokumen terdiri dari dokumen dokumen yang beragam panjangnya dengan kandugan term yang berbeda. Hal yang perlu diperhatikan dalam pencarian informasi dari koleksi dokumen yang heterogen adalah pembobotan term. Term dapat berupa kata, frase atau unit hasil indexing lainya dalam suatu dokumen yang dapat digunakan untuk mengetahui konteks dari dokumen tersebut. Metode TF-IDF merupakan metode pembobotan term yang banyak digunakan sebagai metode pembanding terhadap pembobotan kata. Pada metode ini perhitungan bobot term t dalam sebuah dokumen dilakukan dengan mengalikan nilai term frequency dengan inverse document frequency.

Silahkan download Skrispnya dibawah ini, mudah-mudahan dapat menambah wawasan dan pengetahuan :