Selasa, 03 Maret 2015

Sistem Temu Kembali Informasi

Nama/NIM               : Deni Eko Pratomo/1204505018
Jurusan/Fakultas     : Teknologi Informasi/Teknik Universitas Udayana
Dosen                      : I Putu Agus Eka Pratama, ST, MT.
Matakuliah               : Sistem Temu Kembali Informasi

Pengertian Information Retrival System (IRS)
Information Retrieval adalah seni dan ilmu dalam mencari informasi pada dokumen, mencari untuk dokumen mereka sendiri, mencari untuk metadata dengan gambaran berbentuk dokumen, atau mencari dalam database, apakah itu hubungan database yang berdiri sendiri atau hiperteks jaringan database seperti internet atau intranet, untuk teks, suara, gambar atau data.Information Retrival System (IRS) berfungsi untuk mengatur ledakan informasi dalam literature ilmiah dalam beberapa decade terakhir. Banyak universitas dan perpustakaan umum menggunakan IR sistem untuk menyediakan akses ke buku, jurnal, dan dokumen lainnya. IR sistem seringkali dihubungkan kepada objek dan query.

Tipe-tipe dari user yang menggunakan Information Retrival System dibedakan menjadi 5 yaitu Actual User, Potential User, Expected User, Benefically Users, dan Real User (End User, Intermediery, Novice Users, Expert User). Dengan tipe-tipe yang ada, kita dapat mengetahui sampai sejauh mana tingkatan user tentang pemahamannya terhadap proses penelusuran informasi.Information Retrieval system digunakan untuk menemukan kembali (to Retrieve) informasi-informasi yang relevan terhadap kebutuhan user dari suatu kumpulan/pangkalan informasi secara otomatis. Sistem temu balik informasi ini terutama berkaitan dengan pencarian/penelusuran informasi yang isinya tidak memiliki struktur. Demikian juga ekspresi kebutuhan pengguna yang disebut query, yang juga tidak memiliki struktur. Hal ini membedakanInformation retrieval system dengan database system.


Ada beberapa definisi dalam sistem temu kembali informasi menurut para ahli di bidang ilmu perpustakaan dan informasi, yaitu sebagai berikut:
  1. Mooers (1948) berpendapat bahwa Information Retrieval sendiri adalah seni dan ilmu dalam mencari informasi pada dokumen, mencari untuk dokumen mereka sendiri, mencari untuk metadata dengan gambaran berbentuk dokumen, atau mencari dalam database, apakah itu hubungan database yang berdiri sendiri atau hiperteks jaringan database seperti internet atau intranet, untuk teks, suara, gambar atau data. Mooers (1951) juga menjelaskan bahwa Information Retrievaladalah bidang di persimpangan ilmu informasi dan ilmu komputer.  Berkutat dengan pengindeksan dan pengambilan informasi dari sumber informasi heterogen dan sebagian besar-tekstual. Istilah ini diciptakan oleh Mooers pada tahun 1951, yang menganjurkan bahwa diterapkan ke “aspek intelektual” deskripsi informasi dan sistem untuk pencarian
  2. Hougthon (1977) menjelaskan bahwa sistem temu kembali informasi adalah penelusuran yang merupakan interaksi antara pemakai dan sistem dan pernyataan kebutuhan pengguna diekspresikan sebagai suatu istilah tertentu
  3. Lancaster (1979) mengatakan bahwa sistem temu kembali informasi tidak menginformasikan semua isi dari subjek yang dimiliki koleksi tersebut tetapi hanya memberikan informasi keberadaan pustaka yang mempunyai hubungan subjek seperti yang dicari oleh pengguna.
  4. Salton (1983) secara sederhana menjelaskan bahwa temu kembali informasi merupakan suatu sistem yang menyimpan informasi dan menemukan kembali informasi tersebut.
  5. Harter (1986) mengatakan bahwa Sistem temu-kembali informasi (Information Retrieval System/IRS) adalah perangkat yang menghubungkan antara pemakaipotensial dengan koleksi atau kumpulan informasi.
  6. Sulistyo-Basuki (1991) mendefinisikan temu kembali informasi sebagai kegiatan yang bertujuan untuk menyediakan dan memasok informasi bagi pemakai sebagai jawaban atas permintaan atau berdasarkan kebutuhan pemakai.
  7. Ingwersen (1992) mengatakan bahwa sistem temu kembali informasi adalah sebuah sistem yang dibangun melalui proses antara objek sistem, sistem setting, dan situasi yang memungkinkan terjadinya penelusuran dan ditemukannya informasi potensial yang diinginkan oleh penelusur informasi.
  8. Tague-Sutcliffe (1996) mengatakan bahwa IRS adalah suatu proses yang dilakukan untuk menemukan dokumen yang dapat memberikan kepuasan bagi pemakai dalam memenuhi kebutuhan informasinya.
  9. Baeza-Bates dan Riberto-Neto (1999) mengatakan bahwa temu kembali informasi berkaitan dengan representasi, penyimpanan, dan akses terhadap dokumen representasi dokumen.
  10. Zaenab (2002) menjelaskan bahwa sistem temu kembali informasi informasi merupakan suatu proses pencarian dokumen dengan menggunakan istilah-istilah bahasa pencarian untuk mendefinisikan dokumen sesuai dengan subjek yang diinginkan.
  11. Hasugian (2003) menjelaskan bahwa sistem temu kembali informasi pada dasarnya adalah suatu proses untuk mengidentifikasi, kemudian memanggil (retrieval) suatu dokumen dari suatu simpanan (file), sebagai jawaban atas permintaan informasi.

Contoh Penerapan Sistem Temu Kembali Informasi
  1. Conventional (katalog perpustakaan)
    Pencarian dengan kata kunci, judul, penulis, dan lain-lain
  2. Text-based (Google, Yahoo, ASK).
    Pencarian dengan kata kunci (keyword). Pencarian terbatas menggunakan query dalam bahasa alami
  3. Multimedia (Youtube)
    Pencarian dengan penampilan visual (bentuk, warna, gerak, dan lain-lain)
  4. Sistem jawaban pertanyaan (AskJeeves, Answerbus)
    Pencarian dalam bahasa alami (terbatas)
  5. Lainnya:
    IR lintas-bahasa, music retrieval.

Jenis, Fungsi, dan Tujuan Sistem Temu Kembali Informasi
Perkembangan Temu Kembali Informasi dari sisi user task ada 2 jenis yaitu:
  1. Model Klasik
    1. Model Boolean : merupakan model sistem temu kembali informasi sederhana yang berdasarkan atas teori himpunan dan aljabar boolean
    2. Model Vector Space : merupakan model sistem temu kembali informasi yang merepresentasikan dokumen dan query dalam bentuk vektor dimensional
    3. Model Probabilistic : merupakan model sistem temu kembali informasi yang menggunakan framework probabilistik
  2. Model Terstruktur
    1. Non Overlapping List: Sistem yang menggunakan model ini akan membagi-bagi dokumen sebagai “wilayah teks” tertentu.
    2. Proximal Nodes: model ini menggunakan struktur indeks yang memiliki hirarki independen (non-flet) terhadap sebuah dokumen.
Taksonomi model sistem temu kembali informasi
Model IR

Menurut Chowdhury (1999) Sistem temu-kembali informasi dibagi menjadi dua kategori besar, yaitu:
  1. Sistem temu-kembali informasi in house, yaitu Sistem temu-kembali informasi dibangun oleh perpustakaan atau pusat informasi tertentu untuk melayani terutama para pemakai dalam organisasi tersebut. Salah satu bentuk sistem temu-kembali informasi in house adalah OPAC (Online Public Access Catalogue)
  2. Sistem temu-kembali informasi online, yaitu Sistem temu-kembali informasi didesain untuk memberikan akses ke remote database kepada berbagai user. Sistem online ini menghubungkan para pemakai pada berbagai tempat melalui jaringan komunikasi elektronik. Bentuk yang paling populer dari sistem temu-kembali informasi online adalah CD-ROM dan internet.
Sistem Temu Kembali Informasi didisain untuk menemukan dokumen atau informasi yang diperlukan oleh masyarakat pengguna. Sistem Temu Kembali Informasi bertujuan untuk menjembatani kebutuhan informasi pengguna dengan sumber informasi yang tersedia dalam situasi seperti dikemukakan oleh Belkin (1980) sebagai berikut:
  1. Penulis mempresentasikan sekumpulan ide dalam sebuah dokumen menggunakan sekumpulan konsep.
  2. Terdapat beberapa pengguna yang memerlukan ide yang dikemukakan oleh penulis tersebut, tapi mereka tidak dapat mengidentifikasikan dan menemukannya dengan baik.
  3. Sistem temu kembali informasi bertujuan untuk mempertemukan ide yang dikemukakan oleh penulis dalam dokumen dengan kebutuhan informasi pengguna yang dinyatakan dalam bentuk pertanyaan (query)
Sementara Tague-Sutcliffe (1996) menjelaskan bahwa Tujuan utama sistem temu kembali informasi adalah untuk menemukan dokumen yang sesuai dengan kebutuhan informasi pengguna secara efektif dan efisien, sehingga dapat memberikan kepuasan baginya. Sedangkan Secara teknis tujuan Sistem temu kembali informasi menurut Hasugian (2006) adalah menyesuaikan (matching) dengan term atau istilah yang dibangun (query) dengan term atau indeks yang ada dalam dokumen, sehingga dengan kesesuaian tersebut maka dokumen-dokumen yang relevan akan terambil (retrieved) dari database. Dokumen relevan yang terambil tersebut itulah tujuan dari Sistem temu kembali informasi. Berkaitan dengan sumber informasi disatu sisi dan kebutuhan informasi pengguna disisi yang lain. Sistem temu kembali informasi berperan untuk:
  1. Menganalisis sumber informasi dan pertanyaan.
  2. Mempertemukan pertanyaan pengguna dengan sumber informasi untuk mendapatkan dokumen yang relevan.
Adapun fungsi utama Sistem Temu Kembali Informasi seperti dikemukakan oleh Lancaster (1979) dan Kent (1971) adalah sebagai berikut:
  1. Mengidentifikasi sumber informasi yang relevan dengan minat masyarakat pengguna yang ditargetkan.
  2. Menganalisis isi sumber informasi  (dokumen)
  3. Merepresentasikan isi sumber informasi dengan cara tertentu yang memungkinkan untuk dipertemukan dengan pertanyaan (query) pengguna.
  4. Merepresentasikan pertanyaan (query) pengguna dengan cara tertentu yang memungkinkan untuk dipertemukan sumber informasi yang terdapat dalam basis data.
  5. Mempertemukan pernyataan pencarian dengan data yang tersimpan dalam basis data.
  6. Menemu-kembalikan informasi yang relevan.
  7. Menyempurnakan unjuk kerja sistem berdasarkan umpan balik yang diberikan oleh pengguna.

Komponen Sistem Temu Kembali Informasi
Pada prinsipnya menurut Houghton (1977) sistem temu kembali informasi adalah penelusuran yang merupakan interaksi antara pemakai dan sistem dan pernyataan kebutuhan pengguna diekspresikan sebagai suatu istilah tertentu. Selanjutnya dinyatakan bahwa komponen fundamental dari sistem temu kembali informasi adalah sebagai berikut:
  1. penyimpanan (storage), yaitu menyangkut analisis subjek oleh pengindeks dan penerjemahan dari istilah ke dalam bahasa pengindeksan oleh sistem.
  2. proses temu kembali (retrieval), yaitu berkaitan dengan analisis dan pernyataan penelusuran; penerjemahan pertanyaan dalam bahasa pengindeksan oleh sistem; serta formulasi dari strategi penelusuran diekspresikan sebagai suatu istilah tertentu.
Lancaster (1979) dan Doyle (1975) memandang sistem temu-kembali informasi dalam konteks siklus transfer informasi, mengatakan bahwa suatu sistem temu-kembali informasi merupakan subsistem (tahap luaran) dari sistem informasi. Lancaster juga mengatakan bahwa sistem temu-kembali informasi terdiri dari enam subsistem:
  1. Subsistem dokumen
  2. subsistem indexing
  3. subsistem kosa kata
  4. subsistem penelusuran
  5. antar-muka (interface) pemakai dengan sistem
  6. subsistem penyesuaian/pencocokan.
Dokumen sebagai objek data dalam Sistem Temu Kembali Informasi merupakan sumber informasi. Dokumen biasanya dinyatakan dalam bentuk indeks atau kata kunci. Kata kunci dapat diekstrak secara langsung dari teks dokumen atau ditentukan secara khusus oleh spesialis subjek dalam proses pengindeksan yang pada dasarnya terdiri dari proses analisis dan representasi dokumen. Pengindeksan dilakukan dengan menggunakan sistem pengindeksan tertentu, yaitu himpunan kosa kata yang dapat dijadikan sebagai bahasa indeks sehingga diperoleh informasi yang terorganisasi. Sementara itu, pencarian diawali dengan adanya kebutuhan informasi pengguna. Dalam hal ini Sistem Temu Kembali Informasi berfungsi untuk menganalisis pertanyaan (query) pengguna yang merupakan representasi dari kebutuhan informasi untuk mendapatkan pernyataan-pernyataan pencarian yang tepat. Selanjutnya pernyataan-pernyataan pencarian tersebut dipertemukan dengan informasi yang telah terorganisasi dengan suatu fungsi penyesuaian (matching function) tertentu sehingga ditemukan dokumen atau sekumpulan dokumen. Proses tersebut di atas dapat diilustrasikan seperti gambar berikut:

Pada bagan yang dibuat oleh Lauren B. Doyle Juga terdapat kemiripan pada bagan sistem temu kembali informasi milik Lancaster, berikut ini diagram Lauren B. Doyle:

Ada persamaan antara penjelasan dari Lancaster (1979) dengan Tague-Sutcliffe (1996), hanya saja ada sedikit perbedaaan yaitu pada komponen penilaian relevansi. Lebih jelasnya, Tague-Sutcliffe (1996) melihat Sistem Temu Kembali Informasi sebagai suatu proses yang terdiri dari 6 (enam) komponen utama yaitu:
  1. Kumpulan dokumen
  2. Pengindeksan
  3. Kebutuhan informasi pemakai
  4. Strategi pencarian
  5. Kumpulan dokumen yang ditemukan
  6. Penilaian relevansi
Secara garis besar komponen-komponen Sistem Temu Kembali menurut Tague-Sutcliffe (1996) dapat diilustrasikan seperti gambar berikut:


Pada intinya menurut Di Nubila (1994) dalam sistem temu kembali informasi terdapat tiga komponen utama yang saling mempengaruhi, yaitu:
  1. kumpulan dokumen;
  2. kebutuhan informasi pengguna;
  3. proses pencocokan (matching) antara keduanya
Secara garis besar menurut Hasibuan (1996) bisa juga dikatakan bahwa komponen sistem temu kembali informasi terdiri dari:
  1. Pemakai (user), adalah poin utama dari semua sistem temu kembali informasi, karena tujuan utama dari setiap penyimpanan informasi adalah menemukan kembali informasi dari sumbernya (database) kepada pemakai.
  2. Dokumen, struktur dokumen dalam suatu basis data elektronis memegang peranan penting dalam meningkatkan kinerja sistem temu kembali informasi. Stuktur tersebut dibentuk oleh berbagai ciri yang menjadi bagian dari suatu dokumen. Ciri-ciri tersebut meliputi : kata-kata indeks (Indeks terms), kata-kata bebas (Free text terms), pengarang, referensi (Cited documents), sitasi (Citing document), afiliasi pengarang,matcher-machine.
  3. Ada fungsi matcher-machine dalam sistem temu kembali informasi, yaitu:
  • Fungsi exact match, adalah pencocokan dimana representasi suatu pertanyaan persis sama atau harus sesuai dengan representase dokumen, agar dokumen tersebut dapat terambil (retrieved).
  • Fungsi partial match atau pencocokan sebagian, yaitu representasi pertanyaan hanya sebagian saja yang sama dengan representasi dokumen. Pencocokan sebagian ini dikenal dengan pemenggalan (truncation).
Komponen dasar sistem temu kembali informasi menurut Chowdury (1999) ada 3 yaitu:
  1. Dokumen atau sumber informasi
  2. Query atau Pemakai
  3. Fungsi Pencocokan (matching function)
kumpulan dokumen yang ada dalam sistem diwakili oleh kata-kata kunci atau kata indeks sebagai pendekatan dalam penelusuran. Sedangkan query (permintaan) adalah rumusan pertanyaan yang dimasukkan ke sistem dan fungsi pencocokan di sini mempertemukan antara sumber informasi yang disimpan di sistem dengan permintaan pemakai.

Secara sederhana, penjelasan dari Di Nubila (1994), Hasibuan (1996) dan Chowdury (1999) hampir sama dengan yang digambarkan oleh Ingwersen (2002) sebagai ilustrasi model temu kembali informasi seperti gambar berikut:

Representation” dari gambar di sebelah kiri menunjukkan representasi dokumen, data dan informasi. “Query” pada komponen sebelah ‘kanan merupakan representasi dari pertanyaan pengguna, serta “matching function” komponen yang di tengah merupakan fungsi pencocokan antara representasi data/dokumen dengan pertanyaan. Kemudian dalam “Temu lembali lnformasi” kurang lebih sama dengan penjelasan tentang prinsip temu kembali informasi menurut Houghton (1977), ilustrasi dari temu kembali informasi dapat digambarkan sebagai berikut:

Selanjutnya dalam “Sistem Temu kembali Informasi”, sebagai suatu sistem, sistem temu kcmbali informasi mcmiliki bcbcrapa bagian yang membangun sistem secara keseluruhan. Gambaran bagian-bagian yang terdapat pada suatu sistem temu kembali informasi hampir sama seperti penjelasan tentang subsistem temu kembali informasi menurut Lancaster (1979) dan Doyle (1975) yang digambarkan sebagai berikut:

Penjelasan dari gambar di atas adalah sebagai berikut :
  1. Text Operations (operasi terhadap teks) yang meliputi pemilihan kata-kata dalam query maupun dokumen dalam pentransformasian dokumen atau query menjadi terms index (indeks dari kata-kata).
  2. Query Formulation (formulasi terhadap query) yang memberi bobot pada indeks kata-kata query.
  3. Ranking, mencari dokumen-dokumen yang relevan terhadap query dan mengurutkan dokumen tersebut berdasarkan kesesuaiannya dengan query.
  4. Indexing, membangun data indeks dari koleksi dokumen. Dilkakukan terlebih dahulu sebelum pencarian dokumen, sistem temu kembali informasi menerima query dari pengguna, kemudian melakukan perangkingan terhadap pada koleksi berdasarkan kesesuaiannya dengan query. Hasil perangkingan yang diberikan kepada pengguna merupakan dokumen yang sistem, relevan dengan query, namun relevansi dokumen terhadap suatu query merupakan penilaian pengguna yang subjektif dan dipengaruhi banyak faktor.
Untuk memahami Information retrieval, Chu (2003) menjelasakan bahwa pada prinsipnya, sistem temu kembali informasi memiliki beberapa komponen sebagai berikut:
  1. Sebuah pangkalan data (database) sebagai tempat meletakkan dan menyimpan wakil dari dokumen atau informasi.
  2. Sebuah mekanisme pencarian untuk menemukan apa yang sudah tersimpan di pangkalan data.
  3. Seperangkat bahasa pencarian, yaitu bahasa yang digunakan manusia pengguna sistem dan yang dikenali oleh mesin komputer yang ia gunakan.
  4. Sebuah antamuka (interface), yaitu segala sesuatu yang terlihat, terdengar, atau tersentuh oleh pengguna ketika dia melakukan pencarian informasi.
Menurut Chu (2003), Komponen-komponen tersebut saling berkaitan untuk membentuk sebuah model seperti gambar berikut:

Sedangkan menurut Hasugian (2007) ada lima komponen Sistem temu kembali informasi yaitu :
  1. Pengguna
    Pengguna adalah orang yang menggunakan atau memanfaatkan Sistem temu kembali informasi dalam kegiatan pengelolaan dan pencarian informasi. Berdasarkan perannya, pengguna Sistem temu kembali informasi dibedakakan atas 2 (dua) kelompok yaitu:
  1. Pengguna (user) adalah seluruh pengguna Sistem temu kembali informasi yang menggunakan Sistem temu kembali informasi baik untuk pengelolaan (input data, backup data, maintenance atau lainnya) maupun untuk keperluan pencarian/penelusuran informasi.
  2. Pengguna akhir (end user) adalah pengguna yang hanya menggunakan Sistem temu kembali informasi untuk keperluan pencarian dan atau penelusuran informasi.
  1. Query
    Query adalah format bahasa permintaan yang di input (dimasukan) oleh pengguna kedalam Sistem temu kembali informasi. Dalam interface (antar muka) Sistem temu kembali informasi selalu disediakan kolom/ruas sebagai tempat bagi pengguna untuk mengetikkan (menuliskan) query nya. Dalam OPAC perpustakaan disebut “Search expression”. Pada kolom itulah pengguna mengetik/ menuliskan bahasa permintaanya (query), dan setelah query itu dimasukkan selanjutnya mesin akan melakukan proses pemanggilan (recall) terhadap dokumen yang diinginkan dari database.
  2. Dokumen
    Dokumen adalah istilah yang digunakan untuk seluruh bahan pustaka, apakah itu artikel, buku, laporan penelitian dsb. Seluruh bahan pustaka (dimasukkan) dan disimpan dalam database (pangkalan data). Media penyimpanan database ini ada yang berbentuk CD-ROM ada juga yang berbentuk harddisk. Database ini ada yang bisa diakses secara online dan ada juga yang diakses secara off line. Biasanya databaseyang bisa diakses secara online dapat diakses secara bersamaan (multy user), sedangkan yang sifatnya off line hanya dapat digunakan oleh seorang saja dalam waktu yang sama (single user).
  3. Indeks Dokumen
    Indeks adalah daftar istilah atau kata (list of terms). Dokumen yang dimasukkan/disimpan dalam database diwakili oleh indeks, Indeks itu disebut indeks dokumen. Fungsinya adalah representasi subyek dari sebuah dokumen. Indeks memiliki tiga jenis yaitu :
  1. Indeks subyek adalah menentukan subyek dokumen pada istilah mana/apa yang menjadi representasi subyek dari sebuah dokumen.
  2. Indeks pengarang adalah mementukan nama pengarang mana yang menjadi representasi dari suatu karya.
  3. Indeks bebas adalah menjadikan seluruh kata/istilah yang terdapat pada sebuah dokumen menjadi sebuah representasi dari dokumen, terkecuali stopword. Stopword adalah kata yang tidak di indeks seperti : yang, that, meskipun, di, ke, dan lain-lain atau seluruh kata sandang/partikel.
  1. Pencocokan (Matcher Function)
    Pencocokkan istilah (query) yang dimasukkan oleh pengguna dengan indeks dokumen yang tersimpan dalam database adalah dilakukan oleh mesin komputer. Komputerlah yang melakukan proses pencocokkan itu dalam waktu yang sangat singkat sesuai dengan kecepatan memory dan processing yang dimiliki oleh komputer itu. Komputer hanya dapat melakukan pencocokan berdasarkan kesamaan istilah, komputer tidak bisa berfikir seperti manusia sebab mesin komputer tersebut hanyalah “artificial intelegence” (kecerdasan buatan). Oleh karena itu sering terjadi “ambiguitas” atau kesalahan makna untuk sebuah istilah.
Dalam proses pencarian informasi terjadi interaksi antara pengguna dengan sistem (mesin) baik secara langsung maupun tidak langsung. Secara umum interaksi antara pengguna dengan sistem dalam proses pencarian informasi dapat dinyatakan seperti pada gambar berikut:


Tidak ada komentar:

Posting Komentar