IPS adalah Tujuan dan fungsi sistem temu kembali informasi
IPS adalah Tujuan dan fungsi sistem temu kembali informasi

Video: IPS adalah Tujuan dan fungsi sistem temu kembali informasi

Video: IPS adalah Tujuan dan fungsi sistem temu kembali informasi
Video: PROSES PENGISIAN BAHAN BAKAR MESIN TENAGA UAP | PALM OIL MILL 2024, April
Anonim

Sulit bagi orang modern untuk membayangkan hidup tanpa Internet dan akses hampir seketika ke sumber informasi. Pengguna jarang memikirkan bagaimana pencarian konten yang diinginkan di jaringan dilakukan. Tapi ini sangat menarik.

Sistem temu kembali informasi (IPS) adalah sistem perangkat lunak dan perangkat keras kompleks yang memilih informasi atas permintaan pengguna. Informasi disimpan di server dalam bentuk digital, seperti buku yang dulu ada di rak perpustakaan. Sistem terdiri dari banyak subsistem. Masing-masing melakukan tugasnya dalam proses memproses permintaan pengguna dan memberinya informasi dalam bentuk teks atau suara. Banyaknya tugas yang harus diselesaikan menentukan kompleksitas arsitektur sistem temu kembali informasi modern (singkatan dari sistem temu kembali informasi). Semacam "kotak hitam": pada input - teks permintaan, apa yang ada di dalamnya - tidak diketahui, pada output - informasi lengkap.

File kartu dalam kehidupan nyata
File kartu dalam kehidupan nyata

Aliran masukan

Permintaan informasi yang dibentuk seseorang dalam bentuk teks di layar gadgetnya,merupakan bagian kecil dari permintaan yang diproses oleh mesin pencari. Larik utama kueri penelusuran dibentuk oleh robot yang menerima permintaan manusia dan melakukan penelusuran dan umpan balik multi-langkah dengan pengguna. Sistem pencarian informasi termasuk Google, Yandex, dan lainnya yang terkenal, memproses jutaan permintaan setiap hari.

Objek pencarian sumber

Set objek awal yang menarik untuk pencarian adalah dokumen, catatan, video, gambar dan banyak lagi. Mereka dibuat di luar IPS. Sistem penyimpanan dan pengambilan informasi umum harus memiliki sistem bibliografi built-in - semacam katalog yang memungkinkan Anda untuk mencari segala jenis objek.

Objek atau transformasi digitalnya menjadi "sumber daya masuk" ke dalam IPS. Di antaranya adalah informasi yang dibutuhkan pengguna dipilih.

Mencari informasi
Mencari informasi

Sumber eksternal

Tampilan pemilihan informasi menggunakan sumber pengetahuan eksternal. Ini adalah informasi yang dicari pengguna. Judul film, kutipan dari buku, dan banyak lagi. Untuk pencarian komputer, informasi ini harus diterjemahkan ke dalam kueri dalam bahasa algoritmik. Di IPS, ini dilakukan dengan menggunakan blok untuk membuat, mengindeks, dan mengembangkan kueri.

Idealnya, ketiga proses ini-representasi, pengindeksan, dan pengembangan kueri-harus bergantung pada sumber pengetahuan yang identik, tetapi dalam praktiknya, hal ini tidak dapat dicapai.

Sumber pengetahuan harus selalu ditinjau dan diperbarui, dan pembaruan harus sama dandisinkronkan. Dan sumber pengetahuan eksternal selalu secara kronologis mendahului penggunaannya di mesin telusur untuk kueri, terkadang beberapa tahun.

Sistem pencarian informasi
Sistem pencarian informasi

Kinerja

Representasi dari objek asli terdiri dari input data dalam beberapa kombinasi atau ditransformasikan sesuai dengan aturan dan algoritma sistem temu kembali informasi tertentu.

Tampilan kurang lebih merupakan salinan yang diubah dari objek pencarian asli. Dalam kumpulan teks lengkap yang tidak diedit, setiap teks adalah representasinya sendiri. Dalam koleksi benda-benda pameran dan artefak museum, representasi dapat berupa gambaran yang ditransformasikan dari objek dengan citranya. Dalam beberapa kasus, representasi mungkin sebagian berasal dari objek asli dan sebagian dari deskripsi: di mesin pencari bibliografi, representasi berasal dari objek - misalnya, judul, nama penulis akan digabungkan dengan anotasi karya.

Menemukan apa yang Anda butuhkan
Menemukan apa yang Anda butuhkan

Indeks yang dapat dicari

Karena informasi dalam sistem temu kembali informasi disimpan dalam bentuk representasi, adalah logis untuk mengasumsikan bahwa pencarian dilakukan sesuai dengan representasi dan, setelah pemilihan, diberikan kepada pengguna. Dalam praktiknya, ini tidak terjadi. Misalnya, katalog perpustakaan online saat ini biasanya membatasi pencarian ke beberapa bidang: penulis, judul, dan subjudul dalam tampilan yang berisi bidang lain yang tidak dicari. Ini adalah alasan yang cukup mengapa perlu untuk membedakantampilan dan indeks yang dapat dicari, yang merupakan bagian pencarian dari tampilan. Ini mendefinisikan segala sesuatu yang harus dicari. Indeks yang dapat dicari, seperti objek tampilan dan sumber, dapat dipecah menjadi sub-indeks terpisah untuk memberikan pencarian yang lebih tepat dan bertarget

Mesin pencari biasanya memiliki struktur sintetis secara internal untuk mencocokkan hasil pencarian yang valid. Struktur ini adalah komponen kedua dari indeks yang dapat dicari.

Secara prosedural, proses pengindeksan dapat diimplementasikan dengan berbagai cara: indeks yang dapat dicari dapat diperoleh dengan:

  • secara harfiah menyalin representasi yang dapat dicari;
  • dengan menyalin detail tampilan. Ini mungkin sebagian atau seluruh tampilan yang secara fisik ada hanya sebagai fragmen, didistribusikan sesuai dengan aturan untuk membuat indeks untuk pencarian, yang akan dikumpulkan bila diperlukan.
Manajemen pencarian
Manajemen pencarian

Permintaan Aturan Desain dan Permintaan Formal

Rekayasa kueri adalah fungsi yang menengahi antara kueri pengguna dan kueri formal. Ini mengubah kueri pengguna, mencocokkannya dengan kamus perintah pengambilan, spesifikasi indeks, dan indeks sebelum pengambilan. Pada awal pengembangan IPS, peran ini secara tradisional diberikan kepada spesialis TI yang memenuhi syarat.

Mengembangkan kueri komputer yang dapat mencocokkan kueri kamus ke dalam sistem indeks yang dapat dicari biasanya disebut sebagai modul "input kamus". Otomatisasi fungsi ini menjanjikan dan menawarkan peluang untuk metode pencarian ahli dan probabilistik.

Permintaan formal menjadi permintaan formal setelah permintaan pengguna diubah. Contoh transformasi formal tersebut termasuk pemotongan, substitusi, normalisasi, vektorisasi dan transformasi lain dari representasi "eksternal" menjadi representasi "internal" dari IPS komputer (dekripsi - sistem pencarian informasi).

Set Tautan Dokumen yang Diekstraksi

Kumpulan sumber informasi yang dihasilkan secara logis adalah subset dari tampilan yang dibuat oleh aturan pencocokan yang diterapkan pada kueri formal oleh indeks yang dapat dicari.

Biasanya, tetapi tidak harus, ada proses penyortiran terpisah untuk kumpulan informasi yang dipulihkan. Katalog perpustakaan online biasanya menyusun ulang set yang diterima menurut abjad penulis sebelum ditampilkan. Dalam sistem pencarian informasi yang menghasilkan peringkat yang ketat, urutan peringkat mendahului setiap penataan ulang.

Analisis data
Analisis data

Aliran keluaran

Output hasil pencarian dilakukan secara tradisional pada tampilan, lebih sering dalam bentuk aliran objek yang akan digunakan di tempat lain atau untuk tujuan lain, melengkapi putaran pencarian utama Aliran tersebut dapat dikirim ke perangkat visualisasi, penyimpanan untuk diproses lebih lanjut, atau digunakan sebagai aliran input ke layanan pilihan lainnya.

Sistem pencarian informasi memungkinkan umpan balik darioutput dari setiap proses seleksi. Output dari setiap proses dapat menjadi umpan balik untuk proses lain. Umpan balik dapat memberikan dasar untuk penilaian ahli pada setiap tahap.

Direkomendasikan: