2024 Pengarang: Howard Calhoun | [email protected]. Terakhir diubah: 2023-12-17 10:31
Sulit bagi orang modern untuk membayangkan hidup tanpa Internet dan akses hampir seketika ke sumber informasi. Pengguna jarang memikirkan bagaimana pencarian konten yang diinginkan di jaringan dilakukan. Tapi ini sangat menarik.
Sistem temu kembali informasi (IPS) adalah sistem perangkat lunak dan perangkat keras kompleks yang memilih informasi atas permintaan pengguna. Informasi disimpan di server dalam bentuk digital, seperti buku yang dulu ada di rak perpustakaan. Sistem terdiri dari banyak subsistem. Masing-masing melakukan tugasnya dalam proses memproses permintaan pengguna dan memberinya informasi dalam bentuk teks atau suara. Banyaknya tugas yang harus diselesaikan menentukan kompleksitas arsitektur sistem temu kembali informasi modern (singkatan dari sistem temu kembali informasi). Semacam "kotak hitam": pada input - teks permintaan, apa yang ada di dalamnya - tidak diketahui, pada output - informasi lengkap.
Aliran masukan
Permintaan informasi yang dibentuk seseorang dalam bentuk teks di layar gadgetnya,merupakan bagian kecil dari permintaan yang diproses oleh mesin pencari. Larik utama kueri penelusuran dibentuk oleh robot yang menerima permintaan manusia dan melakukan penelusuran dan umpan balik multi-langkah dengan pengguna. Sistem pencarian informasi termasuk Google, Yandex, dan lainnya yang terkenal, memproses jutaan permintaan setiap hari.
Objek pencarian sumber
Set objek awal yang menarik untuk pencarian adalah dokumen, catatan, video, gambar dan banyak lagi. Mereka dibuat di luar IPS. Sistem penyimpanan dan pengambilan informasi umum harus memiliki sistem bibliografi built-in - semacam katalog yang memungkinkan Anda untuk mencari segala jenis objek.
Objek atau transformasi digitalnya menjadi "sumber daya masuk" ke dalam IPS. Di antaranya adalah informasi yang dibutuhkan pengguna dipilih.
Sumber eksternal
Tampilan pemilihan informasi menggunakan sumber pengetahuan eksternal. Ini adalah informasi yang dicari pengguna. Judul film, kutipan dari buku, dan banyak lagi. Untuk pencarian komputer, informasi ini harus diterjemahkan ke dalam kueri dalam bahasa algoritmik. Di IPS, ini dilakukan dengan menggunakan blok untuk membuat, mengindeks, dan mengembangkan kueri.
Idealnya, ketiga proses ini-representasi, pengindeksan, dan pengembangan kueri-harus bergantung pada sumber pengetahuan yang identik, tetapi dalam praktiknya, hal ini tidak dapat dicapai.
Sumber pengetahuan harus selalu ditinjau dan diperbarui, dan pembaruan harus sama dandisinkronkan. Dan sumber pengetahuan eksternal selalu secara kronologis mendahului penggunaannya di mesin telusur untuk kueri, terkadang beberapa tahun.
Kinerja
Representasi dari objek asli terdiri dari input data dalam beberapa kombinasi atau ditransformasikan sesuai dengan aturan dan algoritma sistem temu kembali informasi tertentu.
Tampilan kurang lebih merupakan salinan yang diubah dari objek pencarian asli. Dalam kumpulan teks lengkap yang tidak diedit, setiap teks adalah representasinya sendiri. Dalam koleksi benda-benda pameran dan artefak museum, representasi dapat berupa gambaran yang ditransformasikan dari objek dengan citranya. Dalam beberapa kasus, representasi mungkin sebagian berasal dari objek asli dan sebagian dari deskripsi: di mesin pencari bibliografi, representasi berasal dari objek - misalnya, judul, nama penulis akan digabungkan dengan anotasi karya.
Indeks yang dapat dicari
Karena informasi dalam sistem temu kembali informasi disimpan dalam bentuk representasi, adalah logis untuk mengasumsikan bahwa pencarian dilakukan sesuai dengan representasi dan, setelah pemilihan, diberikan kepada pengguna. Dalam praktiknya, ini tidak terjadi. Misalnya, katalog perpustakaan online saat ini biasanya membatasi pencarian ke beberapa bidang: penulis, judul, dan subjudul dalam tampilan yang berisi bidang lain yang tidak dicari. Ini adalah alasan yang cukup mengapa perlu untuk membedakantampilan dan indeks yang dapat dicari, yang merupakan bagian pencarian dari tampilan. Ini mendefinisikan segala sesuatu yang harus dicari. Indeks yang dapat dicari, seperti objek tampilan dan sumber, dapat dipecah menjadi sub-indeks terpisah untuk memberikan pencarian yang lebih tepat dan bertarget
Mesin pencari biasanya memiliki struktur sintetis secara internal untuk mencocokkan hasil pencarian yang valid. Struktur ini adalah komponen kedua dari indeks yang dapat dicari.
Secara prosedural, proses pengindeksan dapat diimplementasikan dengan berbagai cara: indeks yang dapat dicari dapat diperoleh dengan:
- secara harfiah menyalin representasi yang dapat dicari;
- dengan menyalin detail tampilan. Ini mungkin sebagian atau seluruh tampilan yang secara fisik ada hanya sebagai fragmen, didistribusikan sesuai dengan aturan untuk membuat indeks untuk pencarian, yang akan dikumpulkan bila diperlukan.
Permintaan Aturan Desain dan Permintaan Formal
Rekayasa kueri adalah fungsi yang menengahi antara kueri pengguna dan kueri formal. Ini mengubah kueri pengguna, mencocokkannya dengan kamus perintah pengambilan, spesifikasi indeks, dan indeks sebelum pengambilan. Pada awal pengembangan IPS, peran ini secara tradisional diberikan kepada spesialis TI yang memenuhi syarat.
Mengembangkan kueri komputer yang dapat mencocokkan kueri kamus ke dalam sistem indeks yang dapat dicari biasanya disebut sebagai modul "input kamus". Otomatisasi fungsi ini menjanjikan dan menawarkan peluang untuk metode pencarian ahli dan probabilistik.
Permintaan formal menjadi permintaan formal setelah permintaan pengguna diubah. Contoh transformasi formal tersebut termasuk pemotongan, substitusi, normalisasi, vektorisasi dan transformasi lain dari representasi "eksternal" menjadi representasi "internal" dari IPS komputer (dekripsi - sistem pencarian informasi).
Set Tautan Dokumen yang Diekstraksi
Kumpulan sumber informasi yang dihasilkan secara logis adalah subset dari tampilan yang dibuat oleh aturan pencocokan yang diterapkan pada kueri formal oleh indeks yang dapat dicari.
Biasanya, tetapi tidak harus, ada proses penyortiran terpisah untuk kumpulan informasi yang dipulihkan. Katalog perpustakaan online biasanya menyusun ulang set yang diterima menurut abjad penulis sebelum ditampilkan. Dalam sistem pencarian informasi yang menghasilkan peringkat yang ketat, urutan peringkat mendahului setiap penataan ulang.
Aliran keluaran
Output hasil pencarian dilakukan secara tradisional pada tampilan, lebih sering dalam bentuk aliran objek yang akan digunakan di tempat lain atau untuk tujuan lain, melengkapi putaran pencarian utama Aliran tersebut dapat dikirim ke perangkat visualisasi, penyimpanan untuk diproses lebih lanjut, atau digunakan sebagai aliran input ke layanan pilihan lainnya.
Sistem pencarian informasi memungkinkan umpan balik darioutput dari setiap proses seleksi. Output dari setiap proses dapat menjadi umpan balik untuk proses lain. Umpan balik dapat memberikan dasar untuk penilaian ahli pada setiap tahap.
Direkomendasikan:
Staf pada sistem manajemen personalia. Informasi, dukungan teknis dan hukum dari sistem manajemen personalia
Karena masing-masing perusahaan menentukan jumlah karyawan secara mandiri, memutuskan persyaratan apa yang dibutuhkan personel dan kualifikasi apa yang harus dimiliki, tidak ada perhitungan yang pasti dan jelas
Pembiayaan kembali hipotek: bank. Pembiayaan kembali hipotek di Sberbank: ulasan
Kenaikan bunga pada produk pinjaman bank mendorong peminjam untuk mencari penawaran yang menguntungkan. Akibatnya, pinjaman hipotek menjadi lebih dan lebih populer
Manajemen terpusat: sistem, struktur, dan fungsi. Prinsip-prinsip model manajemen, pro dan kontra dari sistem
Model manajemen mana yang lebih baik - terpusat atau terdesentralisasi? Jika seseorang sebagai tanggapan menunjuk ke salah satu dari mereka, dia kurang berpengalaman dalam manajemen. Karena tidak ada model buruk dan baik dalam manajemen. Itu semua tergantung pada konteks dan analisis yang kompeten, yang memungkinkan Anda untuk memilih cara terbaik untuk mengelola perusahaan di sini dan sekarang. Manajemen terpusat adalah contoh yang bagus untuk ini
Sistem informasi dan referensi: jenis dan contoh. Apa yang dimaksud dengan sistem informasi dan referensi?
Penyebaran informasi, pengumpulan dan pemrosesan lebih lanjut dalam masyarakat modern adalah berkat sumber daya khusus: manusia, keuangan, teknis, dan lain-lain. Pada titik tertentu, data ini dikumpulkan di satu tempat, disusun menurut kriteria yang telah ditentukan, digabungkan ke dalam basis data khusus yang nyaman untuk digunakan
Apa itu pembiayaan kembali hipotek dan pembiayaan kembali bank?
Artikel ini akan memberi tahu Anda apa itu pembiayaan kembali hipotek dan apa keuntungan utama dari program keuangan semacam itu