Bagaimana cara kerja pencarian gambar terbalik?

Citra rata-rata Anda bisa bernilai kurang dari seribu kata – hanya ada begitu banyak yang dapat Anda pelajari dari selfie. Tetapi kadang-kadang Anda hanya perlu tahu dari mana sebuah gambar berasal, terlepas dari berapa banyak kata yang berharga.

Untuk itu, ada mesin pencari gambar terbalik yang disediakan oleh orang-orang seperti Google, TinEye, Bing, Yandex, Pixsy, dan banyak lagi. Karena dia tidak memberikan kata-kata apa pun pada lamarannya, bagaimana mereka tahu apa yang harus dicari? Dan, yang paling penting, bagaimana mereka menemukannya? Cara kerja setiap mesin pencari gambar terbalik bervariasi, dan mereka menyembunyikan algoritme mereka, tetapi ide dasarnya ada di sana dan tidak terlalu sulit untuk dipahami.

Sidik jari

Gambar yang sebenarnya mungkin lebih unik daripada sidik jari manusia, karena kemungkinan dua gambar yang mengandung susunan piksel yang sama persis sangat kecil, sedangkan kemungkinan tumbukan sidik jari adalah sekitar 64 miliar, sebuah peluang yang relatif bagus. Tetapi bagaimana Anda sidik jari gambar? Langkah-langkahnya bervariasi sesuai dengan algoritma, tetapi kebanyakan dari mereka mengikuti formula dasar yang sama.

Pertama, Anda perlu mengukur karakteristik gambar, yang dapat mencakup warna, tekstur, gradien, bentuk, hubungan antara berbagai bagian gambar, dan bahkan hal-hal seperti transformasi Fourier (metode membagi gambar menjadi payudara dan kosinus).

Katakanlah kita sedang mencari gambar berikutnya dan kita perlu sidik jari.

Untuk melakukan itu, kita bisa, antara lain, menggunakan histogram warna gambar, transformasi Fourier, dan peta tekstur, yang masing-masing dapat Anda lihat di bawah.

Membalikkan Pencarian Gambar Histogram Warna Balik pencarian gambar Fourier Peta Tekstur Pencarian Gambar Balik

Jika gambar diubah ukurannya, kabur, diputar, atau dimanipulasi, akan ada sejumlah algoritma yang menggunakan fungsi di atas dan lainnya untuk mencoba menemukan hasilnya.

Pengkodean, penyimpanan, dan pencarian

Setiap fungsi gambar pada sidik jari dapat dikodekan sebagai serangkaian huruf dan angka, yang mudah disimpan dan diindeks dalam database. Setiap kombinasi fitur yang diekstraksi dan disimpan akan menjadi input mesin pencari gambar terbalik untuk gambar itu. Basis data TinEye, misalnya, berisi sekitar 39,6 miliar gambar yang diindeks pada bulan Februari 2020, yang berarti mereka menjalankan algoritme pada banyak gambar dan menyimpan semua sidik jari untuk membandingkan gambar yang dicari.

Membalikkan Database Pencarian Gambar

Bagian utama kedua dari algoritma ini adalah menemukan gambar mana yang serupa. Ketika Anda mengunggah gambar, itu akan melalui algoritma sidik jari mesin pencari gambar terbalik. Mesin pencari akan mencoba menemukan entri dengan sidik jari terdekat, yang dikenal sebagai "jarak gambar." Menentukan faktor mana yang harus dibandingkan dan berapa berat juga tergantung pada setiap mesin pencari, tetapi terutama bertujuan untuk menemukan jarak total gambar sedekat mungkin dengan nol.

Bagaimana dengan pembelajaran mesin / AI?

Berkat teknik sidik jari / pengindeksan yang dijelaskan di atas, pencarian gambar terbalik cukup baik bahkan sebelum praktis untuk menerapkan AI padanya. Karena AI sangat bagus dalam pemrosesan gambar, banyak mesin pencari utama menggunakan jaringan saraf convolutional (CNN) untuk membantu mengekstraksi dan menandai fitur. Google, misalnya, dapat menggunakan CNN dalam pencarian gambar terbalik, yang memungkinkannya menghasilkan kata kunci gambar potensial dan menghasilkan hasil web dan gambar yang relevan, seperti yang telah mereka lakukan pada Foto Google selama beberapa waktu.

Membalikkan pencarian gambar, jaringan saraf convolutional

Ini membutuhkan pencarian gambar terbalik, langkah di atas ekstraksi fitur sederhana dan jarak gambar. Jaringan saraf convolutional pada dasarnya menjalankan gambar melalui berbagai filter yang memetakan berbagai jenis fitur, kemudian mencoba untuk mengklasifikasikannya berdasarkan pelatihan sebelumnya. Itu penyederhanaan yang berlebihan, tentu saja, tetapi cukup untuk mengatakan bahwa CNN membuat pencarian gambar jauh lebih akurat dan berguna dan kemungkinan sedang diterapkan bersama metode sidik jari visi komputer yang lebih lama.

Apa mesin pencari gambar terbalik terbaik?

Membalikkan Pencarian Gambar Google Mestia

Algoritme yang berbeda berarti mesin pencari gambar yang bagus untuk hal-hal yang berbeda, meskipun semuanya akhirnya mengarah ke tujuan yang sama: menemukan kecocokan untuk gambar yang Anda unggah. Gambar Google Ini memiliki tingkat keberhasilan yang cukup baik, misalnya, tetapi membuat banyak "tebakan yang lebih baik", memberi Anda banyak foto yang serupa tetapi tidak identik. Itu bagus jika Anda mencari suasana atau kategori umum, tetapi mesin menyukainya TinEye jauh lebih fokus pada menemukan gambar yang identik, bahkan jika mereka sangat diedit, dan bahkan dapat mengidentifikasi gambar dalam foto, yang membuatnya sedikit lebih baik jika Anda membutuhkan kecocokan yang tepat.

Pencarian Gambar Di Balik Mestia Tiney

Mesin pencari Rusia Yandex juga terkenal karena memiliki alat pencarian gambar yang sangat baik, meskipun dapat diprediksi bahwa itu akan cenderung melakukan yang terbaik pada mata pelajaran Rusia. Alat-alat seperti Pixsy dan ImageRaider fokus pada mengidentifikasi contoh penggunaan yang tidak sah, sehingga mereka cenderung menyertakan lebih banyak fitur seperti peringatan dan fokus pada pemantauan perpustakaan foto pengguna.

Karena algoritme berubah sepanjang waktu dan umumnya terkunci, sebaiknya periksa beberapa mesin berbeda jika tidak ada yang mengembalikan hasil yang Anda inginkan.

Kredit gambar: Kukus dari jalanan Kota New York, Ikon basis data DB

Apakah artikel ini bermanfaat? Jika tidak

Pos terkait

Back to top button