Tekniska bloggspel, Android-app-apk, tips och tricks

Hur fungerar den omvända bildsökningen?

Din genomsnittliga bild kan vara värd mindre än tusen ord – det finns bara så mycket du kan lära dig av selfies. Men ibland behöver du bara veta var en bild kommer ifrån, oavsett hur många ord som är värdefulla.

För det finns det omvända sökmotorer som tillhandahålls av människor som Google, TinEye, Bing, Yandex, Pixsy och många fler. Eftersom du inte gav några ord i din begäran, hur vet de vad de ska leta efter? Och viktigast, hur hittade de det? Hur varje sökmotor för omvänd bild fungerar varierar och de håller sin algoritm dold, men grundidén är där och inte så svår att förstå.

fingeravtryck

Faktiska bilder kan vara mer unika än mänskliga fingeravtryck, eftersom möjligheten för två bilder som innehåller exakt samma pixelarrangemang är mycket liten, medan sannolikheten för en fingeravtryckskollision är cirka 64 miljarder – en relativt god chans. Men hur fingeravtryckar du en bild? Stegen varierar beroende på algoritmen, men de flesta av dem följer samma grundläggande formel.

Först måste du mäta bildfunktioner, som kan inkludera färger, texturer, lutningar, former, förhållanden mellan olika bildstycken och till och med saker som Fourier Transforms (metoden för att dela en bild i sines och kosinus).

Låt oss säga att vi letar efter följande bild och vi behöver fingeravtrycket.

Omvänd bildsökning för New York Street

För att göra det kan vi bland annat använda histogrammer för bildfärger, Fourier-omvandlingar och texturkartor, som du alla kan se nedan.

Omvänd färg Histogram Bildsökning Vänd Sök efter Fourier-bilder Texturkarta för omvänd bild

Om bilden ändras, suddas, roteras eller manipuleras kommer det att finnas ett antal algoritmer som använder funktionerna ovan och andra för att försöka hitta en hit.

Kodning, sparande och sökning

Varje bildfunktion i ett fingeravtryck kan kodas som en sträng med bokstäver och siffror, som enkelt lagras och indexeras i en databas. Oavsett vilken kombination av funktioner som extraheras och lagras är en sökmotorpost för omvänd bild för den bilden. TinEye-databasen innehåller till exempel cirka 39,6 miljarder bilder indexerade i februari 2020, vilket innebär att de kör sin algoritm ovanpå många bilder och lagrar alla fingeravtryck för att jämföra de sökta bilderna.

Omvänd bildsökningsdatabas

Den andra huvuddelen av algoritmen är att ta reda på vilka bilder som liknar. När du laddar upp en bild går den igenom sökmotorns fingeravtrycksalgoritm för den omvända bilden. Sökmotorn försöker sedan hitta posten med närmaste fingeravtryck, kallat “bildavstånd.” Att bestämma vilka faktorer som ska jämföras och hur vikten också beror på varje sökmotor, men syftar mest till att hitta det totala bildavståndet så nära noll som möjligt.

Vad sägs om maskininlärning / AI?

Tack vare fingeravtryck / indexeringstekniken som beskrivs ovan är omvänd bildsökning ganska bra även innan det är praktiskt att använda AI på det. Eftersom AI är väldigt bra på att bearbeta bilder, används saker som convolutional neuralnät (CNN) troligen av många stora sökmotorer för att hjälpa till att extrahera och märka funktioner. Google kan till exempel använda CNN i omvänd bildsökning, vilket gör det möjligt att producera möjliga nyckelord för bilder och producera relevanta webb- och bildresultat, som de har gjort på Google Photos under en längre tid.

Omvänd bildsökning, indragna nervnätverk

Detta kräver omvänd bildsökning, ett steg över den enkla funktionen extraktion och bildavstånd. Konvolutional neurala nätverk kör i princip bilder genom flera filter som kartlägger flera typer av funktioner och försök sedan klassificera dem baserat på tidigare utbildning. Det är naturligtvis en överförenkling, men det räcker med att säga att CNN gör bildsökning mycket mer exakt och användbar och förmodligen genomförs i samband med äldre datorsyn fingeravtrycksmetoder.

Vad är den bästa sökmotorn för omvänd bild?

Omvänd Google Mestia Image Search

En annan algoritm betyder en bra bildsökmotor för olika saker, även om alla till slut syftar till samma mål: hitta en matchning för den bild som du laddar upp. Google bilder har till exempel en ganska bra träffhastighet men gör en hel del “bästa gissningar”, vilket ger dig massor av foton som är liknande men inte identiska. Det är bra om du letar efter en allmän stämning eller kategori, men maskinen gillar det TinEye mycket mer fokuserad på att hitta identiska bilder, även om de är mycket redigerade, och kan till och med identifiera bilder på foton, vilket gör det lite bättre om du behöver rätt matchning.

Bildsök bakom Mestia Tiney

Den ryska Yandex-sökmotorn är också känd för att ha ett utmärkt bildsökningsverktyg, även om det kan förutsägas att göra det bäst på ryska ämnen. Verktyg som Pixsy och ImageRaider fokuserar på att identifiera förekomster av obehörig användning, så de tenderar att inkludera fler funktioner som varningar och fokusera på att övervaka användarens fotobibliotek.

Eftersom algoritmen ändras hela tiden och i allmänhet är låst är det en bra idé att kontrollera flera olika maskiner om ingenting ger de resultat du vill ha.

Bildkredit: Ånga från New York Citys gator, DB-databasikonen

var den här artikeln hjälpsam? Ja Nej