Tekniska bloggspel, Android-app-apk, tips och tricks

Microsofts nya AI-teknik kan kommentera bilder precis som en människa

Microsofts nya bildtextningsteknik för AI

Ända sedan forskare började arbeta med artificiell intelligens (AI) har ett av huvudmålen alltid varit ett avancerat bildtextningssystem. Många företag investerar sina värdefulla resurser i AI för att utveckla bättre och bättre produkter. Nu har Microsoft lanserat ett nytt AI-system som kan kommentera och beskriva bilder mer exakt än vad människor kan.

Redmond-jätten tillkännagav nyligen detta genombrott genom ett officiellt blogginlägg. Samtidigt som att skapa bildtexter är en av de svåraste uppgifterna för ett AI-system, säger Microsoft att dess nya “Picture Enhancement” AI är kapabel att texta bilder såväl som en människa. Och detta genombrott inom AI-teknik kommer att hjälpa företaget att driva ut sina produkter och tjänster på marknaden.

Bildtexter när de är som bäst

Nu låter det inte som en stor grej att skapa automatisk bildtextning, men tro mig. Denna fiffiga teknik hjälper användare att komma åt innehållet i en bild, oavsett om det är i ditt bibliotek eller någonstans i ett 5-sidigt dokument. Till exempel, när du söker efter “hund” i ditt bildbibliotek, använder den angivna applikationen sina bildigenkänningsfunktioner för att sortera varje bild med en hund i den och sedan samla in den. Begränsa sökningen. Detta är en av många uppgifter som kräver att systemet har utmärkta bildigenkänningsmöjligheter.

Microsofts nya modell kan skapa bättre bildtexter än sina föregångare. Och dessa bildtexter liknar egentligen vad en människa skulle skriva för att beskriva bilden.

Microsoft Image AI 1

Så, som du kan se, är den nya AI “Enhanced Image Caption” i bildbeskrivningen mycket mer exakt än tidigare. Dessutom kan denna nya modell till och med känna igen sammanhanget i en bild. Kolla in den här andra bilden.

Microsoft Visual AI 2

I bilden ovan gav det tidigare systemet en vag beskrivning utan att ange vad spelaren gjorde. Den nya modellen lär sig dock att spelarna firar och faktiskt är fotbollsspelare, inte basebollspelare!

Tillgänglighet: För synskadade

Nu är den här möjligheten att texta bilder mycket användbar för användare, men de människor för vilka denna teknik betyder mest är de som är blinda eller har nedsatt syn. Dessa personer måste lita på röstkommandon när de navigerar genom datorsystemet. Så bildtexter gör det lättare för dem att bläddra igenom sociala medier eller meddelanden.

“Användningen av bildtexter för att skapa fotobeskrivningar, känd som alt-text, på en webbsida eller ett dokument, är särskilt viktigt för personer som är blinda eller har nedsatt syn.” Saqib Shaikh, Director of Software Engineering på Microsofts AI-division i Redmond.

Som ett resultat är Windows-tillverkaren nu integrerar detta nya AI-system för bildtextning i sin app för talande kamera, See AI, speciellt framtagen för synskadade. Appen använder AI:s bildkommentarfunktioner för att beskriva bilder i användarnas mobila enheter och även i sociala medieprofiler.

Förutom integrationen i See AI-applikationen tillhandahåller Microsoft även ett nytt AI-system för Azure AI-applikationer. Det finns för närvarande som en del av Azure Cognitive Services Computer Vision och utvecklare kan använda dess funktioner i sina egna appar och tjänsterom de vill.

Dessutom kommer AI-bildanteckningsteknik också att komma till Microsoft Office-applikationer, som Microsoft Word, PowerPoint och Outlook, senare i år.

Table of Contents