Google leert computer foto's beschrijven
"De ontwikkeling van kunstmatige intelligentie gaat sneller dan veel mensen denken", zei Bill Gates onlangs in NTR College Tour. Dat blijkt ook nu weer uit een opmerkelijke ontwikkeling bij Google: wetenschappers zijn erin geslaagd een computerprogramma te maken dat in normaal Engels kan beschrijven wat er op een foto is te zien.
Computers kunnen al een tijdje heel aardig objecten op een foto herkennen, maar dat is niet genoeg om een fotobijschrift te schrijven: de computer moet ook begrijpen wat de dingen op de foto met elkaar te maken hebben. Ook moet de computer zinnen kunnen schrijven in normale mensentaal.
Trainen
De wetenschappers creëerden een systeem met de nieuwste technologieën op het gebied van beeldherkenning en tekstgeneratie. Vervolgens kreeg het systeem tienduizenden foto's inclusief bijschrift geschreven door mensen te zien.
Dankzij kunstmatige intelligentie ontdekt het systeem zelf patronen. Het kan bijvoorbeeld zijn dat de computer een ding ziet dat er op veel foto's min of meer hetzelfde uitziet en dat in het bijschrift van al die foto's het woord "kat" voorkomt. Zo leert de software wat een kat is.
Zo'n systeem kan slechtzienden helpen bij het begrijpen van foto's.
Het systeem werkt opvallend goed, maar niet vlekkeloos, geven de wetenschappers toe. Zo laten ze zien dat een fietser wordt aangezien voor een skateboarder en denkt het systeem dat een gele auto een schoolbus is.
De oplossing is simpel: het systeem moet meer foto's met correcte bijschriften onder ogen krijgen om verder te leren.
"Zo'n systeem kan slechtzienden helpen bij het begrijpen van foto's", schrijven de Google-wetenschappers op hun blog, "of foto's vervangen door tekst in delen van de wereld waar internetverbindingen traag zijn."
Of en wanneer deze technologie zijn weg vindt naar consumenten, is niet duidelijk.