Google : les applications pourront bientôt « voir » et « comprendre » les photos

Google a récemment publié de nouvelles interfaces de programmations, lesquelles pourraient permettre de concevoir de nouvelles applications.

A l’instar de Microsoft ou Yahoo, la division chargée des travaux d’intelligence artificielle de Google s’intéresse aussi à l’identification automatique des contenus. La vision artificielle – ou Cloud Vision selon Google – permet non seulement l’analyse des visages mais aussi d’identifier précisément le contenu d’une image.

Les Google Cloud Vision API sont disponibles en « Limited Preview » et permettent de déterminer le sujet d’une image, d’effectuer une reconnaissance de caractères en extrayant le texte ou d’identifier les contenus jugés inappropriés. Les applications embarquant ces interfaces de programmation seront également en mesure de repérer les monuments ainsi que les logos de marques.

Pour ce qui est de la détection de visage, l’algorithme peut analyser la position des yeux, du nez ou de la bouche, mais également les associer à des sentiments humains comme la joie ou la tristesse. Google précise : « Nous ne prenons pas en charge la reconnaissance faciale et nous ne sauvegardons aucun élément de la détection de visages sur aucun serveur chez Google ».
A l’avenir ces API devraient donc donner naissance à une série d’applications Web ou mobiles un peu plus « intelligentes ».

Le mois dernier, Microsoft Research avait dévoilé ses nouveaux travaux en la matière avec un algorithme calquant le fonctionnement du cerveau humain, c’est-à-dire en étant capable d’éliminer rapidement les éléments jugés les moins pertinents pour traiter une question afin de se concentrer sur la zone principale d’analyse.