El equipo de Google ha notificado el lanzamiento de Google Cloud Visión API que tiene como objetivo enriquecer la forma en que los desarrolladores pueden trabajar con imágenes en sus apps, ya que permite comprender y hacer un análisis del contenido de las mismas.
Cloud Visión API clasifica las imágenes de una forma rápida en miles de categorías, detecta desde caras, emoticones, atributos faciales, lugares hasta animales, de esta manera puede hacer la clasificación automática de las imágenes en miles de categorías. También reconoce textos escritos en diferentes idiomas a través de OCR.
Con esta API los desarrolladores pueden crear metadata en el catalogo de imágenes, eso permite crear nuevos escenarios de búsquedas o recomendaciones que estén basadas en imágenes. Las funciones son muchas y pueden ser combinadas para diversos propósitos como por ejemplo, permite detectar contenido inapropiado dentro de una imagen, logos de productos o servicios populares, entre otros.
Hay algunas herramientas especificas que los desarrolladores pueden tomar para hacer sus aplicaciones aun mas inteligentes como algunas de las siguientes:
- Reconocimiento óptico de caracteres.
- Etiqueta / Detección de entidad.
- Caja de seguridad y detección de búsqueda.
- Detección Facial.
- Detección de Landmark.
- Detección de logotipo.
Como se sabe, la detección y reconocimiento es por ahora considerado una etapa en desarrollo. Con el uso de esta API los desarrolladores pueden enseñar varias piezas de software para responder a estos indicadores con una serie de acciones preprogramadas. Pero esto no quiere decir que sea solo a nivel de software, puede ser utilizado también para controlar a un robot de fabricación casera, como por ejemplo el robot de demostración Raspberry Pi.
Este robot puede reconocer objetos y decir lo que son, puede reconocer expresiones y otras habilidades mas. Aunque este robot es un demo básico, podríamos no estar muy lejos de que en el futuro, estos robots adapten mejores capacidades y mejoras en reconocimiento y detección.
Las grandes empresas están utilizando este tipo de tecnología, una de las empresas es AeroSense, una subsidiaria de Sony Mobile. Que utiliza la API para hacer una organización en las fotos que son tomadas por sus drones.