Saltar al contenido

Cloud Visión API para el reconocimiento de imágenes en apps

Dic 4, 2015

El equipo de Google ha notificado el lanzamiento de Google Cloud Visión API que tiene como objetivo enriquecer la forma en que los desarrolladores pueden trabajar con imágenes en sus apps, ya que permite comprender y hacer un análisis del contenido de las mismas.

Cloud Visión API clasifica las imágenes de una forma rápida en miles de categorías, detecta desde caras, emoticones, atributos faciales, lugares hasta animales, de esta manera puede hacer la clasificación automática de las imágenes en miles de categorías. También reconoce textos escritos en diferentes idiomas a través de OCR.

reconocimientoCon esta API los desarrolladores pueden crear metadata en el catalogo de imágenes, eso permite crear nuevos escenarios de búsquedas o recomendaciones que estén basadas en imágenes. Las funciones son muchas y pueden ser combinadas para diversos propósitos como por ejemplo, permite detectar contenido inapropiado dentro de una imagen, logos de productos o servicios populares, entre otros.

Hay algunas herramientas especificas que los desarrolladores pueden tomar para hacer sus aplicaciones aun mas inteligentes como algunas de las siguientes:

  • Reconocimiento óptico de caracteres.
  • Etiqueta / Detección de entidad.
  • Caja de seguridad y detección de búsqueda.
  • Detección Facial.
  • Detección de Landmark.
  • Detección de logotipo.

Como se sabe, la detección y reconocimiento es por ahora considerado una etapa en desarrollo. Con el uso de esta API los desarrolladores pueden enseñar varias piezas de software para responder a estos indicadores con una serie de acciones preprogramadas. Pero esto no quiere decir que sea solo a nivel de software, puede ser utilizado también para controlar a un robot de fabricación casera, como por ejemplo el robot de demostración Raspberry Pi.

drone, reconocimiento facialEste robot puede reconocer objetos y decir lo que son, puede reconocer expresiones y otras habilidades mas. Aunque este robot es un demo básico, podríamos no estar muy lejos de que en el futuro, estos robots adapten mejores capacidades y mejoras en reconocimiento y detección.

Las grandes empresas están utilizando este tipo de tecnología, una de las empresas es AeroSense, una subsidiaria de Sony Mobile. Que utiliza la API para hacer una organización en las fotos que son tomadas por sus drones.

aerosenses Drone

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies