Google crea reconocimiento de voz sin conexión a Internet 7 veces más rápido que los sistemas en línea

0
614

La compañía del buscador más rápido ha desarrollado un sistema de reconocimiento de voz que funciona sin conexión a Internet y es considerablemente más rápido y más acertado, si se le compara con el que requiere de conexión a Internet. Mientras que los datos investigativos son más teóricos, el sistema ya funciona, según se ha comprobado al haber sido instalado en un Nexus 5.

Google crea sistema controlado por voz y sin conexión a Internet

Actualmente, la app de Google para Android posee muy pocas capacidades si se encuentra desconectada de Internet. Los comandos más complejos o avanzados necesitan ser enviados y procesados por un servidor. Esto resulta en presencia de alta latencia o en muchas ocasiones, fracaso total debido a las poco confiables redes, ya sean móviles o de otro tipo.

La alternativa a esto es “la adjunción de un sistema de reconocimiento de voz que corra de manera local en los dispositivos móviles”. Sin embargo, tal sistema puede no ser acertado y pudiera consumir una considerable cantidad de memoria, así como también tendría que valerse de otros recursos del dispositivo.

El sistema ya ha sido probado en smartphones

Usando distintas técnicas de aprendizaje en máquinas, Google ha creado un sistema de tan sólo 20,3 megabytes que es 7 veces más rápido que aquel que funciona solamente cuando está conectado a Internet y posee un porcentaje de mala interpretación de las palabras de 13,5 por ciento. Fue probado en un Nexus de dos años de antigüedad, que cuenta con un procesador quad-core de 2,26 Ghz de potencia y 2 gigabytes de RAM.

Reconocimiento de voz sin internet

Para lograr que esta aplicación tuviera ese tamaño y poder ser ahorrativo en cuánto a los recursos, el sistema utiliza un modelo simple para el dictado y los comandos por voz. Las técnicas de comprensión adicionales se usaron más adelante para empequeñecer al archivo. Al sistema se le entrenó usando más de 3 millones de muestras de voz (Por aproximadamente 2000 horas) desde la búsqueda de Google. Cada muestra de voz tuvo 20 versiones distorsionadas creadas por el ruido de extracción de videos de YouTube.

No hay comentarios

Dejar una respuesta