Ir al contenido principal

EasyVr Speech Recognition Module

Hablemos un poco del "EasyVR Speech Recognition Module" o mejor conocido como el modulo de reconocimiento de voz.

Les dire lo basico que necesitan saber de este modulo, asi como tambien algunas caracteristicas importantes el momento de estar "jugando" con el modulo.

Primero y talvez los mas importante ¿Que es el modulo EasyVr?


Se trata de un potente módulo de bajo coste para el 
reconocimiento de voz y reproducción de sonidos. Es la 

versión mejorada y actualizada del VRbot de la firma VeeaR.  

Las voces a reconocer pueden estar 
predefinidas y grabadas internamente. Se dice que sonvoces independientes del micrófono (SI). También se puede grabar y reconocer voces definidas por el propio usuario y en cualquier idioma. En este caso se tratan de voces dependientes del micrófono (SD), que se supone previamente han sido “enseñadas” y grabadas en la memoria interna del módulo.




Caracteristicas:



Se pueden destacar las más relevantes:

  • 26 comandos y voces pre-programados (SI) en: en inglés, italiano, japonés, alemán,francés y español
  • Admite hasta 32 comandos y sus correspondientes voces definidas por el usuario (SD) en cualquier idioma
  • Los comandos y voces SD se pueden organizar en hasta 16 grupos
  • Se dispone de un interface gráfico de usuario (GUI) para Windows que permite una rápida familiarización con el uso del módulo.
  • El módulo se puede conectar fácilmente con cualquier tipo de controlador mediante una sencilla comunicación serie.
  • Dispone de un potente protocolo de comandos para el desarrollo de cualquier aplicación basada en el reconocimiento de voz.
  • Alimentación de 3.3V a 5V
  • 3 líneas de E/S o GPIO (IO1, IO2 e IO3) que se controlan directamente mediante los comandos correspondientes
  • Salida PWM de audio que admite la conexión con un altavoz de 8 Ω
  • Capacidad de reproducción de hasta 9 minutos de sonidos y/o voces
  • Se suministra junto con un CD-ROM que contiene el presente documento y una serie de 
  • librerías y ejemplos de aplicación para PIC16F88X desarrollados por Ingeniería de
  • Microsistemas Programados

Aplicaciones:




Son numerosas las posibles aplicaciones del módulo de reconocimiento EasyVR. Algunas sugerencias:
  • Sistemas de control de propósito general que se deseen gobernar mediante voz
  • Automatización de aplicaciones en el ámbito doméstico
  • Control de acceso por voz
  • Sistemas robóticos controlados por voz

Especificaciones tecnicas/electricas:



La siguiente figura muestra las dimensiones físicas del módulo EasyVR así como la disposición de las señales que se explican en la siguiente tabla.






 EasyVR Commander: EL INTERFACE GRAFICO DE USUARIO (GUI)

Se trata de una aplicación para WINDOWS que permite usar y configurar el módulo EasyVR de una forma muy sencilla e intuitiva. 

Estableciendo la comunicación

Una vez instalado el programa EasyVR GUI y realizadas las conexiones eléctricas entre el módulo y
el COMx del PC, ejecutamos la aplicación. Nos aparecerá una ventana de trabajo como la mostrada en la siguiente figura.


En el ángulo superior izquierdo tenemos un desplegable que permitirá seleccionar el canal COM disponible en nuestro PC. También disponemos de dos botones para la conexión/desconexión de la comunicación entre el módulo EasyVR y el PC.

En la parte superior central existen una serie de botones con las diferentes tareas que podemos realizar con el módulo: añadir/editar/borrar comandos, enseñanza de las voces asociadas a los comandos, reconocimiento de esas voces, reproducción de sonidos, etc. Cada vez que se establece la comunicación el software EasyVR Commander lee el contenido del módulo en su totalidad y lo traslada a las diferentes áreas de trabajo: el área de grupos y el área de comandos.

En el área de grupos aparecen los grupos 0-16 disponibles para almacenar las voces definidas por el usuario (SD) y otros tres grupos llamados “Wordset 1-3” donde están almacenadas las voces pregrabadas o voces SI. Al lado de cada grupo aparecerá también el no de voces que contiene el mismo. Se recuerda que en el módulo se pueden grabar un TOTAL de 32 voces SD definidas por el usuario. Lo que pasa es que estas voces se pueden almacenar o clasificar en diferentes grupos si fuera necesario. Abajo del todo hay un último grupo, SoundT, donde se pueden almacenar diferentes sonidos digitalizados para su posterior reproducción.

En el área de comandos se Editan/Visualizan las etiquetas o comandos asociados a las voces y qué posición ocupan dentro de un determinado grupo. Un comando o etiqueta no es ni más ni menos que una cadena ASCII de hasta 32 caracteres. Toda etiqueta o comando debe estar asociado a una voz o viceversa, durante la fase de enseñanza. De esta forma, cuando el módulo reconozca una voz, devuelve el comando o etiqueta asociada a la misma. Sólo se admiten etiquetas formadas por los caracteres ASCII en mayúsculas desde la A a la Z.


En futuras entradas tratare de explicar como usamos el EasyVR en nuestro proyecto así como también de la explicación de mas hardware de nuestro proyecto.


LIGAS UTILIES
http://www.veear.eu/Products/EasyVR.aspx

Comentarios

  1. Podría psarme un esquema de comunicacion con el puerto com?
    jloza33@hotmailcom
    Un saludo

    ResponderEliminar

Publicar un comentario

Entradas populares de este blog

Pequeño Juego con LEDS y Dip Switch

Siguiendo con los mini-proyectos, lo que quería hacer originalmente era un tipo "candado" con push-button y LEDs, el objetivo seria, meter la combinacion de botones correcta y los LEDS encendería por un motivo practico, en forma de serpiente. El objetivo no cambio, pero por falta de "material" lo hice con un dip switch de X entradas(depende de que tan grande quieras la combinación). CONOCIMIENTOS(max. 7 estrellas): Electronica:     ★ ★ Programación: ★ ★ Juego de Combinación + LEDs El programa es un poco mas complicado que el mini-proyecto pasado , pero aun asi es basico. Guardamos las salidas de los LEDs en un arreglo, despues con los valores recibidos y comparados de los dip switch jugamos con los LEDś. Hardware Requerido (1) Arduino Uno (6) LED (8) Resistencias 330 Ω (1) Dip Switch Circuito Usamos las salidas del ARduino 2-7 para los LEDS Usamos la salida A5, A4 para el dip switch Para hacer prender los LEDS tienes que encontrar la ...

Tarea #2 - LAB Visión - Sal y Pimienta - Procesamiento de imagenes - Python

Que tal para esta entrada se nos encargo  modificar  o agregar a nuestro código, una rutina que agregara degradación por adición de ruido(Sal y pimienta) base a dos parámetros: Intensidad = que tanto porcentaje de la imagen se le agregara sal y pimienta Polarización = que tan negros/blancos se pone un pixel seleccionado. y otra rutina que quitara filtrara ese ruido. Antes de comenzar Mi programa se esta empezando a poner " FEO " son demasiados métodos y por cada tarea esta creciendo considerablemente, pese a esto, esta sera la ultima entrada que estaré modificando este código, el las siguientes trabajare por clases.  El los avances de la tarea están en mi  github . Un poco de teoría Les comparto información de relevante que me ayudo a despejar dudas, al final de la entrada en el apartado de REFERENCIAS pondré los links de TODA esta información. El RUIDO en las imágen...

Tarea #5 - Codigo Hamming - Python

Codigo hamming Liga al repo Teoria segun wikipedia Antes de los códigos Hamming se utilizaron ciertos códigos detectores de error, como lo fueron el código linteing, pero ninguno llegó a ser tan eficaz como los de Hamming. A continuación se describen algunos de estos códigos. Paridad   La   paridad   consiste en añadir un bit, denominado   bit de paridad , que indique si el número de los bits de valor 1 en los datos precedentes es par o impar. Si un solo bit cambiara por error en la transmisión, el mensaje cambiará de paridad y el error se puede detectar (nótese que el bit donde se produzca el error puede ser el mismo bit de paridad). La convención más común es que un valor de paridad   1   indica que hay un número impar de unos en los datos, y un valor de paridad de   0   indica que hay un número par de unos en los datos. info. completa y un vídeo que me ayudo mucho para esta tarea: (TIENEN QUE VERLO - OBLIGATORIO) http://www.you...