Conozca a Simon, el motor de reconocimiento de voz de Linux

Simon para Linux es lo que Siri es para iOS. Bueno, probablemente no lo sea, pero además de que ambos tienen nombres que empiezan con una «S», ambos escuchan lo que tienes que decir. La diferencia es que Simon es mucho más controlable. Puede ser totalmente entrenado para reconocer comandos de voz, lo que puede ser una ayuda útil para los usuarios con discapacidades o incluso para aquellos que prefieren controlar sus sistemas con sus voces.

Simon es:

  • un programa de reconocimiento de voz de código abierto y sustituye al ratón y al teclado.
  • diseñado para ser muy flexible y permite la personalización para cualquier aplicación en la que se necesite el reconocimiento de voz.
  • un proyecto europeo potencial de «e-inclusion» debido a la programación independiente del idioma.
  • en desarrollo para personas con discapacidades físicas y personas mayores para darles la posibilidad de chatear, escribir correos electrónicos, navegar por Internet, hacer banca por Internet y mucho más.

(de simonlistens.org )

Obteniendo a Simon

Simon está escrito en Qt y depende del fonón, por lo que probablemente sea mejor instalarlo en sistemas basados en KDE (plasma), a menos que no te importe que se introduzcan ~300MB de dependencias con la instalación (en un sistema Kubuntu 15.04, Simon sólo ocupa 55 Mb). Simon está en los repositorios de Ubuntu, así que instalarlo sería tan fácil como

sudo apt-get install simon

en cualquier distribución basada en Ubuntu. En Linux Mint (o en otras distribuciones), si encuentra que Simon no puede conectarse después de la instalación, tendrá que instalar libqt4-sql-lite

sudo apt-get install libqt4-sql-sqlite

Si desea utilizar Modelos acústicos HTK , también deberá instalar el HTK. Esto es opcional, y si usted no sabe lo que esto significa, o simplemente no necesita usarlo, puede omitirlo con seguridad. Desafortunadamente HTK sólo está disponible como código fuente, pero estas sencillas instrucciones harán que las instalaciones sean sencillas.

Simon Listens

Simon no es fácil de configurar ni de usar. Para ayudarte a que te escuche, una configuración asistida te saluda en la primera carrera, guiándote a través del proceso.

En primer lugar, es necesario configurar escenarios.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Los escenarios son paquetes completos que le permitirán utilizar Simon para propósitos específicos. También proporcionan lo que se conoce como un modelo lingüístico, describiendo todas las palabras existentes y qué frases son gramaticalmente correctas, al menos en estas circunstancias.

Por defecto, sólo tiene instalado un escenario estándar. Desde esta pantalla puede crear o cargar más e incluso descargar algunos con el instalador de complementos de Simon («Abrir -> Descargar»).

Conozca a Simon, el motor de reconocimiento de voz de Linux

A continuación, necesitará un modelo acústico o de voz. Esto básicamente le dice a Simon cómo suenan las palabras individuales.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Si tienes HTK instalado, puedes crear tu propio modelo y entrenar a Simon para que reconozca la forma tan específica en que hablas. Si no tiene HTK o no quiere usarlo, puede descargar modelos base estáticos («Open Model -> Download») que le proporcionarán a Simon patrones acústicos predefinidos.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Si va con un modelo estático, puede optar por adaptarlo más tarde con muestras de entrenamiento.

En la página de configuración del servidor, si va a instalarlo localmente y planea usarlo regularmente, puede dejar las opciones predeterminadas activadas. Si el servidor se encuentra en otro lugar, aquí es donde puede definirlo.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Necesita configurar dispositivos de grabación y reproducción de sonido,

Conozca a Simon, el motor de reconocimiento de voz de Linux

pruebe su micrófono,

Conozca a Simon, el motor de reconocimiento de voz de Linux

y estás listo para usar a Simon.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Desde la pantalla principal, puede gestionar sus escenarios cargados o abrir uno específico.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Después de abrir un escenario, puede ver y modificar el vocabulario y la gramática, entrenar el modelo acústico, modificar la dependencia del contexto del escenario y establecer comandos directos.

Conozca a Simon, el motor de reconocimiento de voz de Linux

El asistente de formación también se puede iniciar desde la pantalla de resumen; no es necesario entrar en la configuración del escenario.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Conozca a Simon, el motor de reconocimiento de voz de Linux

En la pantalla de resumen también tiene la oportunidad de cambiar la configuración de audio (hardware) o configurar el modelo acústico (voz), incluyendo la adición de nuevos modelos.

Conozca a Simon, el motor de reconocimiento de voz de Linux

Ayuda adicional usando Simon

El uso de Simon está lejos de ser sencillo. Se necesita una buena cantidad de aprendizaje, capacitación y acostumbrarse. Afortunadamente hay una documentación bastante extensa disponible en línea. El KDE userbase ofrece ayuda con lo básico, y el Manual de Simón está disponible como archivo PDF. El blog Simon Listens también proporciona información, aunque las entradas están bastante desactualizadas (la última entrada fue en 2013). El sitio ofrece algunas lecturas adicionales, y usted puede aprender acerca de las soluciones de negocio controladas por voz impulsadas por Simon en su página web comercial.

Aunque puede llevar algún tiempo configurar y dominar, Simon puede transformar cualquier ordenador Linux (e incluso Windows) en un entorno controlado por voz, ya sean necesidades especiales o simplemente la comodidad para la que desee utilizarlo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *