Buscador

Mostrando entradas con la etiqueta Reconocimiento voz. Mostrar todas las entradas
Mostrando entradas con la etiqueta Reconocimiento voz. Mostrar todas las entradas

lunes, 27 de mayo de 2019

Consulta sobre clase para hipoacúsicos

Hace unas semanas recibí la siguiente consulta:

Estimado Prof. Sergio Luján Mora, en nuestra facultad de Derecho de la Universidad Nacional del Nordeste, Argentina, estamos implementado un política de accesibilidad en diversos ámbitos y me gustaría que me aconseje en el dictado de clases con alumnos con hipoacusia, pensé en pedirle al docente dictante que utilice un micrófono inalambrico conectado a una notebook conectada a internet y utilizar el Speechnotes o similar. 
Las docentes de la cátedra suben la Bibliografía y el material de estudio al aula virtual con antelación a la clase. 
El texto producto de lo que habla el docente se proyectaría en pantalla. Cúales serían sus consejos o recomendaciones acerca de: 
a) modelo de micrófono:
b) software a utilzar, ¿ es bueno tener un software de pago como respaldo en caso de problemas de conexión con internet?, ¿cúal?
c) estragia didáctica:   
espero su valiosa colaboración
saludos cordiales

Y mi respuesta:

No te puedo recomendar un software concreto, pero han surgido muchas opciones disponibles en Internet, además de la que nombras:

https://webcaptioner.com/

https://dictation.io/

https://speechnotes.co/es/

https://speechlogger.appspot.com/es/

https://talktyper.com/

https://www.speechtexter.com/

Y la extensión para Google Chrome:

https://chrome.google.com/webstore/detail/voice-to-text/jdcdafhjjjfnkoeilnjmnadadaoehgdc

El micrófono es importante, pero quizás es mucho más importante la forma de hablar de la persona.

Te recomiendo que revises esta aplicación desarrollada en la Universidad de Alicante, quizás os pueda ayudar:

https://abilityconnect.ua.es/

Y también te recomiendo los siguientes recursos de la Universidad de Alicante sobre cómo afrontar la enseñanza de estudiantes con déficit auditivo:

Déficit auditivo. Accesibilidad Digital.


REGLAMENTO DE ADAPTACIÓN CURRICULAR DE LA UNIVERSIDAD DE
ALICANTE

Adaptación curricular de la Universidad de Alicante: Caso II: Déficit Auditivo

lunes, 19 de noviembre de 2018

Ejemplo de uso de un sistema de reconocimiento de voz

¿Se puede usar el ordenador solo con la voz? El siguiente vídeo lo muestra:



Además, este vídeo también tiene audiodescripción, es decir, aprovecha los silencios para explicar lo que se está viendo en la imagen. Y también tiene subtítulos. Y también una persona que interpreta el audio a la lengua de signos española. Con todo esto, el vídeo es accesible.

viernes, 7 de septiembre de 2018

2acces

Según el sitio web de 2acces:

2ACCES es una herramienta creada para la integración de las personas sordas. Este software facilita la accesibilidad para poder estar en igualdad de condiciones con el resto de los usuarios de cualquier sala.
Funciona mediante un software que transcribe en tiempo real todo lo que una persona comunica oralmente.


Este no es el primer sistema que conozco con esta funcionalidad, otros dos gratuitos son Web CaptionerVoice Dictation.

lunes, 13 de agosto de 2018

Herramientas gratuitas para convertir voz en texto

Hace unos días, el periódico El País publicó Cuatro herramientas gratuitas para convertir voz en texto:
Cada vez es menos habitual usar el teclado del móvil. Basta con echar un vistazo alrededor para comprobar el auge de las notas de voz frente a los mensajes de texto o las nuevas formas de preguntar a Google desde estos dispositivos. En concreto, comsCore vaticina que en 2020 la mitad de las búsquedas en Internet se harán con la voz, algo para lo que contaremos con la ayuda de asistentes personales como Siri, Sherpa, Google Now, Amazon Echo o Cortana. 
Bastará con dar una orden con la voz para obtener al instante lo que queremos, sin tener que escribir esa petición. Ahora bien, de momento estos asistentes pueden quedarse cortos si necesitamos dictarles textos para ser más rápidos a la hora de redactar largos emails, preparar discursos o ponencias o incluso transcribir automáticamente mensajes de voz (por ejemplo, la grabación de una charla que queremos tener por escrito). Para este tipo de casos, existen aplicaciones web gratuitas, basadas en tecnología de Google, que es posible utilizar sin tener que instalarlas y que además cumplen con su cometido: transformar voz en texto de forma automática. 
Eso sí, conviene repasar el texto final para pulirlo o corregir posibles errores, porque aunque estas herramientas cada vez están más afinadas y también se presentan como “asistentes personales”, al fin y al cabo siguen siendo máquinas. Además, al estar basadas en Google, sólo funcionan correctamente si utilizamos el navegador de esta compañía, es decir, Chrome.
Las herramientas son:

miércoles, 4 de julio de 2018

Voice Dictation

Voice Dictation es un sistema que permite mostrar transcripción de lo que se dice, por ejemplo en una conferencia, en tiempo real. El sistema usa el motor de Google Speech Recognition para transcribir más de 100 idiomas.

Este sistema es similar a Web Captioner que comenté hace un par de meses.

viernes, 20 de abril de 2018

Web Captioner

Impresionante la página web Web Captioner que permite mostrar transcripción de lo que se dice, por ejemplo en una conferencia, en tiempo real.


miércoles, 19 de julio de 2017

Handsfree for Web

Desde Argentina he recibido un correo electrónico de un estudiante que me anuncia el lanzamiento de Handsfree for Web:
Me presento, mi nombre es Javier Perez, vivo en Argentina y estoy a pocas semanas de recibirme de Licenciado en Sistemas. Como trabajo final de la carrera hice una chrome extension llamada Handsfree for Web. Esta permite a través de la invocación de comandos de voz, y usando la api de reconocimiento de voz que provee google chrome, ejecutar todas las acciones que una persona realiza manualmente mientras navega la web de forma oral. 
La aplicación fue lanzada hace un par de días y me gustaría mucho que se difunda ya que considero que puede ser muy util para aquellas personas que se vean impedidas de interactuar con la computadora manualmente. 
La extension por el momento soporta comandos de voz en ingles y español, y permite interactuar con todos los componentes estándares que conforman los sitios web. También soporta todo tipo de interacción con el navegador en si. (pestañas, marcadores, descargas, historial...) 
Si bien la aplicación fue recientemente lanzada, y esta en una version inicial, no es un prototipo, la misma soporta cientos de comandos que permiten realizar todo tipo de acciones en la compleja web actual sin necesidad de instalación de algún software complementario. 
Es importante mencionar que la extensión es libre y gratuita sin ningún tipo de limitación en el uso. El procesamiento de voz se realiza en la nube, concretamente en los servidores de google, por lo que ademas es super liviana, no tiene requerimientos de hardware, solo el navegador google chrome y una conexión a internet es requerido.
En su página web tiene publicado el siguiente vídeo de demostración:

miércoles, 1 de febrero de 2017

Conversación con una usuaria de un sistema de reconocimiento de voz

En los últimos días he tenido un intercambio de correos electrónicos con una estudiante de mi curso en línea iDESWEB:

CORREO ESTUDIANTE 1

Quisiera aprovechar este e-mail para destacar dos aspectos relevantes del curso: en primer lugar, al ser online tiene la ventaja de poder hacerse al ritmo de uno y desde cualquier parte del mundo. Yo lo he hecho desde Chile. En segundo lugar, agradecerle mucho la transcripción de sus clases. Ha sido de gran ayuda para poder seguir su curso, ya que, debido a una discapacidad en mis extremidades superiores, no puedo teclear el ordenador, ni siquiera escribir a mano, por lo que tomar apuntes es algo complicado. Así que la transcripción del contenido de los tutoriales me ha facilitado muchísimo las cosas. Afortunadamente, puedo controlar el computador con un programa de voz, pero hay cosas que no puedo hacer o me resultan muy complicadas.

Ojalá sigan utilizando el mismo método, para que personas con limitaciones como yo puedan también formarse y disfrutar de estos cursos.

MI RESPUESTA 1

¿Me puedes contar más cosas sobre tu situación? ¿Qué discapacidad es? ¿Usas Dragon Naturally Speaking? ¿Para qué has usado las transcripciones?

CORREO ESTUDIANTE 2

Padezco una enfermedad rara, cuya causa los médicos no conocen y, por tanto, sólo me pueden tratar los síntomas. Sufro de tendinitis crónica por una deficiencia de mi tejido conectivo y también de una atrofia muscular progresiva. Afecta a diversas partes del cuerpo, y muy especialmente a los brazos. Por esta razón no puedo hacer cosas tales como escribir, teclear el computador, coger mínimos pesos, abrir puertas, usar teléfonos o móviles… La verdad es que necesito ayuda para muchas cosas.
Uso Dragón Naturally Speaking desde hace 7 años. Gracias a él puedo navegar por Internet, escribir, trabajar y también leer. Mi trabajo me exige leer mucho, pero lamentablemente no puedo ni coger un libro, ni pasar sus páginas. Así que siempre le pido a alguien que los digitalice y, enseguida, mediante un programa de conversión de archivos, AbbyFine Reader, los paso al formato epub. Finalmente lo visualizo con Calibre. Utilizo este programa para leer, porque tengo algunos problemas de visión y éste permite aumentar el tamaño de la letra tanto como tú quieras. Considero que es importante concienciar a la gente de que no raye ni escriba en los libros públicos como los de la biblioteca, porque al digitalizarse se visualizan muy mal. También es de gran ayuda que las páginas web sean responsivas, para que se pueda aumentar el tamaño sin que se pierda la visualización íntegra de la página.

Actualmente, utilizo la versión 13 de Dragon en un Notebook LeNovo Y700-17/SK, con Pentium 7, 16 Gb RAM 2,6 Ghz. Este Dragon tiene comandos muy interesantes que agilizan el uso del computador, pero tiene graves fallas. Se bloquea a cada rato con ciertos navegadores y con Office. Con Edge sencillamente no funciona. Con Explorer funciona un poco mejor, pero no lo utilizo porque se bloquea constantemente. Con Google Chrome, en general, marcha bien pero también se congela. Es recomendable no tener muchas pestañas abiertas al mismo tiempo. En el caso de Firefox no se bloquea, pero es una lata usarlo, porque no tiene habilitado los comandos especiales de voz.

Lo que más utilizo es el programa de micrófono remoto del Dragon, que funciona con la red Wifi. Me acomoda mucho porque al no poder estar sentada mucho rato, debido a dolores musculares, tengo que levantarme y moverme constantemente, lo que me obliga a distanciarme considerablemente del ordenador. La desventaja de esta aplicación es que se desconecta frecuentemente del computador. Sospecho que esta desconexión se debe a un defecto del Windows 10, pues antes, con Windows 7 y Bonjour funcionaba sin problemas.

En general, el Dragon requiere de mucha memoria y rendimiento, por lo que te obliga a tener un equipo muy potente. Ojalá saliera algún competidor. Además, tiene la desventaja de no poder usarse en un Apple , porque no tienen versión en español.

Usted me preguntaba por el uso de las transcripciones de los videos tutoriales. La verdad es que éstas me ahorran mucho trabajo, porque es muy difícil manejar los vídeos con el Dragon (pausar, volver atrás, etc), y porque yo no puedo tomar apuntes mientras los escucho. Sinceramente, creo que sin ellas no hubiera podido realizar el curso.

Disculpe la extensión de mi correo, pero no he sabido resumir mejor los principales obstáculos a los que me enfrento. Realmente le agradezco que se dedique al área de accesibilidad web, porque, sin la tecnología, la discapacidad te acaba dominando y te conviertes en prisionero de tu propio cuerpo.

MI RESPUESTA 2

¿Has pensado en usar un sistema de eye tracking? ¿O quizás ya lo has usado y no es útil?

CORREO ESTUDIANTE 3

Olvidé decirle que la mejor experiencia que he tenido con el dragón es cuando lo utilice en su versión 12.5 con Windows 7.

Conozco de oídas el programa eye tracking. Sé que lo usan personas que no pueden hablar, y están absolutamente inmovilizadas, como los que sufren esclerosis lateral amiotrófica o síndrome de enclaustramiento. Recuerdo que hace años, en la universidad en la que trabajaba, la Católica de Chile, un profesor de teatro sufrió un grave accidente que le provocó este síndrome de enclaustramiento, y los alumnos y profesores hicieron una colecta para poder comprar el computador que usa este software. Allí tuve constancia de que era radicalmente caro.

Desconozco si ahora tiene un precio más económico y si se puede utilizar en cualquier computador o requiere de un hardware especial. ¿Usted sabe eso?
Lo ideal es que se pudieran combinar el dragón y el eye tracking. Pero lo veo complicado.

MI RESPUESTA 3

Los sistemas de eye tracking son bastante caros. Los más conocidos son de la compañía Tobii: http://www.tobii.com/

Inicialmente, esta compañía sólo los vendía como producto para la investigación de la usabilidad de productos como las páginas web. Pero parece que se ha dado cuenta de que también hay mercado para venderlo como producto de apoyo y tiene algunos productos destinados a ese segmento con precios inferiores.

También hay otras empresas que intentan competir con Tobii y ofrecen precios menores.

En tu caso, una combinación de ambos sistemas quizás podría ser una buena opción: el sistema de eye tracking sería el sustituto del ratón y el sistema de reconocimiento de voz el teclado. Pero habría dos problemas importantes: el precio y la compatibilidad de tener los dos sistemas en funcionamiento.

Los problemas que tiene Dragon son extraños. Y también es más extraño que tenga unos altos requisitos de memoria y de velocidad: Dragon debe tener al menos más de 15 años de vida, los ordenadores de hace 15 años tenían considerablemente menos potencia que los ordenadores actuales, no debería existir ningún problema para trabajar con Dragon en cualquier ordenador actual.

jueves, 13 de noviembre de 2008

El reconocimiento de voz cada vez mejor

Acabo de leer en El País la noticia Yo hablo y tú escribes. Según la noticia, los sistemas de reconocimiento de voz cada vez son mejores y ya casi logran una exactitud perfecta. Un gran beneficio para todos los usuarios y en especial para algunos usuarios con discapacidad que emplean estos sistemas para interactuar con el ordenador.

Para el que quiera saber algo más sobre el tema, en la Wikipedia se explica qué es el Reconocimiento del habla:
El Reconocimiento Automático del Habla (RAH) o Reconocimiento Automático de voz es una parte de la Inteligencia Artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras electrónicas. El problema que se plantea en un sistema de RAH es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido.

martes, 18 de marzo de 2008

Navegación por voz en Opera

En la entrada Características que mejoran la accesibilidad del navegador Opera he comentado las principales características que incorpora el navegador Opera de cara a mejorar su accesibilidad. Una de las más interesantes es la navegación por voz.

La navegación por voz de Opera ofrece dos funciones. Por un lado, permite al usuario emplear comandos de voz para controlar el funcionamiento del lector. Por otro lado, Opera incluye un lector de documentos que realiza la misma función que un lector de pantallas.

Para que funcione la navegación por voz, es necesario activarla en Herramientas -> Opciones -> Avanzado -> Voz. Cuando se activa la opción "Activar control de navegación por voz", Opera informa al usuario de la necesidad de descargar unos módulos para su funcionamiento (unos 10Mb).


Más información: