voz usando tipos software sistemas sintesis reconocimiento natural lenguaje google aplicaciones speech-recognition voice ergonomics speech code-by-voice

speech recognition - usando - Software de reconocimiento de voz para desarrolladores



sintesis de voz usando lenguaje natural (16)

Bueno, los doctores finalmente lo dijeron. Necesito relajarme la muñeca durante unos meses. Siendo que soy Desarrollador .NET esto podría terminar mi sustento por un tiempo, algo que no estoy ansioso por hacer. Dicho esto, ¿hay alguna buena opción de manos libres para desarrolladores? ¿Alguien ha tenido éxito usando cualquiera de los software de reconocimiento de voz que hay?

POSTSCRIPT: He recuperado mi brazo nuevamente hasta el punto en que la programación a dos manos no es un problema. Naturalmente, Dragon funcionaba bastante bien, pero era más lento, no como el teclado en el que estaba programando más rápido de lo que pensaba.


En cuanto al problema de la muñeca, aprendí a usar el ratón con ambas manos hace unos 10 años.

Es sorprendentemente fácil y alivia la tensión sustancialmente. Actualmente, estoy usando una computadora portátil y presionar el botón del panel táctil me está presionando el pulgar.

Ten cuidado. Estos problemas pueden durar mucho más de lo que uno pensaría.

ps puede agregar una etiqueta ''ergonómica'' o algo así: se puede ver que el título trata sobre el desarrollo para el reconocimiento de voz.


Intenté con Dragon hace un par de años y fue una pesadilla de palabras y frases trituradas, no recomendadas. Entiendo que fue lo mejor en ese momento, así que no soy optimista.

Como compañero sufridor, las recomendaciones serían:

  1. Encuentre un trabajo que exija la menor cantidad de OT posible
  2. Pruebe una variedad de teclados. En mi experiencia, trabajar en una computadora portátil a tiempo completo funcionaba mejor.
  3. Comience un programa de levantamiento de pesas de estrés bajo a moderado.

No puedo encontrar un enlace a uno (lo miré) pero hay teclados con solo 5 teclas, lo que te permite escribir con una mano, supongo que solo tienes una muñeca defectuosa.

Si encuentro un enlace, intentaré enviarte un mensaje.


Otra idea es encontrar otro buen desarrollador para emparejar el programa. Funcionó muy bien para mí. Puedo descansar mis manos sin necesariamente disminuir la velocidad, terminar produciendo un código de mejor calidad, o al menos no tener que revisar tanto.


Sé que estoy un poco fuera de tema aquí, y no sé nada sobre el software de reconocimiento de voz; sin embargo, puede que le resulte útil investigar el cambio de su teclado al diseño de Dvorak, que según he oído es mucho más amable en las muñecas.

http://en.wikipedia.org/wiki/Dvorak_Simplified_Keyboard



Empecé a usar mi mano izquierda para el mouse, esto no solo me ayudó un poco, sino que también me permitió usar mi mano derecha con mayor libertad, si escribes muchas cosas mientras estás en el código esto te ayuda mucho. Puedes desplazarte y escribe al mismo tiempo ...

Cuando comenzaron mis problemas, puse una bolsa de agua debajo de mi muñeca, ¡me encantó! la bolsa que tenía era perfecta, era larga y la puse delante del teclado para que pudiera descansar mis muñecas allí ... hasta que un día la pise ...


Utilicé Dragon Dictate en 1996 por la misma razón que tú. Fue lento, pero mejor que no funcionar. Me resultó más fácil escribir código rellenando el tablero blanco de 4x8 con código y luego hacer que alguien más lo ingrese. Luego usé DD para depurar.

Y mientras lo hace, puede consultar los libros de Deborah Quilter sobre RSI. Son muy informativos.


El estándar de oro para programar por voz es VoiceCode . Si no recuerdo mal, admiten C ++ y Python.


Está por ahí, y funciona ...

Existen bastantes programas de reconocimiento de voz, de los cuales Dragon NaturallySpeaking es, creo, uno de los más utilizados. Lo he usado yo mismo, y me ha impresionado su calidad. Siendo hace un par de años, creo que las cosas han mejorado aún más en este momento.

... pero no es fácil ...

Aunque funciona increíblemente bien, no diré que es una solución fácil. Lleva tiempo entrenar el programa, e incluso entonces cometerá errores. Es laboriosamente lento en comparación con el tipeo, así que tuve que seguir diciéndome "No agarres el teclado, no agarres el teclado, ..." (después de lo cual agarraría el teclado de todos modos). Yo mismo tiendo a murmurar un poco, lo cual tampoco mejora mucho las cosas ;-). Especialmente las primeras semanas pueden ser frustrantes. Incluso puedes tener problemas relacionados con la voz si te esfuerzas demasiado en la voz .

... especialmente para programadores!

Con todo, es ciertamente una solución factible para las personas que escriben textos / prosa normales . Como programador, estás en un ámbito completamente diferente, para el cual no hay soluciones reales. Las cosas podrían haber cambiado por ahora, pero me sorprendería si lo hubieran hecho.

¿Cuál es el problema? La mayoría del software de SR está diseñado para reconocer el lenguaje normal. Los programadores escriben cosas muy crípticas, y es difícil, si no imposible, encontrar un software que realice la conversión entre el lenguaje y el código normales. Por ejemplo, cómo dictarías:

if (somevar == ''a'') { print(''You pressed a!''); }

Usando los comandos en su programa SR promedio, esto es un gran dolor: "si el espacio dejó el paréntesis igual signo signo igual apóstrofo deletrea un apóstrofo ...". Y ni siquiera estoy hablando de navegar su código. ¿Alguna vez notó cuánto usa el teclado mientras programa y qué tan diferente es ese uso de la forma en que un usuario "normal" usa el teclado?

Cómo aprovecharlo al máximo

Hasta ahora, solo he trabajado con Dragon NaturallySpeaking (DNS), por lo que solo puedo hablar sobre ese producto. Hay algunos complementos interesantes y sitios web dirigidos a personas como programadores:

  • Vocola es un complemento no oficial que le permite agregar fácilmente sus propios comandos a DNS. Lo encontré esencial, básicamente. También podrá encontrar conjuntos de comandos escritos por otros programadores, por ejemplo, para navegar por el código. Se basa en un paquete de software escrito en Python, por lo que también hay algunos paquetes más avanzados y sofisticados. También echa un vistazo a la página de Recursos de Vocola. (Advertencia: cuando lo usé, hubo algunos problemas con la instalación de Vocola; consulte el siguiente grupo de noticias para obtener información).
  • SpeechComputing.com es un foro / grupo de noticias con muchas discusiones interesantes. Un buen lugar para comenzar.

Observaciones finales

Parece que la mejor solución para este problema es realmente:

  • Encuentre maneras de la codificación real.
  • Intenta recuperarte Soy un poco reacio a recomendar este libro, pero parece funcionar increíblemente bien para las personas con RSI / túnel del carpo y otros problemas de dolor crónico: JE Sarno, prescripción de Mindbody . Estoy trabajando con eso ahora, y creo que definitivamente vale la pena leerlo.

Dragon Naturally Speaking Preferido y Vocola. Autohotkey para automatizar tanto como sea posible. Sin embargo, no es fácil de programar. Lo intenté; casi imposible. Eche un vistazo al dolor de espalda sanador de John Sarno. Me hizo mejor. ¡He vuelto a programar todo el día!


Como se mencionó anteriormente, Dragon Naturally Speaking es el mejor software de reconocimiento de voz que existe, sin embargo, Microsoft Speech Recognition no se queda atrás y viene incluido con Vista.

Recientemente, Vocola se ha migrado a MSR y tiene una función de integración .Net.

Algunos consejos

  1. Aprender a dictar lleva algo de tiempo. El hecho de que pueda hablar no significa que sepa cómo usar el software de reconocimiento de voz
  2. Ser competente con una combinación de SR y teclado / mouse es mucho más fácil que la operación completa de manos libres.
  3. Use CodeRush o su equivalente para escribir menos.

Otro poco fuera de tema aquí, he descubierto que el keboard dividido en dos partes y otros teclados especiales ayudan, simplemente echa un vistazo a la kinesis. Recopilé información sobre dicho hardware en diigo:

¿Qué hay de los enlaces directos?

¡Una cosa más! Recuerda los descansos para los ejercicios. Los ejercicios regulares (por ejemplo, ejercicio pequeño, cada media hora y cada uno) realmente hacen las cosas realmente mejores.




Yo dicto VB.net y TSQL usando Dragon NaturallySpeaking 10 Professional. VB.net es intrínsecamente más cercano a un lenguaje "hablado", pero no veo ninguna razón por la cual no podría funcionar para C # u otros. Empiezo con un vocabulario completamente vacío y lo construyo desde cero para adaptarlo a mis necesidades (por eso utilizo la versión profesional).

Estos son los pasos básicos (esto supone que ya ha creado y entrenado a un usuario):

  1. Cree un nuevo vocabulario basado en "Base general - Dictado vacío".
  2. No haga que escanee sus documentos o correo electrónico.
  3. Agregue listas de palabras clave con pronunciación específica para su lenguaje de programación (Dim, ByVal / by-val, etc.).
  4. Crea un documento .txt que contenga todo tu código menos comentarios.
  5. Recoge palabras de este documento y agrégalas con pronunciaciones.
  6. Use el documento para entrenar el modelo de lenguaje del vocabulario.

Escribiré algo con más detalles cuando tenga la oportunidad si alguien está interesado.

Editar:

A continuación, se indica cómo dictar el código SQL . La lista de palabras creada aquí se puede incluir en otros vocabularios si usted es un desarrollador de bases de datos.