TUS Common Voice

From FdIwiki ELP
Jump to: navigation, search

Esta página describe el Trabajo de Utilidad Social realizado por el equipo 42 y relacionado con un proyecto de Mozilla llamado Common Voice.


Resumen del trabajo

El equipo 42 se unió a un proyecto de Mozilla llamado Common Voice. Este proyecto recoge muestras de voz para 'ayudar' a enseñarles a las máquinas cómo hablan las personas. Para ello, el usuario que participe en el proyecto puede, o bien donar su voz diciendo frases en cierto idioma, o escuchar voces donadas por otras personas y validar si son correctas.

El equipo 42 centró su trabajo en:

- Donar voces al proyecto Common Voice.

- Traducir partes del código del proyecto (realizado en la página de Pontoon).

- Calificar voces donadas por otros usuarios del proyecto Common Voice.

- Donar frases en español.

Motivación

El equipo 42 tenía claro que quería realizar una colaboración con Mozilla, ya que este proyecto era llamativo. Al ser un proyecto grande, fue difícil decantarse por alguno de sus sub-proyectos; pero el proyecto Common Voice llamó la atención entre todos debido a la facilidad de colaboración en él por parte de los miembros del equipo, ya que aunque el español no esté incluido de forma oficial a la hora de realizar el proyecto, los miembros del equipo cuentan con conocimientos en inglés.

Qué se ha hecho

El equipo 42 ha basado su trabajo en, principalmente, los siguientes puntos.

Donar voces a la página de Common Voice: Actualmente, la página está en algunos idiomas entre los cuales el español no está incluido. Contactando con los grupos que llevan la implementación de un nuevo idioma indicaron que, a principios de 2019, el español podría incluirse. Debido a esto, el equipo 42 se centró en el inglés.

En la página del proyecto te permite grabar con tu micrófono distintas frases que aparecen en pantalla, que después serán analizadas y validadas por otros usuarios anónimos.

Traducción de partes del código del proyecto (página de Pontoon): Common Voice trabaja a la par con otras páginas para organizar su contenido visual.

Pontoon es una de esas plataformas que trabaja con Common Voice; esta plataforma es la encargada de traducir la interfaz gráfica de la página web. Por ejemplo: si en inglés pone "Log In", Pontoon traducirá el texto a "Iniciar Sesión" en español.

Analizar voces ya donadas por otros usuarios de Common Voice: En la misma página de Common Voice te permite escuchar clips de audio de otros usuarios anónimos y validarlos como buenos, teniendo en cuenta la frase a interpretar.

Donar frases en español: Al ser un proyecto tan grande, es difícil mantener el orden dentro de él. Dentro del proyecto, hay un hilo para donar frases cortas en el idioma deseado. La única restricción dentro del proyecto es la necesidad de donar 50 frases mínimo y no deben incluir insultos ni frases obscenas. Cuando el idioma de las frases donadas esté activo se abrirá un apartado donde la gente validará las frases. Éstas pasarán a la página y se empezarán a grabar las voces en español usando dichas frases.

Miembros del equipo y trabajo realizado

Las validaciones y donaciones de voz se realizan de forma individual. Todos los miembros del equipo 42 realizaron su colaboración con el proyecto en inglés, a falta de soporte para el español.

El trabajo de cada miembro del equipo se resume en:

Fátima: Clips grabados: 155, clips validados: 210, traducciones: 42

Roberto: Clips validados: 115, traducciones: 13

Marina: Clips grabados: 15, clips validados: 195, traducciones: 11

Paula: Clips grabados: 30, clips validados: 100, traducciones: 51

Gonzalo: Clips grabados: 64, clips validados: 60

Denis: Clips grabados: 20, clips validados: 253

Cómo usar el trabajo por terceros

El repositorio del proyecto está abierto y documentado en GitHub.

La página de reconocimiento y/o validación de voces permite descargar toda la base de datos de las voces que se han recopilado, e incluso las tuyas propias si has colaborado, iniciando sesión.

Cómo continuar mejorando el trabajo

Como ha sido mencionado anteriormente, la opción del idioma español aun no está disponible para contribuir al proyecto. Los miembros del equipo 42 están suscritos para que, cuando ésto sea una realidad, poder contribuir en nuestro idioma.

También se están generando subproyectos de Common Voice `para facilitar, por ejemplo, la validación de frases para gente que no supiese mucho de programación a través de GitHub.

Conclusiones

Para los miembros del equipo 42, el trabajo ha servido para ver como "un proyecto no es sólo código y programadores" y para darse cuenta de que "mucha gente, haciendo pequeñas cosas, pueden ayudar a que un proyecto salga adelante y funcione".

También apuntan que "en un proyecto como este, que busca crear una base de datos para un sistema de reconocimiento de voz, que haya tanta diversidad de gente participando en su creación hace que este proyecto busque liberarse de sesgos, ya que todo el mundo puede participar donando su voz", cosa que ayudará en un futuro al software de reconocimiento de voz.

Enlaces

Enlace al repositorio del proyecto Voice Web.

Frases donadas por el equipo 42