Diferencia entre revisiones de «Trabajo:Mozilla - Firefox Nightly y Common Voice»

De FdIwiki ELP
Saltar a: navegación, buscar
m
m (Impacto)
 
(No se muestran 28 ediciones intermedias de 3 usuarios)
Línea 243: Línea 243:
 
====Bug Link Wiki====
 
====Bug Link Wiki====
  
Al intentar reportar el bug Google Photos, encontramos otro mal funcionamiento, esta vez de los docs de Mozilla. En la wiki https://wiki.mozilla.org/Nightly (sección Filing Bugs -> I found a bug, how do I report it?) hay un enlace titulado “Bugzilla: Bug writing guidelines”. Al pinchar ahí, el funcionamiento correcto es que te lleve a la página https://bugzilla.mozilla.org/page.cgi?id=bug-writing.html , pero para ello hace un paso intermedio, llevandote a la página de MDN web docs https://developer.mozilla.org/es/docs/Mozilla/QA/Bug_writing_guidelines . Al principio, esta página lanzaba un error “Page not found Sorry, the page /es/docs/Mozilla/QA/Bug_writing_guidelines could not be found.”, pero solo en navegadores de Mozilla, tanto en el Nightly como en la versión normal. En cambio en Chrome, Edge y otros redirigía correctamente, así que al principio lo achacamos a un problema  del navegador, y por tanto lo reportamos en bugzilla: https://bugzilla.mozilla.org/show_bug.cgi?id=1740704.  
+
Al intentar reportar el bug Google Photos, encontramos otro mal funcionamiento, esta vez de los docs de Mozilla. En la wiki https://wiki.mozilla.org/Nightly (sección Filing Bugs -> I found a bug, how do I report it?) hay un enlace titulado “Bugzilla: Bug writing guidelines”. Al pinchar ahí, el funcionamiento correcto es que te lleve a la página https://bugzilla.mozilla.org/page.cgi?id=bug-writing.html , pero para ello hace un paso intermedio, llevandote a la página de MDN web docs https://developer.mozilla.org/es/docs/Mozilla/QA/Bug_writing_guidelines . Al principio, esta página lanzaba un error “Page not found Sorry, the page /es/docs/Mozilla/QA/Bug_writing_guidelines could not be found.”, pero solo en navegadores de Mozilla, tanto en el Nightly como en la versión normal. En cambio en Chrome, Edge y otros redirigía correctamente, así que al principio lo achacamos a un problema  del navegador, y por tanto lo reportamos en Bugzilla: https://bugzilla.mozilla.org/show_bug.cgi?id=1740704.  
  
Sin embargo, unas horas después la página empezó a fallar en otros navegadores web, y empezamos a sospechar que no era problema de Firefox. Si configuras el navegador al idioma inglés(en-us), la página funcionaba perfectamente, y te redirigía a bugzilla. En cambio, en español(es), intentaba buscar la página MDN en español, que es un comportamiento normal en los docs de MDN, pero en una redirección como esta producía un error. Los bugs de MDN se reportan directamente como una issue en el proyecto de github, y así hicimos: https://github.com/mdn/content/issues/10458. Nos aseguramos de cerrar el report de Bugzilla (para no hacer perder el tiempo a los desarrolladores de Firefox, que no tenían nada que ver con este bug), y la marcamos como RESOLVED - INVALID. Además, mientras se resuelve la issue, vimos conveniente modificar la wiki https://wiki.mozilla.org/Nightly para que otros desarrolladores pudieran acceder correctamente. Así, hicimos que el link apuntara directamente a la página de Bugzilla en vez de redirigir primero a MDN.
+
Sin embargo, unas horas después la página empezó a fallar en otros navegadores web, y empezamos a sospechar que no era problema de Firefox. Si configuras el navegador al idioma inglés(en-us), la página funcionaba perfectamente, y te redirigía a Bugzilla. En cambio, en español(es), intentaba buscar la página MDN en español, que es un comportamiento normal en los docs de MDN, pero en una redirección como esta producía un error. Los bugs de MDN se reportan directamente como una issue en el proyecto de github, y así hicimos: https://github.com/mdn/content/issues/10458. Nos aseguramos de cerrar el report de Bugzilla (para no hacer perder el tiempo a los desarrolladores de Firefox, que no tenían nada que ver con este bug), y la marcamos como RESOLVED - INVALID. Además, mientras se resuelve la issue, vimos conveniente modificar la wiki https://wiki.mozilla.org/Nightly para que otros desarrolladores pudieran acceder correctamente. Así, hicimos que el link apuntara directamente a la página de Bugzilla en vez de redirigir primero a MDN.
  
 
==Impacto==
 
==Impacto==
Línea 260: Línea 260:
  
 
|-
 
|-
| Bug Google Photos
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1740776 Bug Google Photos]
 
| Sin confirmar
 
| Sin confirmar
 
| 2
 
| 2
Línea 267: Línea 267:
 
* 18/11/2021: Nos pidieron una aclaración sobre el problema y se la respondimos.
 
* 18/11/2021: Nos pidieron una aclaración sobre el problema y se la respondimos.
 
* 09/12/2021: Le asignaron prioridad P3.
 
* 09/12/2021: Le asignaron prioridad P3.
 +
* 20/01/2022: Le asignaron severidad S3.
 
|-
 
|-
| Bug Wiggle
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741037 Bug Wiggle]
 
| Sin confirmar
 
| Sin confirmar
 
| 0
 
| 0
Línea 274: Línea 275:
 
* 13/11/2021: Lo reportamos.
 
* 13/11/2021: Lo reportamos.
 
|-
 
|-
| Bug Double Icon
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741040 Bug Double Icon]
 
| Sin confirmar
 
| Sin confirmar
 
| 0
 
| 0
Línea 280: Línea 281:
 
* 13/11/2021: Lo reportamos.
 
* 13/11/2021: Lo reportamos.
 
|-
 
|-
| Bug Import Bookmarks
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741044 Bug Import Bookmarks]
| Duplicado
+
| '''Duplicado'''
 
| 1
 
| 1
 
|
 
|
Línea 287: Línea 288:
 
* 15/11/2021: Lo marcaron como duplicado de un bug reportado anteriormente.
 
* 15/11/2021: Lo marcaron como duplicado de un bug reportado anteriormente.
 
|-
 
|-
| Bug Download Panel Above Window
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741076 Bug Download Panel Above Window]
| Arreglado
+
| Confirmado
| 4
+
| 7
 
|
 
|
 
* 14/11/2021: Lo reportamos.
 
* 14/11/2021: Lo reportamos.
 
* 15/11/2021: Nos pidieron hacer una prueba y la hicimos.
 
* 15/11/2021: Nos pidieron hacer una prueba y la hicimos.
* 17/11/2021: Lo reprodujeron, pero lo consideraron duplicado parcial de un bug reportado anteriomente. Aportaron una solución para la parte en que difería con el otro bug (cambiar la opción browser.download.alwaysOpenPanel a false)
+
* 17/11/2021: Lo reprodujeron, pero lo consideraron duplicado parcial de un bug reportado anteriomente. Aportaron una solución para la parte en que difería con el otro bug (cambiar la opción browser.download.alwaysOpenPanel a false). Marcaron el bug como arreglado.
 +
* 14/12/2021: Nos preguntaron si el bug seguía apareciendo con la nueva build de Firefox Beta. Comprobamos que seguía ocurriendo y se lo notificamos.
 +
* 03/01/2021: En base a nuestro comentario anterior, decidieron reabrir el bug. Le asignaron prioridad 3 y severidad 3.
 
|-
 
|-
| Bug Webcam Meet
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741463 Bug Webcam Meet]
| Duplicado
+
| '''Duplicado'''
 
| 2
 
| 2
 
|
 
|
Línea 303: Línea 306:
 
* 23/11/2021: Tras la prueba, consideraron que el comportamiento que observábamos se debía a un bug ya reportado, así que lo marcaron como duplicado. Aportaron una forma de paliar los efectos que veíamos.
 
* 23/11/2021: Tras la prueba, consideraron que el comportamiento que observábamos se debía a un bug ya reportado, así que lo marcaron como duplicado. Aportaron una forma de paliar los efectos que veíamos.
 
|-
 
|-
| Bug Drag and Drop
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741467 Bug Drag and Drop]
| Resuelto
+
| '''RESUELTO'''
 
| 9
 
| 9
 
|  
 
|  
Línea 313: Línea 316:
 
* 07/12/2021: Un bug reportado unos días después que el nuestro y que ya había sido resuelto fue considerado duplicado del nuestro. De esta manera, nuestro bug también quedó resuelto.
 
* 07/12/2021: Un bug reportado unos días después que el nuestro y que ya había sido resuelto fue considerado duplicado del nuestro. De esta manera, nuestro bug también quedó resuelto.
 
|-
 
|-
| Bug Null in Youtube Sharing
+
| [https://github.com/mozilla-mobile/fenix/issues/22477 Bug Null in Youtube Sharing]
| En resolución
+
| '''RESUELTO'''
| 3
+
| 6
 
|
 
|
 
* 15/11/2021: Lo reportamos (erróneamente) en Bugzilla.
 
* 15/11/2021: Lo reportamos (erróneamente) en Bugzilla.
Línea 321: Línea 324:
 
* 18/11/2021: Lo confirmaron.
 
* 18/11/2021: Lo confirmaron.
 
* 14/12/2021: Un desarrollador se autoasignó la tarea de resolver este bug y comenzó a trabajar en él.
 
* 14/12/2021: Un desarrollador se autoasignó la tarea de resolver este bug y comenzó a trabajar en él.
 +
* 20/12/2021: Después de subir commits durante varios días, el desarrollador cambió el estado de la tarea a "En revisión".
 +
* 18/01/2022: El desarrollador hizo su último commit y cambió el estado a "Preparado para QA" (testeo).
 +
* 20/01/2022: Otro usuario verificó que estaba arreglado y cerró la incidencia.
 
|-
 
|-
| Bug Icons on Top
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1741832 Bug Icons on Top]
 
| Sin confirmar
 
| Sin confirmar
 
| 2
 
| 2
Línea 328: Línea 334:
 
* 18/11/2021: Lo reportamos.
 
* 18/11/2021: Lo reportamos.
 
|-
 
|-
| Bug PDFs
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1742939 Bug PDFs]
 
| Confirmado
 
| Confirmado
| 2
+
| 4
 
|
 
|
 
* 25/11/2021: Lo reportamos.
 
* 25/11/2021: Lo reportamos.
 
* 26/11/2021: Lo confirmaron y le asignaron severidad S3.
 
* 26/11/2021: Lo confirmaron y le asignaron severidad S3.
 +
* 20/12/2021: Varios desarrolladores dijeron que no podían reproducir el bug.
 +
* 22/12/2021: Comprobamos que el bug seguía dándose y volvimos a explicar el proceso a seguir para reproducirlo. Otros desarrolladores que sí lo habían reproducido también aportaron sus propias explicaciones. A pesar de todo, hubo personas que no fueron capaces de reproducirlo.
 
|-
 
|-
| Bug External Screen
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1746060 Bug External Screen]
 
| Sin confirmar
 
| Sin confirmar
| 0
+
| 3
 
|
 
|
 
* 14/12/2021: Lo reportamos.
 
* 14/12/2021: Lo reportamos.
 +
* 31/12/2021: Nos pidieron hacer una prueba y la hicimos.
 
|-
 
|-
| Bug Documentation Out of Date
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1742074 Bug Documentation Out of Date]
 
| Sin confirmar
 
| Sin confirmar
 
| 0
 
| 0
Línea 347: Línea 356:
 
* 19/11/2021: Lo reportamos.
 
* 19/11/2021: Lo reportamos.
 
|-
 
|-
| Bug Big Files
+
| [https://bugzilla.mozilla.org/show_bug.cgi?id=1746063 Bug Big Files]
 
| Sin confirmar
 
| Sin confirmar
 
| 0
 
| 0
Línea 353: Línea 362:
 
* 14/12/2021: Lo reportamos.
 
* 14/12/2021: Lo reportamos.
 
|-
 
|-
| Bug Link Wiki
+
| [https://github.com/mdn/yari/issues/4984 Bug Link Wiki]
 
| Sin confirmar
 
| Sin confirmar
| 1
+
| 2
 
|
 
|
 
* 11/11/2021: Lo reportamos.
 
* 11/11/2021: Lo reportamos.
 +
* 18/01/2022: Se añade a una Task List de su Sprint 3.
 
|}
 
|}
 +
 
=Parte II: CommmonVoice=
 
=Parte II: CommmonVoice=
 
==Introducción==
 
==Introducción==
  
Common Voice es un proyecto de Mozilla que pretende crear un corpus de grabaciones para reconocimiento de voz con licencia libre de los principales idiomas hablados en el mundo así como de idiomas más minoritarios. Usando un sistema de colaboración distribuida en el que los usuarios pueden grabar fragmentos leyendo una frase y validar los fragmentos grabados por otros usuarios para verificar que son correctos de acuerdo con unos estándares predeterminados.
+
[https://commonvoice.mozilla.org/es Common Voice] es un proyecto de Mozilla que pretende crear un corpus de grabaciones para reconocimiento de voz con licencia libre de los principales idiomas hablados en el mundo, así como de otros idiomas más minoritarios.  
  
 +
El proyecto usa un sistema de colaboración distribuida, en el que los usuarios pueden grabar fragmentos leyendo una frase, y validar los fragmentos grabados por otros usuarios para verificar que son correctos, de acuerdo con unos [https://commonvoice.mozilla.org/es/criteria criterios predeterminados].
  
 
==Motivación e impacto social==
 
==Motivación e impacto social==
  
Es un proyecto de gran importancia, ya que la mayoría de bases de datos de este tipo son de carácter privativo y por tanto presentan los problemas asociados a este tipo de proyectos. Los datos de Mozilla Common Voice ya se están usando en la práctica en el desarrollo de aplicaciones, por ejemplo: un chatbot para que los ciudadanos de Rwanda pudiesen aprender sobre el COVID-19, asistentes digitales para organizaciones humanitarias, software para mejorar la pronunciación de estudiantes de un idioma y un asistente virtual que protege la privacidad usando solo la red local.
+
Es un proyecto de gran importancia, ya que la mayoría de bases de datos de este tipo son de carácter privativo y, por tanto, presentan los problemas asociados a este tipo de proyectos.  
 +
 
 +
Por ejemplo, en una base de datos de voces privativa no habrá la misma variabilidad de voces, ni se podrán dedicar recursos a idiomas minoritarios. Las personas que hablen con acentos algo distintos, como personas inmigrantes o con impedimentos del habla, tendrán dificultades para usar los productos derivados, ya que no se habrán entrenado con voces como la suya. O, llevándolo a un nivel más extremo, solo quienes hablen inglés o castellano podrán utilizarlos, pero no se cubrirán, por ejemplo, los más de mil idiomas nativos en África<ref>[https://www.infobae.com/america/soluciones/2021/09/28/un-proyecto-tecnologico-propone-que-los-asistentes-de-voz-como-siri-hablen-mas-idiomas/ Un proyecto tecnológico propone que los asistentes de voz como Siri hablen más idiomas], por Axel Marazzi. 28 de Septiembre de 2021, en infobae.</ref>. En muchas instancias, los datasets privativos aumentan las brechas sociales y culturales e imponen mayorías privilegiadas.
 +
 
 +
Otro ejemplo es el posible uso por parte de investigadores o pequeñas empresas que, aun teniendo talento e ideas, no puedan permitirse crear un corpus suficientemente global y de buena calidad por su cuenta. Estamos impidiendo el desarrollo de soluciones y de conocimiento que potencialmente mejoraría nuestras vidas.
 +
 
 +
Los datos de Mozilla Common Voice ya se están usando en la práctica en el desarrollo de aplicaciones, por ejemplo y entre otros:
 +
 
 +
* [https://foundation.mozilla.org/en/blog/in-rwanda-voice-technology-innovation-helps-fight-covid/ Un chatbot para que los ciudadanos de Rwanda pudiesen aprender sobre el COVID-19]
 +
* [https://hacks.mozilla.org/2019/12/deepspeech-0-6-mozillas-speech-to-text-engine/ El modelo pre-entrenado en inglés de DeepSpeech, el software de transcripción de voz a texto de Mozilla]
 +
* [https://mycroft-ai.gitbook.io/docs/about-mycroft-ai/contributing Mycroft, un asistente virtual que protege la privacidad usando solo la red local]
 +
* [http://techiaith.cymru/packages/macsen/?lang=en Macsen, un asistente de voz galés]
 +
 
 +
Además del gran impacto social que puede tener una base de datos de voces libre, a nuestro grupo le interesa colaborar con proyectos de software libre, como hemos explicado anteriormente. Creemos que Commonvoice tiene el formato ideal de participación gradual en el que podemos aportar y participar a nuestro propio ritmo. E incluso la creación de rankings por parte de la página web, y por nosotros mismos, nos motiva aún más para participar en él.
 +
 
 +
Queremos mostrar lo productivo que es aportar a este proyecto, y que cada uno de quienes lean este proyecto, en sus respectivos huecos libres, sepa que puede contribuir hasta donde más le convenga.
  
 
==Trabajo realizado==
 
==Trabajo realizado==
  
Hemos intentado cubrir la mayor cantidad de idiomas posibles, llegando a contribuir en 7 idiomas distintos de manera relevante. Las contribuciones según miembro e idioma han sido las siguientes:
+
Hemos intentado cubrir la mayor cantidad de idiomas posibles, llegando a contribuir en 7 idiomas distintos de manera relevante. Las contribuciones, según miembro e idioma, han sido las siguientes:
  
 
* María Arranz Lobo: Español, Gallego e Inglés
 
* María Arranz Lobo: Español, Gallego e Inglés
Línea 378: Línea 405:
 
* Carlos Morán Alfonso: Catalán, Español, Francés e Inglés
 
* Carlos Morán Alfonso: Catalán, Español, Francés e Inglés
 
* Javier Mulero Martín: Español  
 
* Javier Mulero Martín: Español  
* Celia Rubio Madrigal: Alemán, Español e inglés
+
* Celia Rubio Madrigal: Alemán, Español e Inglés
 
* Ángela Ruiz Ribera: Español
 
* Ángela Ruiz Ribera: Español
 
* Carlos Tardón Rubio: Español e Inglés
 
* Carlos Tardón Rubio: Español e Inglés
  
  
Este ha sido un trabajo gradual, en el que hemos hecho puestas en común todas las semanas para ver el trabajo realizado y almacenar éste en una memoria. Estas son las aportaciones globales por persona:
+
Este ha sido un trabajo gradual de todo el cuatrimestre, en el que, para motivarnos entre nosotros y crear un espíritu competitivo y enriquecedor, hemos puesto en común todas las semanas el trabajo realizado, almacenándolo en una memoria común. Estas son las aportaciones globales por persona:
  
 
{| class="wikitable"
 
{| class="wikitable"
| || Semana 1 (8/11/21 - 14/11/21) || || Semana 2 (15/11/21 - 21/11/21) || || Semana 3 (22/11/21 - 28/11/21) || || Semana 4 (29/11/21 - 5/12/21) || || Semana 5 (6/12/21 - 12/12/21) || || Semana 6 (13/12/21 - 19/12/21) || || Semana 7 (20/12/21 - 26/12/21) || || Semana 8 (27/12/21 - 2/1/22) || || Semana 9 (3/1/22 - 9/1/22) ||  || Totales ||  || Global
+
| || colspan='2' | Semana 1 (8/11/21 - 14/11/21) || colspan='2' | Semana 2 (15/11/21 - 21/11/21) || colspan='2' | Semana 3 (22/11/21 - 28/11/21) || colspan='2' | Semana 4 (29/11/21 - 5/12/21) || colspan='2' | Semana 5 (6/12/21 - 12/12/21) || colspan='2' | Semana 6 (13/12/21 - 19/12/21) || colspan='2' | Semana 7 (20/12/21 - 26/12/21) || colspan='2' | Semana 8 (27/12/21 - 2/1/22) || colspan='2' | Totales || Global
 
|-
 
|-
|| Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados ||  
+
|  || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados || Grabados || Validados ||  
 
|-
 
|-
| María Arranz Lobo || 74 || 41 || 0 || 0 || 135 || 54 || 0 || 0 || 0 || 0 || 40 || 20 || || || || || || || 249 || 115 ||  
+
| María Arranz Lobo || 74 || 41 || 0 || 0 || 135 || 54 || 0 || 0 || 0 || 0 || 40 || 20 || 0 || 0 || 61 || 25 || 310 || 140 ||  
 
|-
 
|-
| Flavius Abel Ciapsa || 150 || 600 || 450 || 600 || 250 || 500 || 0 || 0 || 225 || 450 || 350 || 700 || || || || ||  ||  || 1425 || 2850 ||  
+
| Flavius Abel Ciapsa || 150 || 600 ||450 || 600 || 250 || 500 || 0 || 0 || 225 || 450 || 350 || 700 || 0 || 0 || 0 || 450 || 1425 || 3300 ||
 
|-
 
|-
| Marcos Herrero Agustín || 75 || 245 || 168 || 486 || 134 || 275 || 204 || 160 || 293 || 170 || 316 || 113 || || || || || || || 1190 || 1449 ||  
+
| Marcos Herrero Agustín || 75 || 245 || 168 || 486 || 134 || 275 || 204 || 160 || 293 || 170 || 316 || 113 || 273 || 86 || 0 || 0 || 1463 || 1535 ||  
 
|-
 
|-
| Carlos Morán Alfonso || 110 || 110 || 340 || 400 || 200 || 240 || 350 || 750 || 100 || 100 || 0 || 800 || || || || ||  ||  || 1100 || 2400 ||  
+
| Carlos Morán Alfonso || 110 || 110 || 340 || 400 || 200 || 240 || 350 || 750 || 100 || 100 || 0 || 800 || 0 || 0 || 0 || 0 || 1100 || 2400 ||  
 
|-
 
|-
| Javier Mulero Martín || 0 || 0 || 234 || 170 || 0 || 0 || 475 || 420 || 0 || 0 || || || || || || ||  ||  || 709 || 590 ||  
+
| Javier Mulero Martín || 0 || 0 || 234 || 170 || 420 || 420 || 55 || 0 || 0 || 0 || 422 || 279 || 0 || 0 || 0 || 0 || 1131 || 869 ||  
 
|-
 
|-
| Celia Rubio Madrigal || 153 || 67 || 0 || 80 || 52 || 78 || 0 || 0 || 263 || 0 || || || || || || ||  ||  || 468 || 225 ||  
+
| Celia Rubio Madrigal || 153 || 67 || 0 || 200 || 52 || 78 || 0 || 0 || 263 || 0 || 0 || 140 || 1131 || 0 || 245 || 0 || 1844 || 485 ||  
 
|-
 
|-
| Ángela Ruiz Ribera || 0 || 0 || 1003 || 31 || 0 || 0 || 0 || 0 || 0 || 0 || || || || || || || || || 1003 || 31 ||  
+
| Ángela Ruiz Ribera || 0 || 0 || 1003 || 31 || 0 || 0 || 0 || 0 || 0 || 0 || 256 || 11 || 0 || 0 || 0 || 0 || 1259 || 42 ||  
 
|-
 
|-
| Carlos Tardón Rubio || 148 || 234 || 230 || 60 || 381 || 49 || 109 || 30 || 0 || 0 || || || || || || ||  ||  || 868 || 373 ||  
+
| Carlos Tardón Rubio || 148 || 234 || 230 || 101 || 381 || 8 || 109 || 30 || 230 || 0 || 339 || 5 || 0 || 0 || 0 || 0 || 1437 || 378 ||  
 
|-
 
|-
| Totales || 710 || 1297 || 2425 || 1827 || 1152 || 1196 || 1138 || 1360 || 881 || 720 || 706 || 1633 || 0 || 0 || 0 || 0 || 0 || 0 || 7012 || 8033 || 15045
+
| Totales || 710 || 1297 || 2425 || 1988 || 1572 || 1575 || 718 || 940 || 1111 || 720 || 1723 || 2068 || 1404 || 86 || 306 || 475 || 9969 || 9149 || 19118
 
|}
 
|}
  
 +
[[Archivo:Chart_progreso.png|600px|Resúmen de aportaciones por semana]] [[Archivo:Chart_barras.png|600px|Aportaciones por idioma]]
  
  
Un problema que nos encontramos a la hora de validar es que la variedad de voces podía llegar a ser muy baja (escuchando la voz del mismo hombre en múltiples grabaciones, varios días seguidos), lo que empeora la calidad y diversidad del dataset. Con este trabajo hemos tratado de añadir una variedad de voces y acentos con objetivo mejorar la calidad global de los datos y los productos que deriven de los mismos. Además, hemos colaborado a eliminar todos los datos no adecuados reportando los fragmentos (idioma incorrecto o cualquier elemento del fragmento o grabación que infrinja los criterios de calidad impuestos por ejemplo)
+
==='''Problemas encontrados'''===
 +
[[Archivo:IMG_6431.jpg|200px|thumb|right|Este fragmento estaba en validaciones en español]]
 +
 
 +
Un problema que nos encontramos a la hora de validar es que la variedad de voces podía llegar a ser muy baja, escuchando la voz del mismo hombre en múltiples grabaciones, varios días seguidos. La poca variabilidad de voces empeora la calidad y diversidad del dataset. Esta fue otra razón por la que decidimos aportar en idiomas más minoritarios o menos populares, ya que este fenómeno ocurría más frecuentemente en estos casos. Con este trabajo hemos tratado de añadir una variedad de voces y acentos con el objetivo de mejorar la calidad global de los datos y los productos que deriven de los mismos.  
 +
 
 +
Además, hemos colaborado para eliminar todos los datos no adecuados, reportando los fragmentos que debíamos leer, o rechazando las grabaciones de otros. Algunos ejemplos de motivos son el idioma incorrecto, un lenguaje ofensivo, o cualquier elemento del fragmento o grabación que infrinja los criterios de calidad impuestos. En la imagen incluimos el caso más categórico, que nos hemos encontrado en numerosas ocasiones al realizar grabaciones.
 +
 
 +
==='''Obtención de puestos altos en el ranking'''===
 +
Cada integrante del grupo ha intentado aportar en lugares diversos y valiosos para este proyecto. Hemos intentado, sin que suponga una reducción de la variabilidad de voces, estar presentes en los rankings de Common Voice de algunos de los idiomas en los que hemos participado.
 +
 
 +
En primer lugar, Flavius se encuentra en el puesto 1 de validaciones en Rumano, y en el puesto 4 de grabaciones en el mismo idioma.
 +
 
 +
[[Archivo:TopGrabacionesRumano.PNG|500px]] [[Archivo:TopValidacionesRumano.PNG|500px]]
 +
 
 +
Por otro lado, Celia, Carlos Tardón y Ángela se encuentran en los puestos 15, 16 y 17, respectivamente, de grabaciones en idioma Español.
 +
 
 +
[[Archivo:TopGrabacionesEspañol.png|500px]]
  
 
=Componentes del equipo=
 
=Componentes del equipo=
Línea 423: Línea 467:
 
*Ángela Ruiz Ribera
 
*Ángela Ruiz Ribera
 
*Carlos Tardón Rubio
 
*Carlos Tardón Rubio
 +
 +
== Referencias ==
 +
<references />

Última revisión de 15:06 20 ene 2022


Mozilla
Participantes
María Arranz Lobo
Flavius Abel Ciapsa
Marcos Herrero Agustín
Carlos Morán Alfonso
Javier Mulero Martín
Celia Rubio Madrigal
Ángela Ruiz Ribera
Carlos Tardón Rubio

Tema elegido

Este trabajo consiste en ayudar a la Fundación Mozilla por dos vías: el uso de Firefox Nightly y la participación en la iniciativa Common Voice.


Firefox Nightly es la versión en desarrollo, actualizada diariamente, del navegador Firefox. Se libera todos los días con el propósito de que usuarios voluntarios lo utilicen y detecten fallos. En nuestro grupo, nos proponemos utilizar todos este navegador en nuestro día a día y reportar todos los bugs que podamos por medio de la plataforma Bugzilla.


Common Voice es una iniciativa de Mozilla para mejorar el reconocimiento de todo tipo de voces humanas. Para conseguir esto, se hace necesario disponer de una gran base de datos con muchas lecturas distintas (sin ser por ello incorrectas) de muchas frases distintas. Mozilla selecciona frases en distintos idiomas y, a partir de ahí, los voluntarios de Common Voice contribuyen a la base de datos de dos maneras:

  • Leyendo en voz alta las frases, de manera que la grabación de la lectura se incorpore a la base de datos.
  • Validando las lecturas hechas por otros usuarios.

En nuestro grupo, nos proponemos apuntarnos a Common Voice y participar asiduamente los próximos meses.

Parte I: Firefox Nightly

Introducción

¿Qué es Firefox?

Firefox es el navegador web desarrollado por Mozilla. Se trata del principal navegador enteramente constituido por software libre.

Mozilla Firefox surgió en el año 2004 y llegó a ser utilizado por el 32% de los usuarios en el año 2009. Sin embargo, su uso decayó con la expansión de Google Chrome hasta el 4% actual.

¿Por qué usar Firefox?

La causa fundamental de la dominancia de Google en tantos mercados es su (para muchos poco ético) modelo de negocio: la recopilación exhaustiva de nuestros datos y su uso para mostrar publicidad específica a usuarios específicos. En cambio, Firefox no recopila datos de los usuarios. ¿Estamos seguros de esto?

Sí, totalmente. Puede que aún haya usos desagradables de la información por parte de Google que aún no conozcamos. Pero, al ser Firefox software libre, cualquiera puede consultar su código y saber lo que hace. Así que sí, sabemos con certeza que Firefox no tiene nuestros datos. Y, además, si en algún momento Mozilla quisiera cambiar esta circunstancia, como el código actual de Firefox es software libre podría hacerse un fork y fundar un nuevo navegador con otro nombre pero las mismas características que el Firefox actual.

En este mundo digital, en el que el comercio de datos se ha vuelto una actividad tan importante, resulta obligado preocuparnos, aunque sea un mínimo, por nuestra privacidad. Por tanto, puestos a elegir entre dos navegadores como Chrome y Firefox que, por lo demás, tienen características muy similares, ¿dónde está la duda?

¿Qué es Firefox Nightly?

Firefox Nightly es la versión del navegador Firefox que usa el código compilado más reciente: el código de los desarrolladores de Firefox se compila cada día para dar origen a las builds de Nightly. Evidentemente, es fácil que este nuevo código introduzca bugs accidentalmente, y precisamente el propósito de estas builds es que usuarios voluntarios (¡como nosotros!), mientras utilizan el navegador para sus actividades cotidianas, detecten estos bugs y los reporten para que puedan ser reparados antes de incorporarse a la versión oficial de Firefox.

Propuesta inicial

Motivaciones

Nos hemos decidido a colaborar con Firefox en este proyecto por las siguientes razones:

  • Teníamos interés en colaborar con un proyecto de software libre, pero pensábamos que una actividad que incluyera programación y resultara útil sería irrealizable para nosotros, dada la poca experiencia y el escaso tiempo del que disponemos para la realización de este trabajo. Reportar bugs para Nightly nos da la oportunidad de conocer cómo es participar en una comunidad de software libre sin necesidad de tener que ponernos a programar.
  • Nos gusta colaborar con Mozilla Firefox para fomentar un modelo de negocio no basado en el comercio de datos, frente a los abusos cometidos por Google.
  • Pensamos que el hecho de estar atentos a bugs sutiles y a buscar la forma de replicarlos y saber cómo reportarlos adecuadamente ante una comunidad son competencias útiles para nuestro futuro como informáticos.

¿En qué consiste nuestro trabajo?

La realización de nuestro trabajo consistirá en las siguientes tareas:

  • Utilizar la versión más reciente disponible del navegador Firefox Nightly para toda nuestra actividad en red.
  • Encontrar bugs de Firefox Nightly.
  • Reportar los bugs anteriores de forma clara y precisa para que los desarrolladores de Firefox puedan guiarse de nuestros reportes para reproducir el fallo y repararlo. De esta manera, estos bugs nunca llegarán a la versión estable de Firefox.

¿Por qué pensamos que es original y con impacto?

Si encontramos bugs que nadie ha notificado antes y los reportamos, estaremos aportando al proyecto Firefox algo que, por un lado, es nuevo y, por otro, que les puede resultar útil. Estaremos aportando algo nuevo porque los bugs reportados no habrán sido reportados antes, y esto hará que nuestro trabajo sea original. Estaremos aportando algo que le puede resultar útil al proyecto Firefox porque podrán utilizar la información que les proporcionemos para arreglar los fallos y crear una versión mejor de su navegador, con lo que tendremos un impacto positivo sobre Firefox.

¿Cómo se podrá medir este impacto?

Mediremos el impacto obtenido por un bug reportado según:

  • Cuántos desarrolladores lo siguen.
  • Si recibe o no comentarios de desarrolladores.
  • Qué prioridad se le asigna.
  • Si algún desarrollador comienza a trabajar en su resolución.
  • Si el bug es resuelto.

¿Cómo se reporta un bug de Firefox Nightly?

Los bugs de Firefox Nightly (y de la mayor parte de los proyectos desarrollados por la Fundación Mozilla) se reportan por medio de la página Bugzilla. Al reportar un bug en esta página, se abre un hilo en el que desarolladores de Firefox pueden comentarlo, asignarle una prioridad, marcarlo como duplicado,...

¿Qué dice la documentación?

Todos los reportes de los bugs deben seguir las directrices marcadas en Bugzilla:Bug Writing Guidelines. En ellas, se especifican los datos que deben acompañar al reporte del bug (versión de Firefox, sistema operativo,...), así como las secciones en que debe estructurarse el informe. El esquema del mismo será:

  • Descripción del problema
  • Pasos para reproducirlo
  • Resultados obtenidos
  • Resultados esperados

Se hace mucho hincapié en que los bugs reportados sean reproducibles, es decir, que si un desarrollador sigue los pasos que le indiquemos en nuestro mismo sistema operativo y versión de Firefox, obtendrá los mismos resultados (erróneos) que nosotros.

El proceso de reportar un bug

Teniendo en cuenta las directrices del punto anterior, los puntos que hemos seguido para reportar los bugs son:

  1. Obtenemos un comportamiento inesperado durante el uso de Firefox Nightly (los resultados obtenidos no coinciden con los esperados).
  2. Repetir las acciones anteriores, buscando encontrar una secuencia de pasos que siempre provoque el comportamiento inesperado.
  3. Probar la anterior secuencia de pasos en la versión estable de Firefox para ver si producen el mismo efecto.
    • Si no lo producen, entonces casi con seguridad habremos encontrado un bug de Firefox Nightly.
    • Si lo producen, hay que pensar si es posible que el comportamiento que nos ha parecido inesperado no es realmente el que los desarrolladores deseaban producir. A veces puede no estar claro, pero en situaciones en las que es evidente que el comportamiento obtenido no es el deseado sabemos que nos encontramos ante un bug de la versión estable de Firefox.
  4. Abrir un hilo en Bugzilla en el que se explique de forma clara y precisa el problema encontrado y los pasos para reproducirlo, siguiendo las directrices.

Esfuerzo y originalidad

Todos los integrantes del grupo hemos utilizado Firefox Nightly para nuestros accesos a Internet durante estos meses, tanto desde el computador como desde nuestros dispositivos móviles. Durante nuestras actividades diarias en la red hemos encontrado y reportado diversos bugs. Dado que el objetivo del trabajo era colaborar con Firefox Nightly, la mayor parte de los bugs corresponden a esta versión del navegador, pero también hay bugs de la versión estable del navegador, del sistema de reporte de bugs Bugzilla y de otras páginas relacionadas con la Fundación Mozilla.

La mayor parte de los bugs que hemos reportado no han sido desestimados ni marcados como duplicados, y algunos han sido seguidos con interés. Por ello, consideramos que hemos aportado algo nuevo al proyecto Firefox y, por tanto, que nuestro trabajo ha resultado original.

Es importante destacar que, aunque un bug sea marcado como duplicado, no quiere decir que reportarlo haya sido inútil. En muchas ocasiones, el reporte aporta una perspectiva diferente del mismo bug (por ejemplo, un bug que se encontró inicialmente en un determinado contexto, sistema operativo o versión, aparece en otros). También puede que la información dada por el segundo reportador no sea completamente redundante con la del primero, sino que la complemente, facilitando la reproducción del bug por parte de los desarrolladores y, en última instancia, su resolución. Por último, cuando un bug es reportado por duplicado, en el hilo original aparece que se han reportado duplicados de ese bug, lo que hace notar a los desarrolladores que hay más gente experimentando ese bug y puede llevarlos a reevaluar su prioridad o severidad.

A continuación, se recopilan todos los bugs que hemos hallado y reportado.

Bugs de Firefox

En la siguiente tabla se listan los bugs que hemos reportado del navegador Firefox (tanto de la versión estable como de Firefox Nightly), junto con algunos atributos básicos y una breve descripción. Están ordenados por la fecha en que los reportamos.

El reporte completo de cada bug, junto con las respuestas dadas por otros colaboradores, se encuentra en el link indicado en la columna "Hilo de discusión". La mayor parte de los bugs han sido reportados por medio de Bugzilla. Sin embargo, al reportar Bug Null in Youtube Sharing en Bugzilla (https://bugzilla.mozilla.org/show_bug.cgi?id=1741168) se nos informó de que el equipo de Firefox móvil no utiliza Bugzilla, sino Github Issues. En consecuencia, se cerró el hilo que abrimos en Bugzilla y volvimos a reportar el bug, esta vez en Github Issues.

Nombre Fecha de reporte Versión de Firefox Sistema Operativo Descripción Hilo de discusión
Bug Google Photos 11/11/2021 Firefox Nightly 96 Android La visión de escritorio de la página Google Photos no funciona (se muestra igual que la visión móvil) de entrada. Se arregla quitando y volviendo a poner la visión de escritorio. https://bugzilla.mozilla.org/show_bug.cgi?id=1740776
Bug Wiggle 13/11/2021 Firefox Nightly 96 Ubuntu Al abrir Nightly desde la barra de favoritos, cuando la ventana se abre en media pantalla, el borde de la ventana y el icono de Nightly tiemblan. https://bugzilla.mozilla.org/show_bug.cgi?id=1741037
Bug Double Icon 13/11/2021 Firefox Nightly 96 Ubuntu Al abrir Nightly desde la barra de favoritos el icono se duplica. https://bugzilla.mozilla.org/show_bug.cgi?id=1741040
Bug Import Bookmarks 13/11/2021 Firefox Nightly 96 Ubuntu Tras instalar Firefox Nightly (teniendo Google Chrome previamente instalado), si se elige importar los bookmarks de Chrome, estos aparecen sin iconos. https://bugzilla.mozilla.org/show_bug.cgi?id=1741044
Bug Download Panel Above Window 14/11/2021 Firefox Nightly 96 Ubuntu El panel de descargas de Nightly se muestra por encima de otras ventanas. https://bugzilla.mozilla.org/show_bug.cgi?id=1741076
Bug Webcam Meet 16/11/2021 Firefox Nightly 96 Ubuntu En Google Meet, la imagen tomada por la webcam se ve truncada. https://bugzilla.mozilla.org/show_bug.cgi?id=1741463
Bug Drag and Drop 16/11/2021 Firefox Nightly 96 Ubuntu No se puede subir un archivo a Drive arrastrándolo ni abrirlo en una nueva pestaña https://bugzilla.mozilla.org/show_bug.cgi?id=1741467
Bug Null in Youtube Sharing 17/11/2021 Firefox 94 y Firefox Nightly 96 Android Al compartir un vídeo de Youtube (por email, telegram,...), aparece por defecto “null” en lugar del título del vídeo. https://github.com/mozilla-mobile/fenix/issues/22477
Bug Icons on Top 18/11/2021 Firefox Nightly 96 Ubuntu Si se tiene abierta una ventana y, a continuación, se abre el Nightly, los iconos del escritorio se muestran por encima de la otra ventana antes de que aparezca el Nightly. https://bugzilla.mozilla.org/show_bug.cgi?id=1741832
Bug PDFs 25/11/2021 Firefox 94 y 95 y Firefox Nightly 96 Windows En ciertas circunstancias, al seleccionar un texto para copiarlo, algunos caracteres especiales al final de línea no se muestran como seleccionados. https://bugzilla.mozilla.org/show_bug.cgi?id=1742939
Bug External Screen 14/12/2021 Firefox 95 y Firefox Nightly 96 macOS Si se conecta un macbook a un monitor externo y se arrastra una ventana a esta segunda pantalla y de vuelta al macbook, al abrir un pdf este se abrirá en la segunda pantalla, pero cortado. https://bugzilla.mozilla.org/show_bug.cgi?id=1746060

Bugs de Bugzilla

En la siguiente tabla se recogen los bugs que hemos encontrado de la página de reporte de bugs Bugzilla. Todos han sido reportados en la propia Bugzilla.

Nombre Fecha de reporte Descripción Hilo de discusión
Bug Documentation Out of Date 19/11/2021 La documentación de Bugzilla relativa a cómo reportar bugs de MDN Web Docs no es clara. https://bugzilla.mozilla.org/show_bug.cgi?id=1742074
Bug Big Files 14/12/2021 No se permite reportar un bug con un archivo adjunto de 20 MB, pero no está indicado, y al intentar hacerlo no aparece un mensaje de error, sino simplemente una página en blanco. https://bugzilla.mozilla.org/show_bug.cgi?id=1746063

Otros bugs

A continuación, describimos algunos bugs que hemos encontrado y no encajan en las categorías anteriores.

Bug Commonvoice

Con el uso de CommonVoice encontramos bugs iniciales relacionados con el marcador (leaderboard). En ocasiones, el marcador aparecía totalmente vacío. No era problema de Firefox, pues en Chrome también sucedía, pero Commonvoice es de la fundación así que pensamos en reportar este bug. No sabíamos replicarlo, pero vimos que los administradores ya estaban avisados en el chat: https://chat.mozilla.org/#/room/#common-voice:mozilla.org.

Bug Link Wiki

Al intentar reportar el bug Google Photos, encontramos otro mal funcionamiento, esta vez de los docs de Mozilla. En la wiki https://wiki.mozilla.org/Nightly (sección Filing Bugs -> I found a bug, how do I report it?) hay un enlace titulado “Bugzilla: Bug writing guidelines”. Al pinchar ahí, el funcionamiento correcto es que te lleve a la página https://bugzilla.mozilla.org/page.cgi?id=bug-writing.html , pero para ello hace un paso intermedio, llevandote a la página de MDN web docs https://developer.mozilla.org/es/docs/Mozilla/QA/Bug_writing_guidelines . Al principio, esta página lanzaba un error “Page not found Sorry, the page /es/docs/Mozilla/QA/Bug_writing_guidelines could not be found.”, pero solo en navegadores de Mozilla, tanto en el Nightly como en la versión normal. En cambio en Chrome, Edge y otros redirigía correctamente, así que al principio lo achacamos a un problema del navegador, y por tanto lo reportamos en Bugzilla: https://bugzilla.mozilla.org/show_bug.cgi?id=1740704.

Sin embargo, unas horas después la página empezó a fallar en otros navegadores web, y empezamos a sospechar que no era problema de Firefox. Si configuras el navegador al idioma inglés(en-us), la página funcionaba perfectamente, y te redirigía a Bugzilla. En cambio, en español(es), intentaba buscar la página MDN en español, que es un comportamiento normal en los docs de MDN, pero en una redirección como esta producía un error. Los bugs de MDN se reportan directamente como una issue en el proyecto de github, y así hicimos: https://github.com/mdn/content/issues/10458. Nos aseguramos de cerrar el report de Bugzilla (para no hacer perder el tiempo a los desarrolladores de Firefox, que no tenían nada que ver con este bug), y la marcamos como RESOLVED - INVALID. Además, mientras se resuelve la issue, vimos conveniente modificar la wiki https://wiki.mozilla.org/Nightly para que otros desarrolladores pudieran acceder correctamente. Así, hicimos que el link apuntara directamente a la página de Bugzilla en vez de redirigir primero a MDN.

Impacto

En la siguiente tabla se describe el impacto alcanzado por cada uno de los bugs reportados. Hemos optado por deslosar la historia de cada bug por días para que se vea la evolución que ha tenido y el lector se pueda hacer una idea de cómo podría avanzar en los próximos meses.

Hay que destacar que han transcurrido muy pocas semanas desde que comenzó nuestro proyecto, así que es razonable que a algunos de los bugs más pequeños que hemos encontrado no se les haya dado mucha importancia en este pequeño lapso de tiempo. Hay numerosos bugs que permanecen en Bugzilla durante años antes de ser resueltos, y no por ello su resolución carece de impacto en el largo plazo.

Nombre Estado Nº de desarrolladores que lo siguen Historia
Bug Google Photos Sin confirmar 2
  • 11/11/2021: Lo reportamos.
  • 18/11/2021: Nos pidieron una aclaración sobre el problema y se la respondimos.
  • 09/12/2021: Le asignaron prioridad P3.
  • 20/01/2022: Le asignaron severidad S3.
Bug Wiggle Sin confirmar 0
  • 13/11/2021: Lo reportamos.
Bug Double Icon Sin confirmar 0
  • 13/11/2021: Lo reportamos.
Bug Import Bookmarks Duplicado 1
  • 13/11/2021: Lo reportamos.
  • 15/11/2021: Lo marcaron como duplicado de un bug reportado anteriormente.
Bug Download Panel Above Window Confirmado 7
  • 14/11/2021: Lo reportamos.
  • 15/11/2021: Nos pidieron hacer una prueba y la hicimos.
  • 17/11/2021: Lo reprodujeron, pero lo consideraron duplicado parcial de un bug reportado anteriomente. Aportaron una solución para la parte en que difería con el otro bug (cambiar la opción browser.download.alwaysOpenPanel a false). Marcaron el bug como arreglado.
  • 14/12/2021: Nos preguntaron si el bug seguía apareciendo con la nueva build de Firefox Beta. Comprobamos que seguía ocurriendo y se lo notificamos.
  • 03/01/2021: En base a nuestro comentario anterior, decidieron reabrir el bug. Le asignaron prioridad 3 y severidad 3.
Bug Webcam Meet Duplicado 2
  • 16/11/2021: Lo reportamos.
  • 22/11/2021: Nos pidieron hacer una prueba y la hicimos.
  • 23/11/2021: Tras la prueba, consideraron que el comportamiento que observábamos se debía a un bug ya reportado, así que lo marcaron como duplicado. Aportaron una forma de paliar los efectos que veíamos.
Bug Drag and Drop RESUELTO 9
  • 16/11/2021: Lo reportamos
  • 18/11/2021: Lo confirmaron.
  • 18/11/2021: Resolvieron un bug más general que el nuestro, pero que había sido reportado después
  • 23/11/2021: Le asignaron prioridad P3 y severidad S3.
  • 07/12/2021: Un bug reportado unos días después que el nuestro y que ya había sido resuelto fue considerado duplicado del nuestro. De esta manera, nuestro bug también quedó resuelto.
Bug Null in Youtube Sharing RESUELTO 6
  • 15/11/2021: Lo reportamos (erróneamente) en Bugzilla.
  • 17/11/2021: Se nos avisó de nuestro error y lo volvimos a reportar en GitHub Issues.
  • 18/11/2021: Lo confirmaron.
  • 14/12/2021: Un desarrollador se autoasignó la tarea de resolver este bug y comenzó a trabajar en él.
  • 20/12/2021: Después de subir commits durante varios días, el desarrollador cambió el estado de la tarea a "En revisión".
  • 18/01/2022: El desarrollador hizo su último commit y cambió el estado a "Preparado para QA" (testeo).
  • 20/01/2022: Otro usuario verificó que estaba arreglado y cerró la incidencia.
Bug Icons on Top Sin confirmar 2
  • 18/11/2021: Lo reportamos.
Bug PDFs Confirmado 4
  • 25/11/2021: Lo reportamos.
  • 26/11/2021: Lo confirmaron y le asignaron severidad S3.
  • 20/12/2021: Varios desarrolladores dijeron que no podían reproducir el bug.
  • 22/12/2021: Comprobamos que el bug seguía dándose y volvimos a explicar el proceso a seguir para reproducirlo. Otros desarrolladores que sí lo habían reproducido también aportaron sus propias explicaciones. A pesar de todo, hubo personas que no fueron capaces de reproducirlo.
Bug External Screen Sin confirmar 3
  • 14/12/2021: Lo reportamos.
  • 31/12/2021: Nos pidieron hacer una prueba y la hicimos.
Bug Documentation Out of Date Sin confirmar 0
  • 19/11/2021: Lo reportamos.
Bug Big Files Sin confirmar 0
  • 14/12/2021: Lo reportamos.
Bug Link Wiki Sin confirmar 2
  • 11/11/2021: Lo reportamos.
  • 18/01/2022: Se añade a una Task List de su Sprint 3.

Parte II: CommmonVoice

Introducción

Common Voice es un proyecto de Mozilla que pretende crear un corpus de grabaciones para reconocimiento de voz con licencia libre de los principales idiomas hablados en el mundo, así como de otros idiomas más minoritarios.

El proyecto usa un sistema de colaboración distribuida, en el que los usuarios pueden grabar fragmentos leyendo una frase, y validar los fragmentos grabados por otros usuarios para verificar que son correctos, de acuerdo con unos criterios predeterminados.

Motivación e impacto social

Es un proyecto de gran importancia, ya que la mayoría de bases de datos de este tipo son de carácter privativo y, por tanto, presentan los problemas asociados a este tipo de proyectos.

Por ejemplo, en una base de datos de voces privativa no habrá la misma variabilidad de voces, ni se podrán dedicar recursos a idiomas minoritarios. Las personas que hablen con acentos algo distintos, como personas inmigrantes o con impedimentos del habla, tendrán dificultades para usar los productos derivados, ya que no se habrán entrenado con voces como la suya. O, llevándolo a un nivel más extremo, solo quienes hablen inglés o castellano podrán utilizarlos, pero no se cubrirán, por ejemplo, los más de mil idiomas nativos en África[1]. En muchas instancias, los datasets privativos aumentan las brechas sociales y culturales e imponen mayorías privilegiadas.

Otro ejemplo es el posible uso por parte de investigadores o pequeñas empresas que, aun teniendo talento e ideas, no puedan permitirse crear un corpus suficientemente global y de buena calidad por su cuenta. Estamos impidiendo el desarrollo de soluciones y de conocimiento que potencialmente mejoraría nuestras vidas.

Los datos de Mozilla Common Voice ya se están usando en la práctica en el desarrollo de aplicaciones, por ejemplo y entre otros:

Además del gran impacto social que puede tener una base de datos de voces libre, a nuestro grupo le interesa colaborar con proyectos de software libre, como hemos explicado anteriormente. Creemos que Commonvoice tiene el formato ideal de participación gradual en el que podemos aportar y participar a nuestro propio ritmo. E incluso la creación de rankings por parte de la página web, y por nosotros mismos, nos motiva aún más para participar en él.

Queremos mostrar lo productivo que es aportar a este proyecto, y que cada uno de quienes lean este proyecto, en sus respectivos huecos libres, sepa que puede contribuir hasta donde más le convenga.

Trabajo realizado

Hemos intentado cubrir la mayor cantidad de idiomas posibles, llegando a contribuir en 7 idiomas distintos de manera relevante. Las contribuciones, según miembro e idioma, han sido las siguientes:

  • María Arranz Lobo: Español, Gallego e Inglés
  • Flavius Abel Ciapsa: Español y Rumano
  • Marcos Herrero Agustín: Español e Inglés
  • Carlos Morán Alfonso: Catalán, Español, Francés e Inglés
  • Javier Mulero Martín: Español
  • Celia Rubio Madrigal: Alemán, Español e Inglés
  • Ángela Ruiz Ribera: Español
  • Carlos Tardón Rubio: Español e Inglés


Este ha sido un trabajo gradual de todo el cuatrimestre, en el que, para motivarnos entre nosotros y crear un espíritu competitivo y enriquecedor, hemos puesto en común todas las semanas el trabajo realizado, almacenándolo en una memoria común. Estas son las aportaciones globales por persona:

Semana 1 (8/11/21 - 14/11/21) Semana 2 (15/11/21 - 21/11/21) Semana 3 (22/11/21 - 28/11/21) Semana 4 (29/11/21 - 5/12/21) Semana 5 (6/12/21 - 12/12/21)  Semana 6 (13/12/21 - 19/12/21) Semana 7 (20/12/21 - 26/12/21) Semana 8 (27/12/21 - 2/1/22) Totales Global
Grabados Validados Grabados Validados Grabados Validados Grabados Validados Grabados Validados Grabados Validados Grabados Validados
María Arranz Lobo 74 41 0 0 135 54 0 0 0 0 40 20 0 0 61 25 310 140
Flavius Abel Ciapsa 150 600 450 600 250 500 0 0 225 450 350 700 0 0 0 450 1425 3300
Marcos Herrero Agustín 75 245 168 486 134 275 204 160 293 170 316 113 273 86 0 0 1463 1535
Carlos Morán Alfonso 110 110 340 400 200 240 350 750 100 100 0 800 0 0 0 0 1100 2400
Javier Mulero Martín 0 0 234 170 420 420 55 0 0 0 422 279 0 0 0 0 1131 869
Celia Rubio Madrigal 153 67 0 200 52 78 0 0 263 0 0 140 1131 0 245 0 1844 485
Ángela Ruiz Ribera 0 0 1003 31 0 0 0 0 0 0 256 11 0 0 0 0 1259 42
Carlos Tardón Rubio 148 234 230 101 381 8 109 30 230 0 339 5 0 0 0 0 1437 378
Totales 710 1297 2425 1988 1572 1575 718 940 1111 720 1723 2068 1404 86 306 475 9969 9149 19118

Resúmen de aportaciones por semana Aportaciones por idioma


Problemas encontrados

Este fragmento estaba en validaciones en español

Un problema que nos encontramos a la hora de validar es que la variedad de voces podía llegar a ser muy baja, escuchando la voz del mismo hombre en múltiples grabaciones, varios días seguidos. La poca variabilidad de voces empeora la calidad y diversidad del dataset. Esta fue otra razón por la que decidimos aportar en idiomas más minoritarios o menos populares, ya que este fenómeno ocurría más frecuentemente en estos casos. Con este trabajo hemos tratado de añadir una variedad de voces y acentos con el objetivo de mejorar la calidad global de los datos y los productos que deriven de los mismos.

Además, hemos colaborado para eliminar todos los datos no adecuados, reportando los fragmentos que debíamos leer, o rechazando las grabaciones de otros. Algunos ejemplos de motivos son el idioma incorrecto, un lenguaje ofensivo, o cualquier elemento del fragmento o grabación que infrinja los criterios de calidad impuestos. En la imagen incluimos el caso más categórico, que nos hemos encontrado en numerosas ocasiones al realizar grabaciones.

Obtención de puestos altos en el ranking

Cada integrante del grupo ha intentado aportar en lugares diversos y valiosos para este proyecto. Hemos intentado, sin que suponga una reducción de la variabilidad de voces, estar presentes en los rankings de Common Voice de algunos de los idiomas en los que hemos participado.

En primer lugar, Flavius se encuentra en el puesto 1 de validaciones en Rumano, y en el puesto 4 de grabaciones en el mismo idioma.

TopGrabacionesRumano.PNG TopValidacionesRumano.PNG

Por otro lado, Celia, Carlos Tardón y Ángela se encuentran en los puestos 15, 16 y 17, respectivamente, de grabaciones en idioma Español.

TopGrabacionesEspañol.png

Componentes del equipo

El equipo está compuesto íntegramente por estudiantes de 5º del Doble Grado de Ingeniería Informática-Matemáticas del curso 2021-2022:

  • María Arranz Lobo
  • Flavius Abel Ciapsa
  • Marcos Herrero Agustín
  • Carlos Morán Alfonso
  • Javier Mulero Martín
  • Celia Rubio Madrigal
  • Ángela Ruiz Ribera
  • Carlos Tardón Rubio

Referencias

  1. Un proyecto tecnológico propone que los asistentes de voz como Siri hablen más idiomas, por Axel Marazzi. 28 de Septiembre de 2021, en infobae.