Volumen de voces y objetivos [se necesitan ideas]

nukeador · July 26, 2019, 1:58pm

Hola,

Ahora que ya tenemos suficientes frases en español para potenciar grandes aportaciones a la donación y validación de voces, me gustaría abrir este tema para hacer un poco de tormenta de ideas sobre cómo atacar el reto que tenemos delante.

Actualmente hay 45 horas validadas en español, de las cuales unas 29 de 38 fueron hechas antes del import de wikipedia y contienen repeticiones de la misma frase, lo cual no es usado por los algoritmos de aprendizaje de Deep Speech.

Esto nos da unas 15 horas útiles validadas en español actualmente.

Como ya hemos comentado varias veces, se necesitan como mínimo 2000 horas para entrenar un modelo básico que sepa reconocer la voz.

Ahora, si queremos aumentar la cantidad y duración de las aportaciones de voz, así como de las validaciones, ¿qué ideas se os ocurren para conseguir que grandes cantidades de gente donen el máximo posible? Tened en cuenta que cada frase tarda en grabarse unos 5 segundos, lo cual nos hace necesitar al menos 1,8M de clips grabados y validados.

Algunas preguntas para iniciar este tema:

¿Cómo podemos incentivar grandes eventos (>80 personas) donde se donen y validen al menos 15 minutos por persona?
¿Cómo podemos hacer que estos eventos sigan ocurriendo de forma regular?
¿Qué incentivos podemos ofrecer a la gente para que participe?
¿Cómo podemos involucrar organizaciones y empresas para que ayuden con esto también e involucren a sus empleados?
¿Qué incentivos podemos ofrecerles?

Un ejemplo: 10 eventos de 80 personas cada uno, donando y validando 15 minutos de voz por personas, nos darían algo menos de 200 horas.

¡Gracias a todos por vuestras ideas!

Skatox · July 26, 2019, 2:18pm

En la mayoria de eventos las personas se mueren por tener un sticker o swag de Mozilla/Firefox. Podríamos hacer actividades donde al donar o participar en Common Voice se les done eso, así tenemos algo a cambio y creo que muchas personas aceptarían, ademas que probablemente les llame la atención y participe mas adelante en el proyecto.

En la comunidad WordPress hacen un translation day donde se ponen de acuerdo en todo el mundo para reunirse y hacer traducciones, se puede organizar algo similar para que las personas de habla hispana se reunan en un mismo dia y colaboren con horas de audio

nukeador · July 26, 2019, 3:34pm

Es interesante la idea, siempre y cuando el coste del sticker/recompensa sea muy bajo.

Ya que hay que tener en cuenta que si pagas a una empresa por el crowdsourcing, el precio de una hora de voces equivaldría a unos $18-20, y validar una hora de voces otros $18-20.

Si en un evento de 80 personas se consiguen generar 1200 minutos validados (20h a 15 minutos por persona), creo que tendría sentido gastar $10-20 para producir stickers.

Seria bueno también validar con un par de pruebas en el mundo real esta teoría de que las recompensas equivalen a más participación, no es lo mismo que donen y validen 15 minutos por persona, que solo 1-2 minutos.

Si la gente dedica 2 minutos a donar y 2 a validar, el evento generaría 2,6 horas, que tienen un coste de $48 en mercado. Si tuviéramos que pagar las 2000hrs con stickers el coste serían unos $6600.

keikkun · July 26, 2019, 7:06pm

Se me ocurren que esta clase de eventos se puede plantear con un salón cerrado para estar grabando y validando grabaciones donde las personas puedan pasar a sentarse y hacer uso de la red local para ello tambien es bueno facilitar audifonos y microfono para los que quieran grabar y audifonos para los que solo quieran validar. Junto a ello un stand informativo fuera del salón para evitar la mayor cantidad de ruido dentro de donde se realicen las grabaciones para que la gente llegue se puede hacer una rejilla de charlas o taller en un tercer espacio donde se traten temas sobre aprendizaje de maquina e inteligencia artificial con gente local y que ellos mismos o el maestro de ceremonia entre cada actividad recuerde a los asistentes de los beneficios y avances del salón de grabación y que pasen al stand a informase del proceso de common voice.

Se me ocurre tambien que seria diveritdo en este formato tener un tipo de conteo al estilo teletón de: “hemos recolectado tanto, pasa y permite que lleguemos a la meta”, estas cosas se ponen emocionantes cuando es asi.

Con respecto a la motivación lo del sticker queda bien además podriamos pensar en camisetas para la gente que se quede por mas tiempo algo asi como premio por escala de donación el swag va sumandose.

Creo que a las empresas les podemos llegar con algun estudio de mercado que les deje ver los beneficios o el ahorro que puede significar para sus invertir en common voice para optener esa base de datos mas el respectivo aparecimiento del logo de su empresa como un inversionista en el proyecto, si se puede hacer una carta validando su donación algunas empresas lo ven atractivo ya que pueden declararlo y ahorrarse en impuestos, recuerden que con empresas hay que ser bien directos en el factor economico.

Con las universidades hay que dirigirse a los departamentos de investigación quienes pueden tener mucho mas interes en la inversión y seguimiento del proyecto ya que los costos con respecto a invertir en common voice y llevar su propia recolección de datos tienen una diferencia marcada ademas para los centro de investigación el reconocimiento de colaboración en proyectos de esta indole son interesantes.

Son algunas ideas…

ibuioli · July 29, 2019, 4:26am

La idea de involucrar empresas es muy buena (diría que mejor que las Universidades, salvo que se consiga un buen trato con alguna). Yo soy socio en una pequeña empresa de informática donde estuvimos de acuerdo en hacer difusión al proyecto Common Voice durante toda la semana pasada mediante redes y blogs (porque el proyecto nos interesa, no esperamos nada a cambio, pero la mayoría de las empresas no siempre piensan igual). Nuestro alcance no es muy elevado, pero estoy convencido de que cualquier empresa de Software o Tecnología estará feliz de colaborar en un proyecto de Mozilla si a cambio aparecen en una sección de “Instituciones que han Contribuido” (o algo similar, lo que suele denominarse como “Embajadores”). No sé, igualmente, en que estado actualmente Mozilla tiene interés de tener una sección así, eso ya lo dejo a quien corresponda. Por supuesto que esto a priori no genera horas de grabación en masa (salvo que se llegue a un acuerdo con dichas empresas). Pero lo que si genera difusión, y en el estado actual del proyecto parece ser una gran estrategia. Al menos consideraría tener un formulario de contacto para dichas instituciones.

–

Después, respecto a conseguir la mayor cantidad de donaciones posibles, la idea de la interfaz con tanta “gamificación” es un punto a favor, y yo lo seguiría trabajando. Esto posiblemente vaya mejor en otro foro de discución, así que seré breve. Sería ideal tener una tecla asignada a grabar en lugar de tener que hacer click en un botón (desconozco si existe, de ser así no está indicada). Y otra cosa importante, para los que estamos un rato largo validando los audios, hace falta una opción (que puede estar en configuración) para disparar los audios automáticamente luego de apretar “Si” o “No” (del mismo modo que está la configuración para desactivar el cartel al final de los 5 audios). Parece algo banal, pero reducir la acción de validar de dos clicks o solamente uno lo va a hacer mucho más ágil para quienes lo deseen.

Saludos.

nukeador · July 29, 2019, 2:11pm

3 posts were split to a new topic: Mejoras en la experiencia de la app

isabel.caballero.ingles · October 20, 2019, 9:22pm

Pienso que haciendo las propuestas en centros educativos se podrían obtener muchisimas colaboraciones a cambio de, por ejemplo, un diploma para el centro, algún poster, algo bonito para poner en el hall que hable de la contribución realizada…

allthatsthings · October 24, 2019, 5:48pm

Me sumo a ésta idea, ya que lo había pensado nada más leer el título del tema.
Si se hablase con los colegios de primaria e institutos de secundaria para unirse al proyecto desde clase, obtendríamos más participación en el idioma español.

nukeador · October 25, 2019, 2:37pm

Cuidado, por motivos legales no podemos recopilar voces de menores de 19 años, en la propia página avisamos de ellos en los términos de uso

allthatsthings · October 27, 2019, 3:48pm

Tienes razón, pero refería a colegios e institutos en el marco de lo legal, con autorizaciones por parte de sus padres. Nunca iría en contra de ello.
Otra idea, podría ser una entrevista corta en algún medio, por ahora yo lo que hago es el método tradicional de boca en boca, para que se unan. Pero, me gusta tanto que creo que lo voy a empezar a promover por mis redes sociales enlazando desde vuestras redes.

nukeador · October 28, 2019, 12:50pm

El problema es que actualmente no tenemos un proceso para recopilar estas autorizaciones, ni tenemos tiempo material para hacerlo ni en inglés (el equipo de Common Voice es diminuto).

Vamos a consultarlo con el equipo legal de Mozilla, pero posiblemente tengamos que decir que no podemos aceptar estas colaboraciones al menos de momento.

allthatsthings · November 7, 2019, 6:23pm

¿Cómo podemos hacer que estos eventos sigan ocurriendo de forma regular?

He pensado que una forma de que este evento siga prosperando, es exponer el tema de manera visual en cursos de Lengua y Literatura Castellana. Docentes, pedagogos del lenguaje e incluso profesorado de lengua extranjera que impartan el Castellano, o personas como yo, que exponen una o dos veces al año temas libres de interés común para diversos tipos de público.

¿Cómo podemos involucrar organizaciones y empresas para que ayuden con esto también e involucren a sus empleados?
De la misma manera que la mencionada en la anterior respuesta. Pero para que los empleados puedan hacerlo, deberían tener un mentor que lo hiciera primero (siempre de forma altruista o con coste muy mínimo)

El material tendría que ser ofrecido de forma audiovisual, en una sala con ordenadores para que todos puedan seguir las instrucciones y luego desde casa la gente pueda practicarlo e ir cogiendo el ritmo. En el material a exponer, se remarcaría que no es obligatorio, pero que es una forma de mejorar la comprensión lectora y la articulación vocal.

¿Qué te parece?

nukeador · November 7, 2019, 7:11pm

Gracias por las ideas, un par de preguntas para movernos del terreno de las ideas al de los datos para informar cuánto valor puede aportar estas ideas:

¿De qué forma podríamos probarlas sin que requieran más de un mes de esfuerzo? Esto es, ¿quién podría probarlas y medir el éxito (horas recolectadas/validadas) que tienen así como las limitaciones?

¿Alguien podría montar un piloto/experimento de menos de un mes sobre esto? De ser así, ¿qué necesitaría?

Un saludo.

allthatsthings · November 7, 2019, 7:32pm

¿Alguien podría montar un piloto/experimento de menos de un mes sobre esto? De ser así, ¿qué necesitaría?
Se puede montar por ejemplo un experimento en base a una exposición con 15 personas en un aula.
De parte de Mozilla solo se necesitaría, información para 30 minutos de exposición sobre common voice ( cómo y cuándo nació, cuál es el objetivo del proyecto, quienes pueden participar, que costo acarrearía, redes sociales, etc.)
Quien lo haga debe disponer de un aula, auditorio, sala donde existan ordenadores con conexión a Internet y pantalla informátizada para poder exponer a gusto.
Las limitaciones básicas serían: Impresos/costo (de una hoja por delante y por detrás)
ya se me irán ocurriendo más, ahora a cenar!