Hola,
Ahora que ya tenemos suficientes frases en español para potenciar grandes aportaciones a la donación y validación de voces, me gustaría abrir este tema para hacer un poco de tormenta de ideas sobre cómo atacar el reto que tenemos delante.
Actualmente hay 45 horas validadas en español, de las cuales unas 29 de 38 fueron hechas antes del import de wikipedia y contienen repeticiones de la misma frase, lo cual no es usado por los algoritmos de aprendizaje de Deep Speech.
Esto nos da unas 15 horas útiles validadas en español actualmente.
Como ya hemos comentado varias veces, se necesitan como mínimo 2000 horas para entrenar un modelo básico que sepa reconocer la voz.
Ahora, si queremos aumentar la cantidad y duración de las aportaciones de voz, así como de las validaciones, ¿qué ideas se os ocurren para conseguir que grandes cantidades de gente donen el máximo posible? Tened en cuenta que cada frase tarda en grabarse unos 5 segundos, lo cual nos hace necesitar al menos 1,8M de clips grabados y validados.
Algunas preguntas para iniciar este tema:
- ¿Cómo podemos incentivar grandes eventos (>80 personas) donde se donen y validen al menos 15 minutos por persona?
- ¿Cómo podemos hacer que estos eventos sigan ocurriendo de forma regular?
- ¿Qué incentivos podemos ofrecer a la gente para que participe?
- ¿Cómo podemos involucrar organizaciones y empresas para que ayuden con esto también e involucren a sus empleados?
- ¿Qué incentivos podemos ofrecerles?
Un ejemplo: 10 eventos de 80 personas cada uno, donando y validando 15 minutos de voz por personas, nos darían algo menos de 200 horas.
¡Gracias a todos por vuestras ideas!