Bonjour tout le monde,
Je suppose que le problème a été rencontré par pas mal de monde mais je ne l’ai pas vu être évoqué.
Lorsque je m’enregistre ou que je valide des échantillons, je remarque qu’il y a de plus en plus de phrase dont les mots accentués sont découpés en plusieurs morceaux, rendant la phrase illisible et surtout pénalisant probablement les algorithmes apprenant à partir de ces phrases.
Exemple de phrase : “Un commencement de mystère menaçait « l’ordre établi », lequel était suspect et sournois.”
Au début je laissais passer pensant que c’était marginal ou que c’était un bug côté front mais je pense que le problème est assez important pour être adressé.
Une idée d’où ça peut venir ?