Repository for Korean speech-to-text.
- Note that current version does not include any LM (Language Model).
- Values of WER (Word Error Rate) on the graph is actually a CER (Character Error Rate).
- Took almost a month to train this model.
Texts | |
---|---|
Answer label | 데 뭐 쾌락이라는 게 기분이 좋은 거잖아. 데 기분이 좋다고 해서 모두가 다 나쁜 걸까, 라는 생각을 해. |
Output | 근데 뭐 켸라ᅡᆨ이라는 게 기분이 좋은 거잖아ᅡ. 그 ᄀ기분이 좋다ᄀ고 해서 모두가 ᄃ다다ᅡ쁜 거ᅥᆯ까 라는 새ᅢᆼ각을 해. |
CTC Decoded | 근데 뭐 켸락이라는 게 기분이 좋은 거잖아. 그 기분이 좋다고 해서 모두가 다다쁜 걸까 라는 생각을 해. |