请问有没有选项可以做到一字一断呢 #84

chenmiaomiao · 2023-03-21T06:47:43Z

我是最近才开始做视频，其实我不知道该不该一字一断，但是视频里面有些小错误我想去掉，想偷懒，不知道可不可以把模型设成一字一断或者一词一段？

如果没有的话，我大致有个思路，先按照正常的长度去识别，再把句子断开，最后把断开的句子和音频再匹配出时间。我挺想把这个想法实现一下，不知道有没有这个必要。

Jonham · 2023-03-27T05:18:08Z

whisper新出的API，支持word-level.

momobobe · 2023-04-22T13:01:17Z

https://github.com/linto-ai/whisper-timestamped this one has already implemented it, so wait for any contributor to work on its adaptation @mli @yihong0618 @zcf0508

dangehub · 2024-10-16T08:53:22Z

感觉目前这类工具的顶点就是剪映的智能剪口播，那个字级剪辑是真的很好用。期待此项目后续能支持这个功能。

chenqianhe added the enhancement New feature or request label Aug 2, 2023

Provide feedback