-
Notifications
You must be signed in to change notification settings - Fork 683
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
md 和 src 句子太长,能否自动断句 #11
Comments
突然发现视频 cut 之后,字幕文件没有 cut |
简单的方式可以用标点符号断, 设一个阈值, duration用字数比例做系数就行了, 我之前做项目尝试过, 对中文来说效果还行. vad是有这种小缺陷. |
CV 的工具我好能懂一些,语音识别的工具箱我是完全不懂。通过设定阈值,应该是可行,但找不到设定参数的代码位置。 如果辛辛苦苦矫正的 src 文件没法被 cut 同步,后期还得再来一次字幕生成&矫正,也费时。 |
有兴趣的话欢迎PR这个feature |
@chenxinfeng4 你可以试试 |
我之前展示的是medium的结果,我又试了 large 模型——断句更短,效果很好多。但对于“视频”字幕来说,还是稍微有点长。可能是这些模型并没有专门为了配字幕而fineture吧。
|
一个办法是先按照标点split,这样前两句就可以变短。 后面的话可以先切词,然后按均匀长度分开就是。例如 import jieba
list(jieba.cut('我们怎样去查看这条在代码中获得的具体的预支呢?')) 输出
|
autocut 的识别精度和呈现效果已经不错,对我来说是一个“惊喜”。瑕疵是有的,离专业的字幕调试有很长的路。但对于我们既做AI,又愿意剪片子的人来说,autocut 是一个很有趣有用的方面,也让我去畅享未来AI的应用。 或许 autocut 的后继者能像“copilot” 跨界,引导视频创作产业吧。 代码很优雅,向您看齐。Issue closed。 |
|
试试这个库? 分句之后音频时间的划分是不是可以 可以在先按字数比例确定大概时间点后;在考虑这个时间点前后一段时间,在整个这一段中找到波谷当做划分点是不是能再减小误差呢? 虽然说15字是一般的字幕字数上限;但是其实每句划分该是要根据内容来不太应该随便断开;我目前想法是分词后对应时间的时候也考虑音频的波峰波谷,文本跟音频的波峰基本能一一对应,这样来找对应划分时间点应该更准确一点。 以及这个issue是不是可以再打开,大家一起看看这个问题有没有更优的做法呢? |
发现确实有这个问题,如果修改md文件的话只会依赖md剪切,srt没动,还得再手动处理;我刚搞了srt转md,等下把srt剪切也顺便搞下,不然确实难受了 |
剪辑后会生成新的srt |
这个挺好的。本来我也是想实现这个。就是在最终的字幕生成上,可以先转成 md 编译,然后再转回去 |
md和srt各有优势吧。md编辑内容会好搞点,但是调整对应的时间在srt上好做一些,借助Arctime软件啥的很好调整。支持单个调整,整体偏移等等。 |
听过说这个,没用过。他的字幕生成好像是收费的吧?几年前用过剪映,能免费生成字幕,但对长视频编辑比较吃力一点。 |
没用过他的字幕生成,一直都是只用他的打轴和字幕编辑,都是免费的
…---原始邮件---
发件人: "Mu ***@***.***>
发送时间: 2022年11月11日(周五) 上午10:29
收件人: ***@***.***>;
抄送: "Qianhe ***@***.******@***.***>;
主题: Re: [mli/autocut] md 和 src 句子太长,能否自动断句 (Issue #11)
https://arctime.org/
听过说这个,没用过。他的字幕生成好像是收费的吧?几年前用过剪映,能免费生成字幕,但对长视频编辑比较吃力一点。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
之后有时间的话可以做一个文档,讲下常见录屏、录像,和用编译软件做最后的一些精调。方便没有太多视频编辑经验的同学。 |
|
转录某个视频生成.srt和.md结果识别差不多是正确的。但我中间停顿比较少,使得字幕连成一片。能否有好的预处理方法,能合适的断句。
The text was updated successfully, but these errors were encountered: