英文文本会自动翻译 #115

FreedomXD · 2023-12-11T07:05:10Z

我有一批英文录音，想自动输出字幕但结果不甚理想，主要是会出现自动翻译的问题。以下是一段六级英语听力的转录结果

exts generated from A3_wKgMbl2yw1yiIds-AGX_jo0hufs184.srt.Mark the sentences to keep for autocut.
The format is [subtitle_index,duration_in_second] subtitle context.

原文都是英文，但转录出来的是中文。

请求参数：autucut -d .data/ --whisper-model=large

另外由于国内网络环境使用，我把transcribe.py中的62行以下的vad_model请求换成了使用本地文件
‘’’
if self.vad_model is None or self.detect_speech is None:
# torch load limit pytorch/vision#4156
torch.hub._validate_not_a_forked_repo = lambda a, b, c: True
#self.vad_model, funcs = torch.hub.load(
# repo_or_dir="snakers4/silero-vad", model="silero_vad", trust_repo=True
#)
self.vad_model, funcs = torch.hub.load(
repo_or_dir="/root/.cache/torch/hub/snakers4_silero-vad_master/", model="silero_vad", trust_repo=True, source='local'
)
self.detect_speech = funcs[0]
‘’‘

chenqianhe · 2023-12-11T07:25:50Z

autocut/autocut/main.py

Line 50 in 638f6d8

parser.add_argument(

--lang 指定语言

FreedomXD · 2023-12-11T08:00:21Z

autocut/autocut/main.py

Line 50 in 638f6d8

parser.add_argument(

--lang 指定语言

如果是中英文混合的音频，这里怎么指定好呢？我想让它中文的返回中文，英文的返回英文，谢谢！

chenqianhe · 2023-12-19T10:13:48Z

指定中文然后纯靠模型表现或者也许只能提前划分音频？如果指定语言为英文模型会把所有内容翻译为英文。

FreedomXD changed the title ~~识别英文视频会自动翻译~~ 英文文本会自动翻译 Dec 11, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

英文文本会自动翻译 #115

英文文本会自动翻译 #115

FreedomXD commented Dec 11, 2023

chenqianhe commented Dec 11, 2023

FreedomXD commented Dec 11, 2023

chenqianhe commented Dec 19, 2023

英文文本会自动翻译 #115

英文文本会自动翻译 #115

Comments

FreedomXD commented Dec 11, 2023

chenqianhe commented Dec 11, 2023

FreedomXD commented Dec 11, 2023

chenqianhe commented Dec 19, 2023