-
Notifications
You must be signed in to change notification settings - Fork 156
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Can not recognize the audio stream correctly in demo #296
Comments
please describe which apk you are using and what phone you are using. |
It works perfectly on my Xiaomi 10 with the following model. |
Huawei Mate 30 5G. And always got some incorrect recognition , If I used if (model.isEndpoint()) { |
THANKS |
Have you tried |
普通话标准不? |
会漏话,漏了很多话,没有识别出来。然后if (model.isEndpoint()) { 还是: |
-.-.mp4 |
感谢! |
不需要你改代码,你直接用我们的 apk, 也会有问题? |
1653_1705413751.mp4还真有可能是你发音的问题 |
你换个人测试下? |
直接使用你的原装APP,也不行,有可能你的算法中存在VAD检测导致的话头经常不被识别 |
别人测试的效果更不好 |
我发现有个2022年的模型不会出现这个问题,但是,识别的精准度很差。if (model.isEndpoint()) { |
这个是我用你的音频,和我自己的声音测试的,你看下? |
是说录音的测试效果不好? |
复现不了你的问题 |
还有个问题请教,发现安卓应用重启多次以后,这个语音识别库出现各种异常,应该如何释放资源?谢谢2024-01-17 22:30:46.512 31274-31970 libc ID_main_service.ID_main_service A Fatal signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 0x7475700070 in tid 31970 (Thread-29), pid 31274 (ID_main_service) |
你有修改什么代码么?跑的是我们提供的 apk ,还是你自己用我们的 api 去跑的? 如果你用你自己的代码,你是如何写的呢? |
没有修改源码,但是不知道为什么,在app中重启几次后,就出现这个问题 |
这个不是我们 apk 里面的 tag, 如果你没修改代码而是直接使用我们的 apk 的话,不应该出现这个 log. |
找到原因了,是因为资源没有释放干净,还有一个疑问如何给这个开源项目增加词汇表,比如成语什么的,例如朝三暮四? |
是哪个地方?请贴一下代码,我们也好 fix 一下,避免后来的人碰到你这个问题。 |
我现在没有修改音频识别的代码,是我的线程同时两个以上在进行音频识别导致,线程中包括了对音频的识别,重启APP的时候,有时候线程没有释放干净。 |
好吧。我是看明白了。 我理解的没改代码,是你用我们提供的代码,不做任何改动。这里的不做任何改动,是指跑我们 master 的代码 你们是把我们提供的代码用到了你们的项目里,这个也算是有改动了。 |
是的,谢谢! |
还有一个疑问如何给这个开源项目增加词汇表,比如成语什么的,例如朝三暮四? |
你看 tokens.txt, 都是单个的字。不需要你加的。 你现在是碰到什么问题了吗? |
这个再确认下,你用我们的 apk 直接跑,也不行? |
用你们的APK,直接大声说话可以,稍微放松音量常常话头就没有了。鲁棒性感觉不好。第二如果不增加释放代码的话在应用内重启APP资源释放不掉,尝试以下代码,闪退不断: private fun restartApp() {
|
解决了。如果把整个音频识别对象放在线程中,那么重启的时候可以直接释放线程资源,并把音频识别器的资源顺便释放。如果音频识别器放在主线程中,那么重启的时候无法使用model.finalize()释放内存,问题就不好办。 |
所以建议demo可以修改一下,模型的初始化等等都放到线程中。 |
对于项目的几个建议:1、丰富基本的常见汉语成语词汇,例如“朝三暮四”,“得陇望蜀”,“南辕北辙”,“杯弓蛇影”等 |
why this model always fail to recognize this audio normally! # the script is "1.01 的十次方等于多少,1.02 的十次方等于多少.。。。1.09 的十次方等于多少",always lost some information as follows:
The text was updated successfully, but these errors were encountered: