Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于中文和日文汉字问题 #65

Open
zi6xuan opened this issue Apr 24, 2018 · 4 comments
Open

关于中文和日文汉字问题 #65

zi6xuan opened this issue Apr 24, 2018 · 4 comments

Comments

@zi6xuan
Copy link

zi6xuan commented Apr 24, 2018

我在想,是否可以提供一个语言偏好的options来确定,返回的注音结果应该用中文还是日语还是韩语
毕竟中日韩文字混合在一起出现的情况无论如何也无法识别,一般情况下肯定只是其中一种

@dzcpy
Copy link
Owner

dzcpy commented May 27, 2018

是的,这种想法其实是挺不错的,之前也有俄罗斯人提出过按语言来选择采用哪种方案,但是目前来讲我个人抽不出时间这样维护。日语其实是属于一个特例,在不分析句子里的词的语义并按照一定方式断句的前提下几乎很难准确的找到汉字所相对应的罗马字,,有些汉字一个字可能的读音有几十种,这点比中文里的多音字问题还要严重。韩语因为是纯拼音语言可能情况更好一点。你有什么好的方法也欢迎交流,等我抽出时间了再来完善下

@zi6xuan
Copy link
Author

zi6xuan commented May 28, 2018

日语汉字多音却是是一个很麻烦的事情,我个人认为比较理想的方法就是连续汉字一起查字典,前提是要有支持这样查询的辞典,在线的查询,我看google还行,沪江和有道的挺准的,不知道开不开放API

@dzcpy
Copy link
Owner

dzcpy commented May 29, 2018

可以是可以啊,但是可能要整个改写API。现在的这个转换是按同步的方式做的,就是说转换的速度很快不用搞异步直接返回结果。如果搞分词的话速度会慢很多只能做成异步,如果是调用其他API就不太合适了,速度会很慢的,有些设备上可能没有办法联网就没法用了,我再想想怎么弄最好吧

@zi6xuan
Copy link
Author

zi6xuan commented Jun 1, 2018

多谢分享

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants