为 Rime 寻觅字表时,发现官方的袖珍简化字方案、四叶草方案及其他一些方案的字表欠佳。
- 生僻字太多,包含很多古字和繁体字。
- 错误或过时的注音比较多,如「旁bang」「亡wu」「呆ai」「帧zheng」等等很多,至少几百个。
一个一个手动修改太过麻烦,干脆整理一份完全正确的。
这个数据、《现汉7》、《现代汉语规范词典》之间的注音并不都相同,使用前请注意。
「nüe 虐」「lüe 略」使用了「nve」「lve」的注音。
「句、去、需、雨」等使用了「ju qu xu yu」的注音。
格式为 汉字\t注音
,方便自己套用任何字频,只做了去重(曲 qū qǔ → qu),未作其他加工。
添加字频。
对少许注音做了一些修改,如「哟you yo」「喔 wo o」,在注释里有注明。
增加了少许不在字表中的字:如「囧」「屌」「〇」等。
调整一些权重顺序。
完善了常用多音字自动注音的问题。
不在这个仓库更新了,需要的可以查看这里:8105.dict.yaml