v1.7.4 与OpenCC完全一致的简繁转换
- 无损转换OpenCC词典,结果一致 https://github.com/hankcs/OpenCC-to-HanLP fix #1184
- 停用词典支持热更新:fix #1158
- 修正URLTokenizer中的正则表达式 fix #1188
- 修复自定义词性 fix #1172
- 修正 CollectionUtility.sortMapByValue(java.util.Map<K,V>, boolean) fix #1159
- 修订人名词典
- 修正角色标注时“始##始”的A标签 fix #434
- Add unit tests for com.hankcs.hanlp.utility.MathUtilityTest and com.hankcs.hanlp.algorithm.EditDistance
- 微调bigram fix #1015
- 新数据包data-for-1.7.4.zip 或 海外 或 网盘
md5=0e2e1bfc4da6d9305909ce815cbe5a44
- Portable版同步升级到v1.7.4
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.4</version>
</dependency>
🎉感谢所有在issue中提出宝贵建议的用户!