Skip to content

Releases: hankcs/HanLP

v1.1.5内存优化

02 May 15:32
Compare
Choose a tag to compare
  1. 词典由AhoCorasickDoubleArrayTrie降级为DoubleArrayTrie,内存占用减少一半
  2. 所以词典的缓存与旧版不兼容,请删除缓存或者下载data-for-1.1.5.zip
  3. 为减小配置难度,提供内置了mini数据包的Portable版,零配置,可以通过Maven直接引入:
        <dependency>
            <groupId>com.hankcs</groupId>
            <artifactId>hanlp</artifactId>
            <version>portable-1.1.5</version>
        </dependency>

v1.1.4

28 Apr 11:20
Compare
Choose a tag to compare
  1. 优化了Viterbi分词速度
  2. 降低了人名识别误命中率
  3. 调整词性标注时的Viterbi算法
  4. 大幅改进CRF分词效果,并且提供新模型(与旧版本不兼容)

v1.1.3

15 Apr 08:49
Compare
Choose a tag to compare
  1. 新增了分词结果是否展示词性的配置项ShowTermNature=true
  2. 修复了停用词词典编码的潜在问题
  3. CRF算法微调,等待未来重新发布新模型
  4. 最大词频参数微调

v1.1.2

02 Apr 13:47
Compare
Choose a tag to compare

fixed issue #2

v1.1.1

31 Mar 11:46
Compare
Choose a tag to compare

修复两个词典路径问题

v1.1.0首发版

27 Mar 07:34
Compare
Choose a tag to compare

中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析)
需要jdk1.6以上

内部版本

12 Feb 09:30
Compare
Choose a tag to compare
内部版本 Pre-release
Pre-release

定义了基本接口,完成了大部分文档。
需要jdk1.7。