Python常见工具集合!欢迎Star本项目,将不定期更新各种小工具;
1.NLP/T_S_transform_CN
Keywords: 繁体转换,简体转换,繁简转换,繁体转换简体
简介:中文繁体与简体转换代码,极简调用;
使用方法:将 TS_transform.py
文件拷贝到工作目录即可;使用例子见Example.py
文档;
特点:
- 支持包括,单行转换,列表转换以及文档转换;
- 支持多线程并行转换,经测试为单线程转换速度的4倍左右;
- 支持去除标点符号操作;
调用实例:
from TS_transform import *
print T2S('天好藍要和你一起看,起風時由你来温暖。')
# 输出:天好蓝要和你一起看,起风时由你来温暖。
2.NLP/Words_Count
Keywords: 词频统计,中文词频统计;
简介:输入一段中文文本,统计词语的词频;
使用方法:将 Words_Freq.py
文件拷贝到工作目录即可;
特点:
- 支持多线程并行统计;
- 支持包括TXT以及Excel输出;
- 支持排序后输出;
调用实例:
from Words_Freq import *
file_path = '../Data/Text_CN' # 待统计词频的文本文件位置;
fast_words_count(file_path, output_t = False)
# 调用统计函数,默认指定输出格式为excel文件