Skip to content

Python常见工具集合-繁简转换/繁体转换; 词频统计;

Notifications You must be signed in to change notification settings

zhiyulee-RUC/CTools

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 

Repository files navigation

CTools

Python常见工具集合!欢迎Star本项目,将不定期更新各种小工具;

1.NLP/T_S_transform_CN

Keywords: 繁体转换,简体转换,繁简转换,繁体转换简体

简介:中文繁体与简体转换代码,极简调用;

使用方法:将 TS_transform.py 文件拷贝到工作目录即可;使用例子见Example.py文档;

特点:

  • 支持包括,单行转换,列表转换以及文档转换;
  • 支持多线程并行转换,经测试为单线程转换速度的4倍左右;
  • 支持去除标点符号操作;

调用实例:

from TS_transform import *
print T2S('天好藍要和你一起看,起風時由你来温暖。')
# 输出:天好蓝要和你一起看,起风时由你来温暖。

2.NLP/Words_Count

Keywords: 词频统计,中文词频统计;

简介:输入一段中文文本,统计词语的词频;

使用方法:将 Words_Freq.py 文件拷贝到工作目录即可;

特点:

  • 支持多线程并行统计;
  • 支持包括TXT以及Excel输出;
  • 支持排序后输出;

调用实例:

from Words_Freq import *
file_path = '../Data/Text_CN' # 待统计词频的文本文件位置;
fast_words_count(file_path, output_t = False) 
# 调用统计函数,默认指定输出格式为excel文件

About

Python常见工具集合-繁简转换/繁体转换; 词频统计;

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages