LaserTagger-Chinese

主要工作

记得准备corpus/rephrase_corpus 那种数据（test.txt、train.txt、tune.txt）
记得安装包：pip install requirements.txt
其中的export python=/home/xxx/anaconda3/envs/tf15_py37/bin/python3记得改成你自己的python环境路径
其中的export Root_Dir=xx记得改成你自己的代码根目录

# shell里面给出了参数注释
# 处理数据
sh 1.data_process.sh
# 训练
sh 2.train.sh
# 导出pb模型
sh 3.export.sh
# 预测
sh 4.predict.sh
# 计算预测后的分数
sh 5.eval_score.sh

bert数据（RoBERTa-tiny-clue）直接放进来了，在bert_base/RoBERTa-tiny-clue 所以你不用去别的地方下载了

和谷歌的LaserTagger模型中configs/lasertagger_config.json 中那样的，因为RoBERTa-tiny-clue参数要小很多

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
bert_base/RoBERTa-tiny-clue		bert_base/RoBERTa-tiny-clue
configs		configs
corpus		corpus
output		output
src		src
1.data_process.sh		1.data_process.sh
2.train.sh		2.train.sh
3.export.sh		3.export.sh
4.predict.sh		4.predict.sh
5.eval_score.sh		5.eval_score.sh
README.md		README.md
phrase_vocabulary_optimization.py		phrase_vocabulary_optimization.py
predict_main.py		predict_main.py
preprocess_main.py		preprocess_main.py
requirements.txt		requirements.txt
run_lasertagger.py		run_lasertagger.py
score_main.py		score_main.py