Skip to content

FFTYYY/Poem

Repository files navigation

『鹦鹉赋』是一个以白话文作为输入的古诗生成系统。

展示 (展示系统目前不可用)

简介

使用弱监督训练的白话生成古诗系统。

更详细的介绍可以看report.pdf(摸了_(:з」∠)_

训练和生成

  1. 训练:python train.py --gpus=0,1,2,3 --name=<name>
  2. 生成:python generate.py --name=<name>

我是在4块至少10G显存的gpu上训练的,如果gpu不够或者显存太小可以适当把batch_size改小(通过--batch_size指令),不过这么干有可能无法复现结果。

数据集复用

  1. 本文使用的数据集Verna_Tangshi文件保存在data/Verna_Tangshi.txt
  2. 可以调用data/data_generator.py从现有的诗集生成白话-诗歌数据集。创建一个新文件data/Tangshi.txt,把作为数据的诗歌写进去(每首一行),然后调用python data_generator.py就可以了
  3. 注意,调用data_generator.py之前需要先注册百度翻译api账号,注册之后创建一个寻文件data/baidu_ids.py,将你的id写进去,格式类似于:
ids = {
	"id1" : [
		'xxxxx' , # id
		'xxxxx' , # 密码
	 ] ,
}

可以使用多个id轮流调用以加快生成速度,或者使用Google翻译,需要自行改代码。

About

从白话文生成古诗。我的NLP期末课程项目

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages