GitHub

『鹦鹉赋』是一个以白话文作为输入的古诗生成系统。

展示（展示系统目前不可用）

简介

使用弱监督训练的白话生成古诗系统。

更详细的介绍可以看report.pdf（摸了_(:з」∠)_

我是在4块至少10G显存的gpu上训练的，如果gpu不够或者显存太小可以适当把batch_size改小（通过--batch_size指令），不过这么干有可能无法复现结果。

本文使用的数据集Verna_Tangshi文件保存在data/Verna_Tangshi.txt
可以调用data/data_generator.py从现有的诗集生成白话-诗歌数据集。创建一个新文件data/Tangshi.txt，把作为数据的诗歌写进去（每首一行），然后调用python data_generator.py就可以了
注意，调用data_generator.py之前需要先注册百度翻译api账号，注册之后创建一个寻文件data/baidu_ids.py，将你的id写进去，格式类似于：

ids = {
	"id1" : [
		'xxxxx' , # id
		'xxxxx' , # 密码
	 ] ,
}

可以使用多个id轮流调用以加快生成速度，或者使用Google翻译，需要自行改代码。

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
data		data
model		model
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.py		config.py
dataloader.py		dataloader.py
generate.py		generate.py
instructions.txt		instructions.txt
report.pdf		report.pdf
train.py		train.py
utils.py		utils.py