deeplearning_assignments

2021暑期深度学习课程实验

图像分类：CIFAR-10

参考Resnet论文中跑CIFAR-10的方法搭了两个不同深度的模型做分类
残差块确实能比较好减少网络退化，瓶颈层也能减少计算量
炼丹手法不够，精度差得有点多

num_layers	22	122
accuracy	73.48	77.20

图像生成：CelebA

参考了这篇DCGAN教程，加深了网络图片大小改至128，并参考了一些训练GAN的trick（LeakyRelu，平滑标签）
效果展示：

训练不同阶段的生成效果：

文本分类：IMDB

尝试了多个模型，效果最好的是最简单的EmebddingBag
可能是任务比较简单，复杂的模型反而特别容易过拟合

model	RNN	LSTM	Bidirectional-LSTM	Transformer	EmbeddingBag
accuracy	74.57	83.26	84.32	80.42	87.35

机器翻译：CMN-ENG

预处理：给的数据集好像预处理有些错误，使用了spacy重新做分词并按8：1：1重新划train, test, val
使用了两个模型，分别是基于LSTM的seq2seq，和自己复现的transformer，精度分别为 31.58% 和 51.55%
此外，用了spacy的词向量初始化embedding layer
一些翻译效果展示：

绘制了一下attention的可视化（3个head）:

Name		Name	Last commit message	Last commit date
Latest commit History 59 Commits
Images		Images
ImagesClassification		ImagesClassification
ImagesGeneration		ImagesGeneration
MachineTranslation		MachineTranslation
TextClassification		TextClassification
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

deeplearning_assignments

图像分类：CIFAR-10

图像生成：CelebA

文本分类：IMDB

机器翻译：CMN-ENG

About

Releases

Packages

Languages

cenlibin/deeplearning_assignments

Folders and files

Latest commit

History

Repository files navigation

deeplearning_assignments

图像分类：CIFAR-10

图像生成：CelebA

文本分类：IMDB

机器翻译：CMN-ENG

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages