Skip to content

cenlibin/deeplearning_assignments

Repository files navigation

deeplearning_assignments

2021暑期深度学习课程实验

图像分类:CIFAR-10

参考Resnet论文中跑CIFAR-10的方法搭了两个不同深度的模型做分类
残差块确实能比较好减少网络退化,瓶颈层也能减少计算量
炼丹手法不够,精度差得有点多

num_layers 22 122
accuracy 73.48 77.20

图像生成:CelebA

参考了这篇DCGAN教程, 加深了网络图片大小改至128,并参考了一些训练GAN的trick(LeakyRelu,平滑标签)
效果展示:
image
训练不同阶段的生成效果:
image

文本分类:IMDB

尝试了多个模型,效果最好的是最简单的EmebddingBag
可能是任务比较简单,复杂的模型反而特别容易过拟合

model RNN LSTM Bidirectional-LSTM Transformer EmbeddingBag
accuracy 74.57 83.26 84.32 80.42 87.35

机器翻译:CMN-ENG

预处理:给的数据集好像预处理有些错误,使用了spacy重新做分词并按8:1:1重新划train, test, val
使用了两个模型,分别是基于LSTM的seq2seq,和自己复现的transformer,精度分别为 31.58%51.55%
此外,用了spacy的词向量初始化embedding layer
一些翻译效果展示:
image
绘制了一下attention的可视化(3个head):
image

About

Assignments of deeplearning study in 2021 summer

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages