adversarial_A.py

# -*- coding: utf-8 -*-
import time
import os
import random
import sys
import traceback
import threading
import argparse
import pickle
import torch
import torch.optim as optim
from torch.optim.lr_scheduler import ReduceLROnPlateau
from torch.autograd import Variable
from torch.utils.data import DataLoader, Dataset, TensorDataset
import matplotlib.pyplot as plt

from utils.models import *
from utils.discriminator import *
from utils.discriminators import *

from tqdm import tqdm

from utils.disc_dataset import *
from utils.dataset import get_loader as get_loader_t
from adver_trainer import LSTMDebugger


class AdversarialBase:
    def __init__(self, args):
        self.args = args
        self.params_d = None
        self.params_d_1 = None

        self.params = None
        self.train_loss = 0
        self.batch_size = 4
        self.g_min_train_loss = 100000000000
        self.d_min_train_loss = 100000000000
        self.d_min_train_loss_1 = 100000000000

        self._init_model_path()
        self.vocab, self.vocab_count = self._init_vocab()

        self.extractor = self._init_visual_extractor()
        self.mlc = self._init_mlc()
        self.co_attention = self._init_co_attention()

        self.sentence_model = self._init_sentence_model()
        self.word_model = self._init_word_model()
        self.model_state_dict = self._load_model_state_dict()
        self.disc_model = self._init_disc_model()
        self.discs_model = self._init_discs_model()
        self.bce_criterion = self._init_bce_criterion()
        self.ce_criterion = self._init_ce_criterion()
        self.mse_criterion = self._init_mse_criterion()

        self.reward = torch.zeros(self.batch_size, 1)
        self.optimizer = self._init_optimizer()
        self.optimizer_d = self._init_optimizer_d()
        self.optimizer_d_1 = self._init_optimizer_d_1()

        self.model_dir_g = self._init_model_dir_g()
        self.model_dir = self._init_model_dir()

        self.gen_model = torch.load(self.args.load_model_path)
        self.train_transform = self._init_train_transform()
        self.data_loader = self._init_data_loader(self.args.adver_file_list, self.train_transform)
        self.logger = self._init_logger()

    def _init_vocab(self):
        with open(self.args.vocab_path, 'rb') as f:
            vocab = pickle.load(f)
        # print("Vocabulary Size:{}\n".format(len(vocab)))
        return vocab, len(vocab)
    def _init_model_path(self):
        if not os.path.exists(self.args.model_path):
            os.makedirs(self.args.model_path)

    def _init_data_loader_true(self):  # 加载数据  true data

        data_loader = get_loader(text_path=self.args.disc_train_true_data_list,
                                 vocabulary=self.vocab,
                                 batch_size=self.batch_size,
                                 s_max=6,
                                 n_max=30,
                                 shuffle=True)
        return data_loader

    def _init_data_loader_fake(self):  # 加载数据  fake data
        data_loader = get_loader(text_path=self.args.disc_train_fake_data_list,
                                 vocabulary=self.vocab,
                                 batch_size=self.batch_size,
                                 s_max=6,
                                 n_max=40,
                                 shuffle=True)
        return data_loader

    def _init_train_transform(self):
        transform = transforms.Compose([
            transforms.Resize(self.args.resize),
            transforms.RandomCrop(self.args.crop_size),
            # transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            transforms.Normalize((0.485, 0.456, 0.406),
                                 (0.229, 0.224, 0.225))])
        return transform

    def _load_model_state_dict(self):
        self.start_epoch = 0
        try:
            model_state = torch.load(self.args.load_disc_model_path)
            self.start_epoch = model_state['epoch']
            print("[Load Discriminator -{} Succeed!]\n".format(self.args.load_disc_model_path))
            print("Load From Epoch {}\n".format(model_state['epoch']))
            return model_state
        except Exception as err:
            print("[Load Discriminator Failed] {}\n".format(err))
            return None

    def _init_visual_extractor(self):
        model = VisualFeatureExtractor(model_name=self.args.visual_model_name,
                                       pretrained=self.args.pretrained)

        try:
            model_state = torch.load(self.args.load_visual_model_path)
            model.load_state_dict(model_state['extractor'])
            # print("[Load Visual Extractor Succeed!]\n")
        except Exception as err:
            print("[Load Visual Extractor Model Failed] {}\n".format(err))

        if not self.args.visual_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params:
                self.params += list(model.parameters())
            else:
                self.params = list(model.parameters())

        if self.args.cuda:
            model = model.cuda()

        return model

    def _init_mlc(self):
        model = MLC(classes=self.args.classes,
                    sementic_features_dim=self.args.sementic_features_dim,
                    fc_in_features=self.extractor.out_features,
                    k=self.args.k)

        try:
            model_state = torch.load(self.args.load_mlc_model_path)
            model.load_state_dict(model_state['mlc'])
            # print("[Load MLC Succeed!]\n")
        except Exception as err:
            print("[Load MLC Failed {}!]\n".format(err))

        if not self.args.mlc_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params:
                self.params += list(model.parameters())
            else:
                self.params = list(model.parameters())

        if self.args.cuda:
            model = model.cuda()
        return model

    def _init_co_attention(self):
        model = CoAttention(version=self.args.attention_version,
                            embed_size=self.args.embed_size,
                            hidden_size=self.args.hidden_size,
                            visual_size=self.extractor.out_features,
                            k=self.args.k,
                            momentum=self.args.momentum)

        try:
            model_state = torch.load(self.args.load_co_model_path)
            model.load_state_dict(model_state['co_attention'])
            # print("[Load Co-attention Succeed!]\n")
        except Exception as err:
            print("[Load Co-attention Failed {}!]\n".format(err))

        if not self.args.co_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params:
                self.params += list(model.parameters())
            else:
                self.params = list(model.parameters())

        if self.args.cuda:
            model = model.cuda()
        return model

    def _init_sentence_model(self):
        raise NotImplementedError

    def _init_word_model(self):
        raise NotImplementedError

    def _init_logger(self):
        logger = open('./results/results.txt', 'w')
        return logger

    def __save_json(self, result):
        result_path = self.args.result_path
        if not os.path.exists(result_path):
            os.makedirs(result_path)
        with open(os.path.join(result_path, '{}.json'.format(self.args.result_name)), 'w') as f:
            json.dump(result, f)  # 将json信息写进文件  dump

    def _init_data_loader(self, file_list, transform):
        data_loader = get_loader_t(image_dir=self.args.image_dir,
                                   caption_json=self.args.caption_json,
                                   file_list=file_list,
                                   vocabulary=self.vocab,
                                   transform=transform,
                                   batch_size=self.batch_size,
                                   s_max=self.args.s_max,
                                   n_max=self.args.n_max,
                                   shuffle=True)
        return data_loader

    def __vec2sent(self, array):  # array是word_id 将Word_id转成单词
        sampled_caption = []
        for word_id in array:
            word = self.vocab.get_word_by_id(word_id)
            if word == '<start>':
                continue
            if word == '<end>' or word == '<pad>':
                break
            sampled_caption.append(word)
        return ' '.join(sampled_caption)

    def generate(self):
        self.extractor.train()
        self.mlc.train()
        self.co_attention.train()
        self.sentence_model.train()
        self.word_model.train()
        progress_bar = tqdm(self.data_loader, desc='Generating')
        results = {}
        writer = open('./data/new_data/disc_train_fake_data.txt', 'w')
        for images, image_id, label, captions, _ in progress_bar:
            images = self._to_var(images, requires_grad=False)
            visual_features, avg_features = self.extractor.forward(images)
            tags, semantic_features = self.mlc.forward(avg_features)
            sentence_states = None
            prev_hidden_states = self._to_var(torch.zeros(images.shape[0], 1, self.args.hidden_size))
            pred_sentences = {}  # 预测
            real_sentences = {}  # 真实
            for i in image_id:
                pred_sentences[i] = {}  # 具体到每一张
                real_sentences[i] = {}
            for i in range(self.args.s_max):  # 句子数
                ctx, alpha_v, alpha_a = self.co_attention.forward(avg_features, semantic_features, prev_hidden_states)
                topic, p_stop, hidden_state, sentence_states = self.sentence_model.forward(ctx,
                                                                                           prev_hidden_states,
                                                                                           sentence_states)
                start_tokens = np.zeros((topic.shape[0], 1))  # [4, 1]
                start_tokens[:, 0] = self.vocab('<start>')
                start_tokens = self._to_var(torch.Tensor(start_tokens).long(), requires_grad=False)
                sample_ids = self.word_model.sample(topic, start_tokens)
                prev_hidden_states = hidden_state
                for id, array in zip(image_id, sample_ids):
                    pred_sentences[id][i] = self.__vec2sent(array)  # cpu().detach().numpy()
            for id, array in zip(image_id, captions):
                for i, sent in enumerate(array):
                    real_sentences[id][i] = self.__vec2sent(sent)
            for id, pred_tag, real_tag in zip(image_id, tags, label):
                results[id] = {
                    'Pred Sent': pred_sentences[id],
                    'Real Sent': real_sentences[id]
                }
                writer.write(str(pred_sentences[id]) + "." + "\n")
        writer.close()
        #  操作 disc_fake
        with open('./data/new_data/disc_train_fake_data.txt', 'r') as fr:
            lines = fr.readlines()
            for i, line in enumerate(lines):
                lines[i] = str(lines[i]).replace('{', '').replace('}', '')  # 去除[],这两行按数据不同，可以选择
                lines[i] = str(lines[i]).replace('0:', '').replace('1:', '').replace('2:', '').replace('3:', '').replace(
                        '4:', '').replace('5:', '')
                lines[i] = str(lines[i]).replace("'", '')  # 去除单引号,每行末尾追加换行符
                lines[i] = str(lines[i]).replace(", ", '.')
        f = open('./data/new_data/disc_train_fake_data.txt', 'w')
        f.writelines(lines)
        f.close()
        self.__save_json(results)

    @staticmethod
    def _init_mse_criterion():
        return nn.MSELoss()
    @staticmethod
    def _init_bce_criterion():
        return nn.BCELoss()

    @staticmethod
    def _init_ce_criterion():
        return nn.CrossEntropyLoss(size_average=False, reduce=False)

    def _init_optimizer(self):
        return torch.optim.Adam(params=self.params, lr=self.args.learning_rate)
    def _init_optimizer_d(self):  # 判别器优化
        return torch.optim.Adam(params=self.params_d, lr=self.args.learning_rate)

    def _init_optimizer_d_1(self):  # 判别器_1优化
        return torch.optim.Adam(params=self.params_d_1, lr=self.args.learning_rate)

    def _init_model_dir(self):
        model_dir = os.path.join(self.args.load_disc_model_path)
        if not os.path.exists(model_dir):
            os.makedirs(model_dir)
        model_dir = os.path.join(model_dir)
        return model_dir

    def _init_model_dir_1(self):
        model_dir = os.path.join(self.args.load_discs_model_path)
        if not os.path.exists(model_dir):
            os.makedirs(model_dir)
        model_dir = os.path.join(model_dir)
        return model_dir
    def _init_model_dir_g(self):
        model_dir = os.path.join(self.args.load_model_path)

        if not os.path.exists(model_dir):
            os.makedirs(model_dir)
        model_dir = os.path.join(model_dir)
        return model_dir
    def _init_disc_model(self):  # 加载判别器
        model = Discriminator(seq_length=1,
                              vocab_size=self.vocab_count,
                              emb_size=32,
                              filter_size=[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
                              num_filter=[100, 200, 200, 200, 200, 100, 100, 100, 100, 100, 160, 160],
                              dropoutRate=0.1)
        try:
            model_state = torch.load(self.args.load_disc_model_path)
            model.load_state_dict(model_state['discriminator'])
            print("[Load Discriminator Succeed!]\n")
        except Exception as err:
            print("[Load Discriminator Model Failed] {}\n".format(err))

        if not self.args.disc_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params_d:
                self.params_d += list(model.parameters())
            else:
                self.params_d = list(model.parameters())
        if self.args.cuda:
            model = model.cuda()
        return model

    def _init_discs_model(self):  # 加载判别器
        model = Discriminators(vocab_size=self.vocab_count,
                              input_size=50,
                              hidden_size=100,
                              num_class=2,
                              num_layers=1)
        try:
            model_state = torch.load(self.args.load_discs_model_path)
            model.load_state_dict(model_state['discs_model'])
            print("[Load Discriminators Succeed!]\n")
        except Exception as err:
            print("[Load Discriminators Model Failed] {}\n".format(err))

        if not self.args.disc_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params_d_1:
                self.params_d_1 += list(model.parameters())
            else:
                self.params_d_1 = list(model.parameters())
        if self.args.cuda:
            model = model.cuda()
        return model
    def _save_model_g(self,
                    epoch_id,
                    g_loss):
        def save_whole_model(_filename):
            print("Saved Model in {}\n".format(_filename))
            torch.save({'extractor': self.extractor.state_dict(),
                        'mlc': self.mlc.state_dict(),
                        'co_attention': self.co_attention.state_dict(),
                        'sentence_model': self.sentence_model.state_dict(),
                        'word_model': self.word_model.state_dict(),
                        'optimizer': self.optimizer.state_dict(),
                        'epoch': epoch_id},
                       os.path.join(self.args.saved_model_name, "{}".format(_filename)))
        if g_loss < self.g_min_train_loss:
            file_name = "train_best_loss.pth.tar"
            save_whole_model(file_name)
            self.g_min_train_loss = g_loss

    def _save_model(self,
                    epoch_id,
                    loss):
        def save_whole_model(_filename):
            print("Saved Model in {}\n".format(_filename))
            torch.save({'discriminator': self.disc_model.state_dict(),
                        'optimizer': self.optimizer_d.state_dict(),
                        'epoch': epoch_id},
                       os.path.join(self.args.disc_saved_model_name, "{}".format(_filename)))

        if loss < self.d_min_train_loss:
            file_name = "disc_train_best_loss.pth.tar"
            save_whole_model(file_name)
            self.d_min_train_loss = loss

    def _save_model_1(self,
                    epoch_id,
                    loss):
        def save_whole_model(_filename):
            print("Saved Model in {}\n".format(_filename))
            torch.save({'discs_model': self.discs_model.state_dict(),
                        'optimizer': self.optimizer_d_1.state_dict(),
                        'epoch': epoch_id},
                       os.path.join(self.args.discs_saved_model_name, "{}".format(_filename)))

        if loss < self.d_min_train_loss_1:
            file_name = "discs_train_best_loss.pth.tar"
            save_whole_model(file_name)
            self.d_min_train_loss_1 = loss
    def _to_var(self, x, requires_grad=True):
        if self.args.cuda:
            x = x.cuda()
        return Variable(x, requires_grad=requires_grad)

    def _get_date(self):
        return str(time.strftime('%Y%m%d', time.gmtime()))

    def _get_now(self):
        return str(time.strftime('%Y%m%d-%H:%M', time.gmtime()))

    def loss_with_reward(self, prediction, x, rewards):
        embedding = nn.Embedding(2195, 2195)
        prediction = embedding(prediction.long())
        x1 = x.contiguous().view([-1, 1]).long()
        one_hot = torch.Tensor(x1.shape[0], 2195).cuda()
        one_hot.zero_()
        x2 = one_hot.scatter_(1, x1, 1)
        pred1 = prediction.view([-1, 2195])
        pred2 = torch.log(torch.clamp(pred1, min=1e-20, max=1.0))
        prod = torch.mul(x2.cuda(), pred2.cuda())
        reduced_prod = torch.sum(prod, dim=1)
        rewards_prod = torch.mul(reduced_prod.cuda(), rewards.view([-1]).cuda())
        generator_loss = torch.sum(rewards_prod)
        return -generator_loss

    def loss_with_reward_1(self, prediction, x, rewards):
        embedding = nn.Embedding(2195, 2195)
        prediction = embedding(prediction.long())
        # print ("prediction after embedding:", prediction.shape)
        x1 = x.contiguous().view([-1, 1]).long()
        # print ("x1:", x1.shape)

        one_hot = torch.Tensor(x1.shape[0], 2195).cuda()
        one_hot.zero_()
        x2 = one_hot.scatter_(1, x1, 1)

        pred1 = prediction.view([-1, 2195])
        pred2 = torch.log(torch.clamp(pred1, min=1e-20, max=1.0))
        prod = torch.mul(x2.cuda(), pred2.cuda())
        reduced_prod = torch.sum(prod, dim=1)
        rewards_prod = torch.mul(reduced_prod.cuda(), rewards.view([-1]).cuda())
        generator_loss = torch.sum(rewards_prod)
        return -generator_loss
    def adver(self):
        print ("update generator")
        tag_loss, stop_loss, word_loss, loss = 0, 0, 0, 0
        for i, (images, image_id, label, captions, prob) in enumerate(self.data_loader):

            batch_tag_loss, batch_stop_loss, batch_word_loss, batch_sentence_loss, batch_sentence_loss_1,batch_loss = 0, 0, 0, 0, 0, 0
            images = self._to_var(images, requires_grad=False)
            visual_features, avg_features = self.extractor.forward(images)
            tags, semantic_features = self.mlc.forward(avg_features)
            # 标签损失
            batch_tag_loss = self.mse_criterion(tags, self._to_var(label, requires_grad=False)).sum()
            sentence_states = None
            # 中间层
            prev_hidden_states = self._to_var(torch.zeros(images.shape[0], 1, self.args.hidden_size), requires_grad=False)
            context = self._to_var(torch.Tensor(captions).long(), requires_grad=False)
            pred_sentences = []  # 预测
            reward_1 = []
            for sentence_index in range(0, captions.shape[1]):  # 是s_max=6 一个caption里有六句话
                ctx, alpha_v, alpha_a = self.co_attention.forward(avg_features,
                                                                  semantic_features,
                                                                  prev_hidden_states)
                topic, p_stop, hidden_states, sentence_states = self.sentence_model.forward(ctx,
                                                                                            prev_hidden_states,
                                                                                            sentence_states)
                # batch_stop_loss += self.ce_criterion(p_stop.squeeze(), prob_real[:, sentence_index]).sum().item()
                # for word_index in range(0, captions.shape[2]):  # 0
                #     words = self.word_model.forward(topic, context[:, sentence_index, :word_index])
                #     word_mask = (context[:, sentence_index, word_index] > 0).float()
                    # batch_word_loss += (self.ce_criterion(words, context[:, sentence_index, word_index])
                    #                     * word_mask).sum() * (0.9 ** word_index)
                start_tokens = np.zeros((topic.shape[0], 1))  # [4, 1]
                start_tokens[:, 0] = self.vocab('<start>')
                start_tokens = self._to_var(torch.Tensor(start_tokens).long(), requires_grad=False)
                sample_ids = self.word_model.sample(topic, start_tokens)  # [4,50]
                reward = []
                sample_ids = torch.from_numpy(sample_ids)
                pred_sentences.append(sample_ids)
                for j in range(0, sample_ids.shape[1]):
                    output = self.disc_model.forward(sample_ids[:, j:j + 1].cuda().long())
                    output = self._to_var(output, requires_grad=False)
                    indices = torch.LongTensor([0])
                    out = torch.index_select(output, 1, indices.cuda())
                    for i in out:
                        reward.append(i.item())
                reward = np.transpose(np.array(reward)) / 1.0
                reward = torch.Tensor(reward)
                s = []
                a = [0]
                for i in range(0, context[:, sentence_index, :].shape[0]):
                    t = context[:, sentence_index, :][i].tolist()  # 将tensor转为list
                    for j in range(0, self.args.n_max - context[:, sentence_index, :] .shape[1] ):
                        t.extend(a)
                    s.append(t)
                context1 = torch.Tensor(s)
                # 每个词相加得到reward “语义奖励”
                batch_sentence_loss += (self.loss_with_reward(sample_ids, context1.cuda(), reward)).sum().item()
            # 整个句子得到一个reward， “结构奖励”
            t = torch.LongTensor()
            for i in pred_sentences:
                pred_sentences_1 = np.asarray(i)
                pred_sentences_2 = torch.from_numpy(pred_sentences_1)
                t = torch.cat((t,pred_sentences_2.long()), 1)
            final_out = self.discs_model.forward(t)
            out_1 = torch.index_select(final_out, 1, indices)
            for i in out_1:
                reward_1.append(i.item())
            reward_1 = np.transpose(np.array(reward)) / 1.0
            reward_1 = torch.Tensor(reward_1)
            batch_sentence_loss_1 += (self.loss_with_reward_1(sample_ids, context1.cuda(), reward_1)).sum().item()
            # batch_sentence_loss = self._to_var(torch.tensor(batch_sentence_loss))
            # batch_sentence_loss_1 = self._to_var(torch.tensor(batch_sentence_loss_1))
            # batch_loss = self.args.lambda_tag * batch_tag_loss \
            #              + self.args.lambda_stop * batch_stop_loss \
            #              + self.args.lambda_word * batch_word_loss\
            #              + self.args.lambda_sentence * batch_sentence_loss \
            #              + self.args.lambda_sentence * batch_sentence_loss_1
            batch_loss = self.args.lambda_sentence * batch_sentence_loss \
                         + self.args.lambda_sentence * batch_sentence_loss_1
            batch_loss = self._to_var(torch.tensor(batch_loss))
            self.optimizer.zero_grad()  # 把梯度置零，也就是把loss关于weight的导数变成0
            batch_loss.backward()  # 反向传播求梯度retain_graph=True
            if self.args.clip > 0:
                # 最简单粗暴的方法，设定阈值，当梯度小于/大于阈值时，更新的梯度为阈值  梯度裁剪
                torch.nn.utils.clip_grad_norm(self.sentence_model.parameters(), self.args.clip)
                torch.nn.utils.clip_grad_norm(self.word_model.parameters(), self.args.clip)
            self.optimizer.step()  # 更新所有参数
            loss += batch_loss.item()  # 根本原因
        return loss

class Adversarial(AdversarialBase):
    def _init_(self, args):
        AdversarialBase.__init__(self, args)
        self.args = args
    def epoch_train(self):
        print('===Start Adversarial Training===')
        # Train the generator for one step
        # for it in range(1):  # 这里用的数据是生成器生成的假数据 通过判别器进行判断生成reward 来算生成器的损失（带有reward）,用来更新生成器
        #     train_data_loader = self._init_data_loader_fake()
        #
        #     for i, inputs in enumerate(train_data_loader):
        #         inputs = self._to_var(torch.Tensor(inputs).float(), requires_grad=False)
        #         print("inputs shape", inputs.shape)
        #         inputs = inputs.view(self.batch_size, -1)
        #         reward = []
        #         for j in range(inputs.shape[1]):
        #             output = self.disc_model.forward(inputs[:, j:j+1].long())
        #             output = self._to_var(output, requires_grad=False)
        #             indices = torch.LongTensor([0])
        #             out = torch.index_select(output, 1, indices.cuda())
        #             for i in out:
        #                 reward.append(i.item())
        #         reward = np.transpose(np.array(reward)) / 1.0
        for _ in range(5):
            g_loss = self.adver() # g_step
        # Test
        for _ in range(2):  # t
            print("Use New Generator To Generate Fake Data")
            self.generate()
            print("Train the discriminator")
            # 1A Train D on real
            for _ in range(1): # d_step
                d_loss_t, d_loss_f = 0.0, 0.0
                train_data_loader_t = self._init_data_loader_true()
                for i, inputs in enumerate(train_data_loader_t):
                    batch_loss_t,batch_loss_t_1 = 0.0, 0.0
                    labels = torch.LongTensor(np.ones([self.batch_size, 1], dtype=np.int64))
                    labels = self._to_var(labels, requires_grad=False)
                    inputs = self._to_var(torch.Tensor(inputs).float(), requires_grad=False)
                    inputs = inputs.view(self.batch_size, -1)
                    outputs = self.discs_model.forward(inputs.long())
                    batch_loss_t_1 = self.ce_criterion(outputs.squeeze(), labels.squeeze().cpu()).sum()

                    for j in range(1, inputs.shape[1]):
                        output = self.disc_model.forward(inputs[:, j:j + 1].long())
                        output = self._to_var(output, requires_grad=False)
                        indices = torch.LongTensor([1])
                        output = torch.index_select(output, 1, indices.cuda())
                        batch_loss_t += self.bce_criterion(output, labels.float()).sum()
                    self.optimizer_d.zero_grad()
                    self.optimizer_d_1.zero_grad()

                    batch_loss_t = self._to_var(batch_loss_t, requires_grad=True)
                    batch_loss_t.backward()
                    batch_loss_t_1 = self._to_var(batch_loss_t_1, requires_grad=True)
                    batch_loss_t_1.backward()
                    d_loss_t = batch_loss_t.item()
                    d_loss_t_1 = batch_loss_t_1.item()

                # train on fake data
                train_data_loader_f = self._init_data_loader_fake()
                for i, inputs in enumerate(train_data_loader_f):
                    batch_loss_f = 0.0
                    labels = torch.LongTensor(np.zeros([self.batch_size, 1], dtype=np.int64))
                    labels = self._to_var(labels, requires_grad=False)
                    inputs = self._to_var(torch.Tensor(inputs).float(), requires_grad=False)
                    inputs = inputs.view(self.batch_size, -1)
                    outputs = self.discs_model.forward(inputs.long())
                    batch_loss_f_1 = self.ce_criterion(outputs.squeeze(), labels.squeeze().cpu()).sum()
                    for j in range(1, inputs.shape[1]):
                        output = self.disc_model.forward(inputs[:, j:j + 1].long())

                        output = self._to_var(output, requires_grad=False)
                        indices = torch.LongTensor([0])
                        output = torch.index_select(output, 1, indices.cuda())
                        batch_loss_f += (self.bce_criterion(output, labels.float())).sum()
                    # batch_loss_f = self._to_var(batch_loss_f, requires_grad=True)
                    # batch_loss_f_1 = self._to_var(batch_loss_f_1, requires_grad=True)
                    self.optimizer_d.zero_grad()
                    self.optimizer_d_1.zero_grad()
                    batch_loss_f = self._to_var(torch.tensor(batch_loss_f))
                    batch_loss_f_1 = self._to_var(torch.tensor(batch_loss_f_1))

                    batch_loss_f.backward()
                    batch_loss_f_1.backward()
                    if self.args.clip > 0:
                        torch.nn.utils.clip_grad_norm(self.disc_model.parameters(), self.args.clip)
                    self.optimizer_d.step()
                    self.optimizer_d_1.step()

                    d_loss_f = batch_loss_f.item()
                    d_loss_f_1 = batch_loss_f_1.item()
        return g_loss, d_loss_t + d_loss_f, d_loss_t_1 + d_loss_f_1

    def train(self):
        Loss_list = []
        for epoch in range(0, self.args.epochs):
            print ("=======Epoch:", epoch, "======")
            g_loss, d_loss, d_loss_1 = self.epoch_train()
            print(" D-train loss_t:{} -  lr:{}\n".format(d_loss,
                                                       self.optimizer_d.param_groups[0]['lr']))
            print(" D-train_1 loss_t:{} -  lr:{}\n".format(d_loss_1,
                                                         self.optimizer_d_1.param_groups[0]['lr']))
            print(" G-train loss:{} -  lr:{}\n".format(g_loss,
                                                       self.optimizer.param_groups[0]['lr']))

            # Loss_list.append(g_loss/1000000)
            self.logger.write(str(g_loss/1000000) +  "\n")

            self._save_model_g(epoch,
                               g_loss)
            self._save_model(epoch,
                             d_loss)
            self._save_model_1(epoch,
                             d_loss_1)
        # 迭代了200次，所以x的取值范围为(0，200)，然后再将每次相对应的准确率以及损失率附在x上
        x = range(0, 150)
        y = Loss_list

        plt.subplot(2, 1, 2)
        plt.plot(x, y, ls="-", lw=2, label="MIRGAN loss vs. epoches")
        plt.xlabel('Epoches')
        plt.ylabel('MIRGAN loss')
        plt.savefig("./results/loss.jpg")
        plt.show()

        print('#########################################################################')

    def _init_sentence_model(self):
        model = SentenceLSTM(version=self.args.sent_version,
                             embed_size=self.args.embed_size,
                             hidden_size=self.args.hidden_size,
                             num_layers=self.args.sentence_num_layers,
                             dropout=self.args.dropout,
                             momentum=self.args.momentum)

        try:
            model_state = torch.load(self.args.load_sentence_model_path)
            model.load_state_dict(model_state['sentence_model'])
            # print("[Load Sentence Model From {} Succeed!\n".format(self.args.load_sentence_model_path))
        except Exception as err:
            print("[Load Sentence model Failed {}!]\n".format(err))

        if not self.args.sentence_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params:
                self.params += list(model.parameters())
            else:
                self.params = list(model.parameters())

        if self.args.cuda:
            model = model.cuda()
        return model

    def _init_word_model(self):
        model = WordLSTM(vocab_size=self.vocab_count,
                         embed_size=self.args.embed_size,
                         hidden_size=self.args.hidden_size,
                         num_layers=self.args.word_num_layers,
                         n_max=self.args.n_max)

        try:
            model_state = torch.load(self.args.load_word_model_path)
            model.load_state_dict(model_state['word_model'])
            # print("[Load Word Model From {} Succeed!\n".format(self.args.load_word_model_path))
        except Exception as err:
            print("[Load Word model Failed {}!]\n".format(err))

        if not self.args.word_trained:
            for i, param in enumerate(model.parameters()):
                param.requires_grad = False
        else:
            if self.params:
                self.params += list(model.parameters())
            else:
                self.params = list(model.parameters())

        if self.args.cuda:
            model = model.cuda()
        return model


if __name__ == '__main__':
    import warnings

    warnings.filterwarnings("ignore")
    parser = argparse.ArgumentParser()

    """
    Data Argument
    """
    parser.add_argument('--patience', type=int, default=50)
    # parser.add_argument('--mode', type=str, default='train')

    # Disc Path Argument

    parser.add_argument('--disc_train_true_data_list', type=str, default='./data/new_data/disc_train_true_data.txt',
                        help='the path for True data')
    parser.add_argument('--disc_train_fake_data_list', type=str, default='./data/new_data/disc_train_fake_data.txt',
                        help='the path for Fake data')
    parser.add_argument('--adver_file_list', type=str, default='./data/new_data/val_data.txt',
                        help='the val array')
    parser.add_argument('--file_list', type=str, default='./data/new_data/adver_list.txt',
                        help='the path for test file list')

    # transforms argument
    parser.add_argument('--resize', type=int, default=256,
                        help='size for resizing images')
    parser.add_argument('--crop_size', type=int, default=224,
                        help='size for randomly cropping images')

    # Disc Load/Save model argument

    parser.add_argument('--disc_model_path', type=str, default='./report_disc_models/',
                        help='path for saving disc trained models')
    parser.add_argument('--discs_model_path', type=str, default='./report_discs_models/',
                        help='path for saving disc model')
    parser.add_argument('--disc_trained', action='store_true', default=True,
                        help='Whether train disc or not')
    parser.add_argument('--load_disc_model_path', type=str, default='./report_disc_models/v4/disc_train_best_loss.pth.tar',
                        help='The path of loaded disc model')
    parser.add_argument('--load_discs_model_path', type=str,
                        default='./report_discs_models/v4/discs_train_best_loss.pth.tar',
                        help='The path of loaded discs model')
    parser.add_argument('--disc_saved_model_name', type=str, default='./report_disc_models/v4/',
                        help='The name of saved model')
    parser.add_argument('--discs_saved_model_name', type=str, default='./report_discs_models/v4/',
                        help='The name of saved model')


    # Path Argument
    parser.add_argument('--vocab_path', type=str, default='./data/new_data/vocab.pkl',
                        help='the path for vocabulary object')
    parser.add_argument('--image_dir', type=str, default='./data/images',
                        help='the path for images')
    parser.add_argument('--caption_json', type=str, default='./data/new_data/captions.json',
                        help='path for captions')
    parser.add_argument('--train_file_list', type=str, default='./data/new_data/test_data.txt',
                        help='the train array')
    parser.add_argument('--val_file_list', type=str, default='./data/new_data/val_data.txt',
                        help='the val array')
    # Load/Save model argument
    parser.add_argument('--model_path', type=str, default='./report_v4_models/',
                        help='path for saving trained models')
    parser.add_argument('--load_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar',
                        help='The path of loaded model')
    parser.add_argument('--saved_model_name', type=str, default='./report_v4_models/v4/',
                        help='The name of saved model')

    # VisualFeatureExtractor
    parser.add_argument('--visual_model_name', type=str, default='resnet152',
                        help='CNN model name')
    parser.add_argument('--pretrained', action='store_true', default=False,
                        help='not using pretrained model when training')
    parser.add_argument('--load_visual_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar')
    parser.add_argument('--visual_trained', action='store_true', default=True,
                        help='Whether train visual extractor or not')

    # MLC
    parser.add_argument('--classes', type=int, default=210)
    parser.add_argument('--sementic_features_dim', type=int, default=512)
    parser.add_argument('--k', type=int, default=10)
    parser.add_argument('--load_mlc_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar')
    parser.add_argument('--mlc_trained', action='store_true', default=True)

    # Co-Attention
    parser.add_argument('--attention_version', type=str, default='v4')
    parser.add_argument('--load_co_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar')
    parser.add_argument('--co_trained', action='store_true', default=True)
    # Sentence Model
    parser.add_argument('--momentum', type=int, default=0.1)
    parser.add_argument('--embed_size', type=int, default=512)
    parser.add_argument('--hidden_size', type=int, default=512)
    parser.add_argument('--sent_version', type=str, default='v1')
    parser.add_argument('--sentence_num_layers', type=int, default=2)
    parser.add_argument('--dropout', type=float, default=0.1)
    parser.add_argument('--load_sentence_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar')
    parser.add_argument('--sentence_trained', action='store_true', default=True)

    # Word Model
    parser.add_argument('--word_num_layers', type=int, default=1)
    parser.add_argument('--load_word_model_path', type=str,
                        default='./report_v4_models/v4/train_best_loss.pth.tar')
    parser.add_argument('--word_trained', action='store_true', default=True)

    # Saved result
    parser.add_argument('--result_path', type=str, default='./results',
                        help='the path for storing results')
    parser.add_argument('--result_name', type=str, default='generate',
                        help='the name of results')

    """
    Training Argument
    """
    parser.add_argument('--learning_rate', type=int, default=0.01)
    parser.add_argument('--epochs', type=int, default=200)  # 1000

    parser.add_argument('--clip', type=float, default=0.35,
                        help='gradient clip, -1 means no clip (default: 0.35)')
    parser.add_argument('--s_max', type=int, default=6)
    parser.add_argument('--n_max', type=int, default=30)

    # Loss Function
    parser.add_argument('--lambda_tag', type=float, default=10000)
    parser.add_argument('--lambda_stop', type=float, default=10)
    parser.add_argument('--lambda_sentence', type=float, default=1)
    parser.add_argument('--lambda_word', type=float, default=1)


    args = parser.parse_args()
    args.cuda = torch.cuda.is_available()

    adversarial = Adversarial(args)
    adversarial.train()