RUCAIBox · txy77 · Sep 28, 2022 · Sep 29, 2022 · Sep 29, 2022 · Sep 29, 2022
diff --git a/config/conversation/gpt2/durecdial.yaml b/config/conversation/gpt2/durecdial.yaml
@@ -2,13 +2,17 @@
 dataset: DuRecDial
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'GPT2-chitchat'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 0.01
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'GPT2-chitchat'
 # optim
 conv:
  epoch: 1

diff --git a/config/conversation/gpt2/gorecdial.yaml b/config/conversation/gpt2/gorecdial.yaml
@@ -2,13 +2,17 @@
 dataset: GoRecDial
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 0.01
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # optim
 conv:
  epoch: 1

diff --git a/config/conversation/gpt2/inspired.yaml b/config/conversation/gpt2/inspired.yaml
@@ -2,13 +2,17 @@
 dataset: Inspired
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 1
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # optim
 conv:
  epoch: 1

diff --git a/config/conversation/gpt2/opendialkg.yaml b/config/conversation/gpt2/opendialkg.yaml
@@ -2,13 +2,17 @@
 dataset: OpenDialKG
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 0.01
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # optim
 conv:
  epoch: 1

diff --git a/config/conversation/gpt2/redial.yaml b/config/conversation/gpt2/redial.yaml
@@ -2,13 +2,17 @@
 dataset: ReDial
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 0.01
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # optim
 conv:
  epoch: 1

diff --git a/config/conversation/gpt2/tgredial.yaml b/config/conversation/gpt2/tgredial.yaml
@@ -2,13 +2,17 @@
 dataset: TGReDial
 tokenize:
  conv: gpt2
+# tokenize path
+conv_tokenize_path: 'GPT2-chitchat'
 # dataloader
 context_truncate: 256
 response_truncate: 30
 item_truncate: 100
 scale: 1
 # model
 conv_model: GPT2
+# pretrained path
+conv_pretrained_path: 'GPT2-chitchat'
 # optim
 conv:
  epoch: 50

diff --git a/config/crs/inspired/durecdial.yaml b/config/crs/inspired/durecdial.yaml
@@ -3,6 +3,9 @@ dataset: DuRecDial
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-chinese'
+conv_tokenize_path: 'GPT2-chitchat'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+rec_pretrained_path: 'bert-base-chinese'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'GPT2-chitchat'
 # embedding: word2vec
 embedding_dim: 300
 use_dropout: False

diff --git a/config/crs/inspired/gorecdial.yaml b/config/crs/inspired/gorecdial.yaml
@@ -3,6 +3,9 @@ dataset: GoRecDial
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-uncased'
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+rec_pretrained_path: 'bert-base-uncased'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # embedding: word2vec
 embedding_dim: 300
 use_dropout: False

diff --git a/config/crs/inspired/inspired.yaml b/config/crs/inspired/inspired.yaml
@@ -3,6 +3,9 @@ dataset: Inspired
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-uncased'
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+rec_pretrained_path: 'bert-base-uncased'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # optim
 rec:
  epoch: 1

diff --git a/config/crs/inspired/opendialkg.yaml b/config/crs/inspired/opendialkg.yaml
@@ -3,6 +3,9 @@ dataset: OpenDialKG
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-uncased'
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+conv_pretrained_path: 'bert-base-uncased'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # embedding: word2vec
 embedding_dim: 300
 use_dropout: False

diff --git a/config/crs/inspired/redial.yaml b/config/crs/inspired/redial.yaml
@@ -3,6 +3,9 @@ dataset: ReDial
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-uncased'
+conv_tokenize_path: 'gpt2'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+conv_pretrained_path: 'bert-base-uncased'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'gpt2'
 # embedding: word2vec
 embedding_dim: 300
 use_dropout: False

diff --git a/config/crs/inspired/tgredial.yaml b/config/crs/inspired/tgredial.yaml
@@ -3,6 +3,9 @@ dataset: TGReDial
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-chinese'
+conv_tokenize_path: 'GPT2-chitchat'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,8 +14,12 @@ scale: 1
 # model
 # rec
 rec_model: InspiredRec
+# pretrained path
+rec_pretrained_path: 'bert-base-chinese'
 # conv
 conv_model: InspiredConv
+# pretrained path
+conv_pretrained_path: 'GPT2-chitchat'
 # embedding: word2vec
 embedding_dim: 300
 use_dropout: False

diff --git a/config/crs/kgsf/durecdial.yaml b/config/crs/kgsf/durecdial.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: DuRecDial
 tokenize: jieba
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 1

diff --git a/config/crs/kgsf/gorecdial.yaml b/config/crs/kgsf/gorecdial.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: GoRecDial
 tokenize: nltk
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 1

diff --git a/config/crs/kgsf/inspired.yaml b/config/crs/kgsf/inspired.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: Inspired
 tokenize: nltk
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 1

diff --git a/config/crs/kgsf/opendialkg.yaml b/config/crs/kgsf/opendialkg.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: OpenDialKG
 tokenize: nltk
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 1

diff --git a/config/crs/kgsf/redial.yaml b/config/crs/kgsf/redial.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: ReDial
 tokenize: nltk
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 3

diff --git a/config/crs/kgsf/tgredial.yaml b/config/crs/kgsf/tgredial.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: TGReDial
 tokenize: pkuseg
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -21,6 +21,7 @@ learn_positional_embeddings: false
 embeddings_scale: true
 reduction: false
 n_positions: 1024
+copy: true
 # optim
 pretrain:
  epoch: 50

diff --git a/config/crs/ntrd/tgredial.yaml b/config/crs/ntrd/tgredial.yaml
@@ -1,7 +1,7 @@
 # dataset
 dataset: TGReDial
 tokenize: pkuseg
-embedding: word2vec.npy
+embedding: True
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -24,6 +24,7 @@ n_positions: 1024
 gen_loss_weight: 5
 n_movies: 62287
 replace_token: '[ITEM]'
+copy: true
 # optim
 pretrain:
  epoch: 50

diff --git a/config/crs/tgredial/durecdial.yaml b/config/crs/tgredial/durecdial.yaml
@@ -3,6 +3,9 @@ dataset: DuRecDial
 tokenize:
  rec: bert
  conv: gpt2
+# tokenize path
+rec_tokenize_path: 'bert-base-chinese'
+conv_tokenize_path: 'GPT2-chitchat'
 # dataloader
 context_truncate: 256
 response_truncate: 30
@@ -11,6 +14,9 @@ scale: 0.01
 # model
 rec_model: TGRec
 conv_model: TGConv
+# pretrained path
+rec_pretrained_path: 'bert-base-chinese'
+conv_pretrained_path: 'GPT2-chitchat'
 hidden_dropout_prob: 0.2
 initializer_range: 0.02
 hidden_size: 50