Chapter 3 BERT 활용하기 #8

emphasis10 · 2022-01-19T15:33:51Z

발표 나누기
3.1 ~ 3.3 @0hee0
3.4 ~ @emphasis10

@mori8 님 QA 관련 부분 자료 업데이트 반영 부탁드립니다 ㅎㅎ
@shyram 님 #7 발행했습니다 ㅎㅎ

3.4 Downstream Task를 위한 BERT Fine-tuning 방법에 관련하여,

에 대한 추가적인 내용을 다룰 예정입니다.

emphasis10 · 2022-01-23T16:32:44Z

[오탈자]
p.128 첫번째 줄.

tokens = [ [CLS], I, love, Paris, [SEP] ]
->
tokens = [ '[CLS]', 'I', 'love', 'Paris', '[SEP]' ]

p.137

segment_ids = [0] * len(question_tokens)
segment_ids += [1] * len(paragraph_tokens) # 문맥상 +=으로 변경 필요

mori8 · 2022-01-25T12:54:58Z

p.117

hee-suh · 2022-01-26T13:09:50Z

model = BertModel.from_pretrained('bert-base-uncased')
model(token_ids, attention_mask = attention_mask)

model이 반환하는 pooler_output이 활성화함수로 왜 tanh를 사용하는 건지 궁금합니다.

emphasis10 added the weekly Weekly Q&A label Jan 19, 2022

emphasis10 assigned emphasis10, shyram, mori8 and hee-suh Jan 19, 2022

Provide feedback