https://arxiv.org/abs/2305.00050
Causal Reasoning and Large Language Models: Opening a New Frontier for Causality (Emre Kıcıman, Robert Ness, Amit Sharma, Chenhao Tan)
causality에 대한 접근이라기보다는 GPT-4가 두 변수 사이의 인과적 관계를 추론할 수 있는지, counterfactual reasoning을 할 수 있는지, 주어진 상황에 대한 기술을 보고 특정 행위자의 행동이 결과에 충분 혹은 필요 조건이었는지를 말할 수 있는지 등의 과제를 가지고 GPT-4의 causal reasoning 능력과 그에 필요한 현실 세계의 인과적 구조를 알고 있는지를 테스트했다는 느낌이군요. GPT-3.5만 해도 과거 모델들에 비해 성능 향상이 꽤 눈에 띄는데 GPT-4는 거의 압도적인 수준이군요.
#causality #llm