Poisoning Web-Scale Training Datasets is Practical (Nicholas Carlini, Matthew Jagielski, Christopher A. Choquette-Choo, Daniel Paleka, Will Pearce, Hyrum Anderson, Andreas Terzis, Kurt Thomas, Florian Tramèr)

이미지-텍스트 데이터는 주로 URL과 텍스트 페어만 공개되어 있으니 만료된 URL을 사서 엉뚱한 이미지를 제공하는 방법으로 공격할 수 있고, 위키피디아 같은 경우 스냅샷 데이터를 사용하니 스냅샷 시점 직전에 데이터를 끼워넣는 방법으로 공격이 가능하다는 아이디어. 1,000 달러 정도면 모델에 영향을 미치는 공격이 가능한 것 같네요. 이런 반달리즘은 분명히 가능할 것 같습니다. 이미지를 빨리 확보해놓거나 최소한 해시라도 갖춰야 할 것 같다는 생각이네요.

#dataset

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

230220 Poisoning Web-Scale Training Datasets is Practical.md

230220 Poisoning Web-Scale Training Datasets is Practical.md

Files

230220 Poisoning Web-Scale Training Datasets is Practical.md

Latest commit

History

230220 Poisoning Web-Scale Training Datasets is Practical.md

File metadata and controls