Skip to content

WangHexie/chinese_adversarial_samples

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 

Repository files navigation

不文明用语分类任务对抗样本生成

示例

你是大笨蛋 --> 拟是大笨,蛋

数据采集

  • 爬虫
  • 从word2vec数据中检索

混淆方式

  • 形近字替换
  • 音近字替换
  • 标点插入
  • shuffle
  • 生僻字删除
  • 追加文明用语
  • 以上综合

生成方式

  • 重要性评估
    • 删除评估
    • 替换评估
    • 头评估
    • 尾评估
    • 以上综合
  • 规则式

分类模型

  • textcnn
  • word2vec+lightGBM
  • fastText
  • Transformer
  • CNN
  • RNN
  • TFIDF+Classifier
  • TFIDF+word2vec+Classifier

评估方式

  • 上述所有模型和攻击方式在n折交叉验证下准确率等指标的变化情况
  • 文本变化距离

About

不文明用语分类任务对抗样本生成

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages