“让模型有效遗忘指定训练数据”就是Machine unlearning(机器遗忘)在解决的问题。
本文主要介绍了ChatGPT潜在的AI应用自身特有的8类安全隐患。
随着机器学习模型的广泛部署,针对AI自身安全的各种威胁也涌现出来。模型劫持攻击是2022年提出的一种新的训练阶段攻击。