通用深度学习语言模型的隐私风险评估

潘旭东; 张谧; 颜一帆; 陆逸凡; 杨珉

首页> 中文期刊> 《计算机研究与发展》 >通用深度学习语言模型的隐私风险评估

通用深度学习语言模型的隐私风险评估

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,自然语言处理领域涌现出多种基于Transformer网络结构的通用深度学习语言模型,简称"通用语言模型(general-purpose language models,GPLMs)",包括Google提出的BERT(bidirectional encoder representation from transformers)模型等,已在多个标准数据集和多项重要自然语言处理任务上刷新了最优基线指标,并已逐渐在商业场景中得到应用.尽管其具有很好的泛用性和性能表现,在实际部署场景中,通用语言模型的安全性却鲜为研究者所重视.近年有研究工作指出,如果攻击者利用中间人攻击或作为半诚实(honest-but-curious)服务提供方截获用户输入文本经由通用语言模型计算产生的文本特征,它将以较高的准确度推测原始文本中是否包含特定敏感词.然而,该工作仅采用了特定敏感词存在与否这一单一敏感信息窃取任务,依赖一些较为严格的攻击假设,且未涉及除英语外其他语种的使用场景.为解决上述问题,提出1条针对通用文本特征的隐私窃取链,从更多维度评估通用语言模型使用中潜在的隐私风险.实验结果表明:仅根据通用语言模型提取出的文本表征,攻击者能以近100％的准确度推断其模型来源,以超70％的准确度推断其原始文本长度,最终推断出最有可能出现的敏感词列表,以重建原始文本的敏感语义.此外,额外针对3种典型的中文预训练通用语言模型开展了相应的隐私窃取风险评估,评估结果表明中文通用语言模型同样存在着不可忽视的隐私风险.

著录项

来源
《计算机研究与发展》 |2021年第5期|1092-1105|共14页
作者
潘旭东; 张谧; 颜一帆; 陆逸凡; 杨珉;
展开▼
作者单位

复旦大学计算机科学技术学院上海200438;

复旦大学计算机科学技术学院上海200438;

复旦大学计算机科学技术学院上海200438;

复旦大学计算机科学技术学院上海200438;

复旦大学计算机科学技术学院上海200438;

展开▼
原文格式 PDF
正文语种 chi
中图分类安全保密;
关键词
深度学习隐私; 通用语言模型; 自然语言处理; 深度学习; 人工智能; 信息安全;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的语言模型研究进展 [J] . 王乃钰 ,叶育鑫 ,刘露 . 软件学报 . 2021,第004期
2. 基于深度学习的位置大数据统计发布与隐私保护方法 [J] . 晏燕 ,丛一鸣 ,Adnan Mahmood . 通信学报 . 2022,第1期
3. 基于深度学习的位置隐私攻击 [J] . 沈钲晨 ,张千里 ,张超凡 . 计算机研究与发展 . 2022,第2期
4. 保护数据隐私的深度学习训练数据生成方案 [J] . 汤凤仪 ,刘建 ,王会梅 . 计算机应用研究 . 2021,第007期
5. 分布式深度学习隐私与安全攻击研究进展与挑战 [J] . 周纯毅 ,陈大卫 ,王尚 . 计算机研究与发展 . 2021,第005期
6. 通用电气风险评估模式在我国中小企业干预中的应用及效果评估 [C] . XU Ming ,徐茗 ,YU Chang-yan . 中国CDC职业卫生与中毒控制所2015学术年会 . -1
7. 基于深度学习和语言模型的细菌命名实体识别算法研究 [A] . 李旭升 . 2020

通用深度学习语言模型的隐私风险评估

摘要

著录项

相似文献

相关主题

期刊订阅