Federated Data Cleaning: Collaborative and Privacy-Preserving Data Cleaning for Edge Intelligence

Ma Lichuan; Pei Qingqi; Zhou Lu; Zhu Haojin; Wang Licheng; Ji Yusheng

首页> 外文期刊>Internet of Things Journal, IEEE >Federated Data Cleaning: Collaborative and Privacy-Preserving Data Cleaning for Edge Intelligence

【24h】

Federated Data Cleaning: Collaborative and Privacy-Preserving Data Cleaning for Edge Intelligence

机译：联邦数据清理：Edge Intelligence的协作和隐私保留数据清洁

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

As an important driving factor of emerging Internet-of-Things (IoT) applications, machine learning algorithms are currently facing the challenge of how to "clean" data noise, that is introduced during the training process (e.g., asynchronous execution and lossy data compression and quantization). In an attempt to guarantee data quality, various data cleaning approaches have been proposed to filter out abnormal data entries based on the global data distribution. However, most existing data cleaning approaches are based on a centralized paradigm and thus cannot be applied to future edge-based IoT applications, where each edge node (EN) has only a limited view of the global data distribution. Moreover, the increasing demand for privacy preservation largely prevents ENs from combining their data for centralized cleaning. In this study, we propose a federated data cleaning protocol, coined as FedClean, for edge intelligence (EI) scenarios that is designed to achieve data cleaning without compromising data privacy. More specifically, different ENs first generate Boolean shares of their data and distribute them to two noncolluding servers. These two servers then run the FedClean protocol to privately and efficiently compute the attribute value frequency (AVF) scores of the collected data entries, which are then sorted in ascending order via a bitonic sorting network without revealing their values. As a result, data entries with lower AVF scores are considered as abnormal and filtered out. The security, efficiency, and effectiveness of the proposed approach are then demonstrated via concrete security analysis and comprehensive experiments.

机译：作为新兴互联网（物联网）应用的重要驱动因素，机器学习算法目前面临如何在训练过程中“清洁”数据噪声的挑战（例如，异步执行和有损数据压缩和量化）。为了保证数据质量，已经提出了各种数据清洁方法以基于全局数据分布来过滤输出异常数据条目。然而，大多数现有数据清洁方法基于集中式范例，因此不能应用于未来的基于边缘的IOT应用程序，其中每个边缘节点（EN）仅具有全局数据分布的有限视图。此外，对隐私保存的需求的增加很大程度上防止了可执行的集中清洁数据。在本研究中，我们提出了一种联合数据清洁协议，作为FedClean，用于Edge Intellence（EI）方案，该方案旨在在不影响数据隐私的情况下实现数据清洁。更具体地，不同的ENS首先生成其数据的布尔份额，并将它们分发到两个非可用服务器。然后，这两个服务器运行FedClean协议以私下和有效地计算收集的数据条目的属性值频率（AVF）分数，然后通过BITONIC分类网络按升序排序，而不显示它们的值。因此，具有较低的AVF分数的数据条目被认为是异常的并且过滤。然后通过具体的安全性分析和综合实验证明了所提出的方法的安全性，效率和有效性。

著录项

来源
《Internet of Things Journal, IEEE》 |2021年第8期|6757-6770|共14页
作者
Ma Lichuan; Pei Qingqi; Zhou Lu; Zhu Haojin; Wang Licheng; Ji Yusheng;
展开▼
作者单位

Xidian Univ State Key Lab Integrated Serv Networks Xian 710071 Peoples R China|Xidian Univ Shaanxi Key Lab Blockchain & Secure Comp Xian 710071 Peoples R China;

Xidian Univ State Key Lab Integrated Serv Networks Xian 710071 Peoples R China|Xidian Univ Shaanxi Key Lab Blockchain & Secure Comp Xian 710071 Peoples R China;

Shanghai Jiao Tong Univ Dept Comp Sci & Engn Shanghai 200240 Peoples R China;

Shanghai Jiao Tong Univ Dept Comp Sci & Engn Shanghai 200240 Peoples R China;

Beijing Univ Posts & Telecommun State Key Lab Networking & Switching Technol Beijing 100876 Peoples R China;

Natl Inst Informat Informat Syst Architecture Sci Res Div Tokyo 1018430 Japan;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词
Cleaning; Data privacy; Protocols; Internet of Things; Collaboration; Data models; Servers; Data cleaning; edge intelligence (EI); privacy preserving;

机译：清洁;数据隐私;协议;事情互联网;协作;数据模型;服务器;数据清洁;边缘情报（EI）;隐私保留;

相似文献

外文文献
中文文献
专利

1. Federated Learning and Privacy:Building privacy-preserving systems for machine learning and data science on decentralized data [J] . allista Bonawitz, Peter Kairouz, Brendan McMahan, ACM Queue: Architecting Tomorrow s Computing . 2021,第5期

机译：联邦学习和隐私：在分散数据上构建机器学习和数据科学的隐私保存系统
2. Context Free Data Cleaning and its Application in Mechanism for Suggestive Data Cleaning [J] . Sohil D. Pandya 1, Paresh V. Virparia 2 International Journal of Information Science . 2011,第1期

机译：上下文无关数据清理及其在暗示数据清理机制中的应用
3. Object Oriented Intelligent Multi-Agent System Data Cleaning Architecture To Clean Email Data [J] . Dr. G. Arumugam, T. Joshva Devadas International Journal of Engineering Science and Technology . 2010,第11期

机译：面向对象的智能多代理系统数据清理架构，用于清理电子邮件数据
4. Federated CF: Privacy-Preserving Collaborative Filtering Cross Multiple Datasets [C] . Le Wang, Zijun Huang, Qingqi Pei, IEEE International Conference on Communications . 2020

机译：联合CF：跨多个数据集的保护隐私的协作过滤
5. Privacy-preserving and authenticated data cleaning on outsourced databases. [D] . Dong, Boxiang. 2016

机译：外包数据库上的隐私保护和经过身份验证的数据清除。
6. Association between Clean Delivery Kit Use Clean Delivery Practices and Neonatal Survival: Pooled Analysis of Data from Three Sites in South Asia [O] . Nadine Seward, David Osrin, Leah Li, 2012

机译：清洁交付工具包使用清洁交付实践与新生儿生存之间的关联：来自南亚三个站点的数据汇总分析
7. Object Oriented Intelligent Multi-Agent System Data Cleaning Architecture to clean Preference based Text Data [O] . Dr. G. Arumugam, T. Joshva Devadas, Madurai Kamaraj 2011

机译：面向对象的智能多代理系统数据清理架构，用于清理基于首选项的文本数据
8. Privacy-Preserving Collaborative Data Mining [R] . Zhan, Z. , Chang, L. 2003

机译：隐私保护协作数据挖掘

Federated Data Cleaning: Collaborative and Privacy-Preserving Data Cleaning for Edge Intelligence

摘要

著录项

相似文献

相关主题

期刊订阅