我们正在构建一个平台,旨在为存在重大数据安全问题的大型企业提供机器学习解决方案。所有数据训练都是在前提下完成的,并且对用于模型训练的数据的性质有限制。模型完成后,我希望将其部署在具有标准安全/审计标准的云上。(IP 白名单、访问 token 、日志)
我相信这些功能可以匿名完成(标准化、PCA 等),以提供额外的安全层。 有什么方法可以将发送到基于云的机器学习模型的数据返回到原始数据吗?
虽然我已经审查了有关模型部署的其他问题,但安全性的这方面并未得到专门处理。 https://dzone.com/articles/security-attacks-analysis-of-machine-learning-mode (关注的不是可用性或模型失真 - 而是更多关于 secret 数据)
同样,我们的想法是在本地保留学习和数据,仅在云上部署以实现速度、灵 active 和可用性。
最佳答案
Is there any way the data sent to the cloud-based ML model can lead back to the original data?
任何具有反函数的函数都可以返回原始数据。风险不仅来自查看数据的随机人员,还来自团队内部的内部威胁。这是一个例子:
How to reverse PCA and reconstruct original variables from several principal components?
根据主成分的数量,也可以暴力猜测特征向量。
关于security - 在云上部署机器学习模型是否存在任何特定的企业安全问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56091830/