情况详细介绍
我的名字叫小亮,是一个每日喜爱老是胡思乱想的打职工。
伴随着年青人的自主创业风潮的来临,是我一种自主创业的不理智。历经长期的探寻,现在我萌发出了一个具有创造力的好点子,假如为此为根据开展自主创业得话一定会造成风潮。
最先,为了更好地明确我的想法是否独一无二的,我务必先根据百度搜索引擎开展查看。这儿有一个我很在乎的难题——我还在百度搜索引擎里检索了我的艺术创意,电脑浏览器会将我的艺术创意立即发给百度搜索引擎的网络服务器,假如的艺术创意的确是独一无二的,那那样直接的检索方法一定会将我的自主创业彻底曝露出去,这一件事而言十分致命性,我肯定不可以让所有人有盗取我艺术创意的很有可能。
怎样才可以确保在不许百度搜索引擎了解我实际要查看什么的状况下得到我要的数据信息就是我急需解决的难点。
简单做法
我的第一个想法是将百度搜索引擎中全部的数据信息所有免费下载出来,将原先的快速查询变换变成当地查看。这就代表着我无需将我的好点子发给服务端,我也能够 充足地保护好自己的隐私保护了。
但是我都得充分考虑此外一个难题,百度搜索引擎的网络服务器但是有pb等级的信息量,我下载出来就得耗费我几日的時间,此外我都得专业再去买几片大空间的电脑硬盘,这一件事而言确实是太过度价格昂贵。
分桶
我换了一个念头,即然没机遇立即把百度搜索引擎的数据库查询都给扒出来,我也尝试扒出来一部分数据信息,随后我再当地查看,那样一件事而言,提前准备的电脑硬盘还可以少一点。
例如,我原本要想查看的数据信息是“小亮是帅哥”,那样毫无疑问就向百度搜索引擎企业曝露我是帅哥的隐私保护了,那么我就可以换一种方法,我也查看“帅哥”,那样我接到的数据信息尽管有很多全是我不会要想的,可是里边却会包括“小亮是帅哥”的检索內容。那样,我也将所有的数据库下载换为了一部分数据库查询的免费下载。获得一部分数据库查询內容之后我也能够 当地再去查看了。
这儿采用了数据信息“分桶”的预备处理技术性,用以降低主次观查误差的危害,是一种将好几个持续值排序为偏少总数的“桶”的方式。
隐私保护性维护
分桶的作法尽管非常好,可是毫无疑问向数据库泄露了一部分隐私保护,例如“帅哥”这一信息内容,尽管网络服务器沒有得知“小亮是帅哥”这一隐私保护,可是毫无疑问泄漏了我对“帅哥”基本信息较为有兴趣,我不愿意为了更好地护着的实际隐私保护让网络服务器造成别的的误会。
我只有换一种方法,传统式的隐私保护查看技术性给了我一点提醒。
▲情况表明
传统式的隐私保护查看技术性针对数据信息储存构造有独特的规定:最先数据库查询得是公布的,即我能随时随地读取查询网络服务器里的一切数据信息;次之,在许多个(≥2)网络服务器上面得布署完全一致的数据库查询;其次,这种布署了数据库查询的网络服务器相互之间中间不可以沟通交流;最终,假定数据库查询有着n个数据信息X₁、X₂…Xn,那麼在数据库查询中为储存方式为一个n维向量。
▲简易技术规范
如果我现在必须的是数据信息Xi,那麼实际上我该做的事儿非常简单,便是自身转化成一个n维向量,只在第i个部位放1,其他的全部部位都放0,很显著的,这个时候我转化成的这一空间向量和数据库查询里的向量内积就可以得到結果Xi。
可是那样会存有一个难题,我假如立即将我的空间向量发给网络服务器,她们显著就了解我需要的是啥数据信息了,那么我只有根据此外一种方法来护着的隐私保护,将我的空间向量分拆。假如我将我转化成的空间向量记作r,假定有k个网络服务器,留意这儿k≥2,那麼我仅用将r分拆变成k个空间向量就可以。更实际的,我能拆分成:
随后将每一个份量ri发给一个网络服务器。随后网络服务器自身当地求内积,将結果发给我,我接到k个結果后异中或就可以还原出Xi的值了。
根据优化算法叙述,坚信大伙儿也可以了解为何网络服务器一定必须超过2个,并且这种集群服务器还不可以相互之间沟通交流。假如集群服务器相互之间能够 沟通交流得话就可以还原出我的查看r了。
这一优化算法有一个很致命性的难题,是我转化成的查看r实际上是和网络服务器的数据信息尺寸一样大的,假如网络服务器有好几千亿的数据信息,我的r就得有好几千亿维,并沒有减少互联网耗费,并且更槽糕是,我得转化成许多份份量,而每一个份量的尺寸都和数据库查询一样大,这类方法毫无疑问比直接下载数据信息更为巨大。
▲开发技术计划方案
由于极大的传送量,大家现在可以对网络服务器的数据信息储存方法开展改善,原来的储存方法为空间向量,现在可以改善为引流矩阵,假定数据库查询有25个数据信息,那麼数据信息可能变为以下方式
大家这时转化成的空间向量就可以从原先的25维缩减到5维,比如大家必须的数据信息是,在引流矩阵的第一行,那大家就可以转化成查看,这时网络服务器内积之后将第一行回到给大家。
同以前的计划方案,我们不能立即将查看r发给网络服务器,或是必须开展分拆,随后发给网络服务器。一样的步骤之后大家就能第一行原素。那样对每一个网络服务器大家提交的信息量为一个5维空间向量,注册量也一样是一个五维空间向量,另外,针对每一个网络服务器而言,她们并不了解大家最终取得的是哪一行。
这一计划方案的数据信息总传送量为2m√n,这儿的n为网络服务器有着的总信息量,k为网络服务器数量,一般 ,只必须2个网络服务器就能做到安全系数的规定,故总传送量4√n。
在信息量超过16的状况下,这一对策的传输数据量早已低于立即传送全部数据库查询的信息量了。
▲再升阶作法
我依照以前的念头在百度搜索引擎里查看了一下我的艺术创意,发觉里边并沒有相关内容。我正提前准备幸运沒有他人干了与我同样的事儿的情况下,我的好朋友张三大麻子和我说我用的百度搜索引擎查看的結果很有可能不容易很准,强烈推荐了一个有关的收费标准网址帮我,这一网址能够 查看到全世界全部企业及其其实际运营模式。但是她们是依照查看总数收费标准的,故不太可能像百度搜索引擎那般随意要我下载资源了。这个时候我的查看数据信息必须隐私保护,另外她们的数据库查询內容也必须隐私保护。
这个时候能够 对以前的优化算法开展进一步升級,将网络服务器从两个拓展为4个,我另外进行行查看和列查看。例如我需要的数据信息,在引流矩阵里的第一行第三列,那麼我也会开展第一行与第三列的查看。队伍查看都各自分拆2个分块,那样一共有4种组成很有可能,四个网络服务器各自选择在其中一种组成当地开展测算。那样网络服务器便总是推送搞混后的一个原素回家,不容易暴露的一切附加信息内容。
探讨及汇总
之上的优化算法有一个很重要的难题,即我明白我需要的数据信息是数据库查询中的几个原素,可是一般 状况下,那样的查看方法不是实际的。更加广泛的查看方法为k-v查看,即我根据某一k去数据库其相匹配的v。
比如,我要去百度搜索引擎里检索“我是帅哥”,这时k便是“我是帅哥”,百度搜索回到的百度搜索便是其相匹配的v。如何把传统式的隐私保护查看技术性开展升級以配适现实生活中的具体情景仍必须进一步的探寻。
网络信息安全是如今从本人到我国都十分重视的行业,如何把大家的隐私保护网络信息安全的应用起來也是大家一直以来勤奋的方位。
以上就是文梦网小编要带给您的关于“创意”保卫战——MPC隐私查询算法的相关内容。如果对像有帮助。迎常来本站哦
标签: 数据