数据匿名化或难以保护个人隐私

数据匿名化或难以保护个人隐私
科技日报北京7月23日电 (记者张梦然)只是已知有限几个特点,就能够在数据海洋中精确辨认你的身份吗?据英国《天然·通讯》杂志23日宣布的一项研讨,英国科学家使用一种新开发的计算办法,评价了一个人的身份能否从一个不完整的匿名化数据库中被辨认出来。成果以为,现在的匿名化和数据同享办法,或许不足以维护个人隐私或满意数据维护法令法规的要求——如欧盟的《通用数据维护法令》(GDPR)。  数据科学和人工智能有望革新咱们日常日子的方方面面,如医疗、卫生保健、商业和管理。这些办法依赖于大规模的具体个人数据,可是搜集和同享个人数据,现已引发了有关个人隐私的忧虑。针对这个问题,现在的处理办法包含匿名化处理和发布不完全的数据集。可是,近期现已发生了使用匿名数据集,包含阅读历史记录、手机和信用卡数据,成功从头辨认出个别身份的状况,这表明上述办法还不行充沛。  为了进一步证明这一问题的严重性,英国帝国理工学院研讨团队新开发了一种计算办法,能够精确预算经过匿名数据集正确地从头辨认个别身份的或许性。研讨人员发现,只需求知道少量几个特点,如邮政编码、出生日期、性别和子女数量,一般就能够以高可信度从头辨认出个别身份——即便数据集是不完整的。而已知特点越多,辨认的或许性越大。例如,99.98%的马萨诸塞州人口,能够经过15个人口计算学特点辨认出来。  因而,研讨团队总结以为,现在一般所选用的只发布取样数据集或不完全数据集,尚不足以很好地维护个人隐私。  总编辑圈点  人工智能比人类幻想得更强壮,而咱们则比自己幻想得更简略。寥寥几个数据就能辨认出数据的主人,这让咱们不由忧虑:人在一窍不通的机器面前还有没有隐私?咱们软弱的庄严在一遍遍剖析后还能不能维系?大数据库能谋福普通人,也能要挟普通人。到了仔细评论数据年代的信息道德的时分了,未来的公民需求保证安全感的法令。