官方公众号企业安全新浪微博
FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。
FreeBuf+小程序
如今的图像处理技术,不仅能够将一张高度像素化(也就是打了马赛克)的图像复原,甚至能从中提取文本。
本周,安全公司Bishop Fox 的首席研究员丹·佩特洛(Dan Petro)表示,他已从像素化的文本图像中清楚地恢复了其中的字母信息。
去年,Jumpsec Labs分享了一个公开挑战,希望有人能够复原下图中的文本信息。
佩特洛在研究了各种像素化和去混淆技术后得出了一个解决方案,最终清晰再现了其中的文本内容,但应 Jumpsec 的要求,他只披露了其中的部分信息。
虽然目前已存在一些用于增强人物或风景类像素化照片的技术,比如Google Brain,但还没有解决方案能够真正准确恢复像素化图像中的文本,同时消除多余的杂质像素。
Google Brain 从提供的像素化图像(左)中复原图像(中),
右列显示像素化之前的实际图像
由于佩特洛成功破解了Jumpsec的挑战,促使他与 Bishop Fox 一起在 GitHub 上发布了一个名为Unredacter的新开源工具,并将他的详细研究结果公布在Bishop Fox博客文章中。下面的测试运行显示 Unredacter 从给定的像素化输入正确地复原了原始文本。
虽然佩特洛表示,目前这些技术在实际运用场景中也没有想象中的好,还存在许多不足,但也给以像素化方式处理敏感信息这一行为敲响了警钟。他认为,使用诸如黑条直接覆盖掉敏感信息的方式要比通过像素化或者模糊化处理要安全许多。
此外,研究人员也认为,在编辑文本时,应将其作为图像来编辑,而不是使用简单的HTML/CSS样式来掩盖。例如,使用与文本主体本身相同的背景颜色掩盖的文本,在高亮显示时可以很容易地显示出来。