谷歌大脑近日发布了一个可以把马赛克照片还原清晰的软件。
看样子是个让人很有联想的应用。岛国的爱情动作片飘过眼前,有了这款软件是要彻底攻占骑兵的堡垒,宣告步兵的胜利吗?
是的,你看到了一篇假文章。
严肃脸:下面我们开始认真研究一下谷歌的这款人工智能产品。
其实,把模糊照片放清楚,是有着很实际的用途的。比如说,缉拿犯罪嫌疑人的时候,没有足够清晰的照片,可以借助这项功能将照片放大,从而给警方提供更多的线索支持。
谷歌大脑的这款新产品就可以在这方面提供一些颇有价值的帮助。现在他们已经成功将8*8(毫米)网格的像素马赛克转换成为肉眼可辨识的人物图像。这项技术叫做“像素递归超分辨率”技术(Pixel Recursive Super Resolution)。
以这组图片为例。最右侧是32 x 32像素的真实图片,左侧是已经压缩到8 x 8像素的图片,中间的就是通过这项技术还原的结果。结果不算很理想。还原过的图片和真实的图片看起来像是两个人,但是比起左侧的模糊图片,已经好太多了,左侧的图片单独来看完全看不出什么内容。
谷歌大脑是怎么做到的呢?它聚合了两种神经网络,来补充图片的细节。
第一部分是条件网络(conditioning network)。比如,在上面这个案例中,它会将8×8的图片与高清图片进行对比,将其他高清图片缩小到8×8的分辨率,寻找图案、颜色的相似关系。
第二部分是优先网络(prior network),使用PixelCNN(像素神经网络)向8×8的源图片中增加真实的高清细节。在上面的例子当中,优先网络就吸收了大量的名人照片。
然后,当需要解析源图片时,便会从其已知的图片中寻找与之匹配的新像素,并将添加进去。例如,图片顶部有一个棕色像素,而优先网络或许认为那是一条眉毛:于是,当要解析图片时,就会用眉毛形状的棕色像素填补进去。
为了制作出最终的无码高清图片,需要融合这两个神经网络输出的数据。总结来说,就是通过学习大量图片,获得给照片补充细节的能力。OK,这多少有点类似于P图去水印还原图片的过程。
谷歌团队测试了呈现效果。向人类展示高清明星照和还原照片时,人类观察员被骗的比例达到了10%,而达到50%就属于完美得分。
在卧室照片的同类对比中,观察员被骗的比例达到28%。这个得分怎么样?
此外,谷歌也对比了另一个还原照片的技术——双三次插值放大技术,这项技术没有骗过任何一个观察员。
当然,还原的图片肯定不同于真实的图片,会有一些额外添加的细节,这在图像处理领域里术语被称作“幻象”,只是计算机的“猜测”,换句话说,系统认为新图片的清晰度足以“欺骗”人类的眼睛。但是,新添加的细节很可能与事实有别,似是而非。
不过,这项技术也有让人担心的地方。随着这项技术的成熟,肯定可以让还原照片高度接近真实照片。这样的话,网上流传的一些模糊处理的照片就失去了价值,可能导致当事人隐私泄露,带来人身财产的安全隐患。
转载自36氪