机器学习的诱惑并不总是大的新功能,通常它最擅长的是微小的调整,微妙地改善用户体验。所以 Twitter 的使用神经网络自动裁剪图片预览到他们最有趣的部分。该公司一直在研究这个工具,但昨天在博客文章中详细描述了它的方法。ML 研究员卢卡斯 Theis 和 ML 领导 Zehan 王解释他们如何开始使用面部识别来裁剪脸部图像,但发现这种方法不适用于风景和其它物体照片。
他们的解决方案是“使用显着性裁剪”,这里的显着性意味着图像中最有趣的一个方面,为了定义这一点,他们使用学术研究中的数据进行眼动追踪,记录人们首先看到的图像区域。 这些数据可以用来训练神经网络和其他算法来预测人们可能想看的东西。
一旦他们训练了一个神经网络来识别这些区域,他们需要优化它在网站上实时工作。对他们来说幸运的是,照片预览所需的裁剪非常广泛,只需将图像缩小到最有趣的三分之一,这意味着推特可以削减和简化神经网络判断标准,即使用称为“知识蒸馏”的技术。
最终的结果是得到速度比原先快 10 倍的神经网络,这可以让我们在所有图像上传并实时剪切的情况下对所有图像进行显着性检测。这个新功能目前正在桌面,iOS 和 Android 应用上向所有用户推出。