研究院谈 IE11 阅读模式研发背后的故事" src="/Upload/Images/2014042417/6746C91CA791BF75.jpg" alt="微软研究院谈 IE11 阅读模式研发背后的故事" width="640" height="320" />
微软在 Windows 8.1 和 Windows Phone 8.1 中的 IE11 浏览器中加入了“阅读模式”(Reading View)功能。阅读模式可以将网页主题内容抽取出来,并用新的预置样式将其重新排版,让用户可以更专注地阅读内容。
然而,阅读模式功能得益于微软研究院的技术积累 – 在 11 年前,现在的微软亚洲研究院主管研究员宋睿华开始了“网页分区”和“学习网页模板”的研究。前者,网页分区是研究网页分区的重要性,通过机器将网页划分出不同分区,并判定分区的重要度。后者,是让机器学习网站模板,找出不同网页相似的部分,利用这些规则抽取其他网页的分区的重要度。
但在 2012 年微软产品团队找到他们的研究成果后,发现结果并不理想,重新写了一套算法,究其原因有两点:一方面,HTML 代码的变化巨大,另一方面,做研究与做产品的复杂性的差别。微软研究院称新的文字抽取算法“准确率很高,并可以抽取图片”。
在文章中,微软研究院称微软产品团队本打算通过第三方公司的专利来实现阅读视图功能,但微软未指明的“内部的机制”,得以让微软能用上研究院的内部技术。正如 Cortana 背后的技术,微软研发团队并不会有产品化的压力,而产品团队在需要技术时又能很快找到研究成果直接拿来用。(via 微软亚洲研究院)