高文,国家自然科学基金委员会副主任、 中国工程院院士,他的主要研究领域为人工智能应用和多媒体技术,侧重于计算机视觉、模式识别与图象处理、多媒体数据压缩、多模式接口以及虚拟现实等的研究。
对于多媒体大数据时代,相信大家都已身处其中。一个最典型的感觉不管我们把它叫做“云”还是叫做“大数据”,现在数据量都增加得非常快。高文院士预计到 2020 年,整个网络中的各种数据量会比现在增加 50 倍。网络时代数据量的急剧增加,可以给人们的生活带来很多好处,但是在数据处理方面带会有诸多问题。
高院士指出,实际上人们的生活、工作以及处理数据的方式都正在被改变,具体体现在五个方面。
第一,数据产生的方式被极大地改变。以前的数据生产都是由专业团体完成,但现在数据更多来自个体行为,每个人都可以使用手机、电脑等产生大量的数据。
第二,数据的传播途径发生了很大变革。以前人们获取信息的渠道基本上是报刊、电视、广播等传统媒体,但现在互联网已经变成媒体传播的主要途径。
第三,社交环境发生网络化变革。以前人们交朋友主要依靠身边的生活圈子,现在则更多依靠互联网。
第四,数据存储的习惯发生变化,以前人们都希望将数据存在电脑上,或者存储到软盘上,但现在大多数人会选择将数据“丢”到网上,进行云存储。
第五,社会安保系统发生变革。城市里有很多的传感器、摄像头,在案件发生后,调用这些数据即可加快破案,虽然这个系统现在还没有真正实现,但实现之后会使我们的生活产生非常大的变化。
在高院士看来,随着数据量的不断增加,多媒体大数据也遇到了诸多问题。尤其是在传输、存储、处理、应用是急待解决的四大挑战。其中,有效存储和智能处理是核心挑战。那么有效存储为什么很难呢?实际上我们现在用摄像头拍下来的东西不会永远保存,有的可能存 3 个月,有个可能存 1 个月,有的可能存 1 个星期被覆盖掉,这个数据也就永远丢失了。为什么会这样?因为“存不下”,数据不能永远保存,保存下去费用太高。正因为存不起,他表示,为了解决这一问题,目前科研人员正在从事第三代编码技术的研究,以提高视频的压缩效率。
高院士强调,面临“存不下”和“查不快”两大难题。在技术层面,存不下的问题是因为现在数据源源不断产生,源源不断往系统里灌,系统存储,除非很有钱不停增加存储设备可以,但是现在没有哪个人会不停增加存储设备,通常只会存一段时间,或者把有用东西拿出来放在别的系统里。他指出,通过高效存储技术和去除冗余方法,我们可摆脱“存不下”的烦恼。因为我们拍视频时候里面很多冗余,只要有好的算法便可把这个冗余去掉。但是高院士也提出,我们现有的算法距离真正的理论上限还相差很远,现在已经有成千上万的工程师和科学家在研究这种高效编码算法,我们还有很大的改进空间。