《检察实务中的大数据/检察技术信息化系列教材》:
2.Variety(多样性),数据的多样性是大数据的另一特征。除了传统关系数据库的结构化数据,所采集和分析的数据还包括非结构化的数据,如网站运营日志数据、呼叫**通话记录、Twitter和Facehook等社交媒体中的文本数据。一些需要分析的数据可能还包括智能手机的GPS(全球定位系统)位置信息、实时生成的传感器数据,甚至还有图片和视频,等等。尤其是近年来以指数级爆发式增长的数据,如互联网上的文本数据、位置信息、传感器数据、视频等。这些多样化类型的数据如果采用当前主流的关系型数据库是很难存储的。而且,这些多样化类型的大数据并非只是存储起来就万事大吉了,我们真正需要的是对其进行分析,并从中获得有用的信息、萃取大价值。
3.Velocity(速度),指的是大数据产生、更新和处理的速度很快,是衡量大数据的一个重要特征。在当前基于高速网络的时代,通过实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。根据IMS Research关于数据创建速度的调查报告显示,据预测到2020年全球将拥有220亿部互联网连接设备。Facebook每天处理的数据超过10TB,淘 宝网每天的登录用户大约有6000万人,页面浏览量约20亿次,新浪微博每天上传的微博数超过1亿条。
……