您的位置首页  网络资讯  行业

链接:热点名词大数据

  根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量2010年首次突破1泽(10的21次方)字节,2012年达到约2.8泽字节,2020年有望达到40泽字节。2012年,全球产生的数据中仅有约0.5%得到分析。到2020年,全球数据总量中有22%将来自中国。

  从内容来看,这些海量数据可分为结构化和非结构化数据。问卷调查、产品评论、信用卡记录和实验结果等属于结构化数据,仅占数据总量的5%左右;大数据时代的数据量爆炸多来自非结构化数据,例如在社交网站上发布的照片和视频,在搜索引擎中输入的搜索词,手机产生的即时位置信息等,约占数据量的95%。

  在大数据的处理上,舍恩伯格所著《大数据时代》一书指出,大数据处理分析面对的不是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。

  比如,世界上第一部“先拍照后对焦”光场相机Lytro,就运用了大数据处理分析理念。与传统相机只记录一束光不同,Lytro可以记录整个光场里所有的光,也就是用总体数据取代了随机样本。用户没必要一开始就对焦,想要什么样的照片可以在拍摄之后再决定。

  数据量大幅增加对人们注重精确性的习惯等提出了挑战,大数据需要技术和思维上的变革才能利用。谷歌公司人工智能专家说,谷歌翻译在语料库使用庞杂的网络内容后取得了飞跃发展,不完整的句子、拼写错误、语法错误等各种错误,让谷歌翻译可以正确地推算出英文词汇搭配在一起的可能性,混杂性和谬误反而让谷歌翻译在同类产品中更为突出。

  新华网北京12月17日电按照业界比较普遍的看法,大数据具有海量、多种类、需要大规模处理和快速响应等特点。根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186