您当前所在的位置:凯发国际ag > 新闻中心 > 专题专栏 > > 统计知识

大数据-凯发国际ag

发布日期:2016-10-25 00:00来源:芜湖统计局作者:综合科浏览次数:

    大数据的4v特点:volume(大量)、velocity(高速)、variety(多样)、value(价值)。

    大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
  在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。大数据的4v特点:volume(大量)、velocity(高速)、variety(多样)、value(价值)。
  对于“大数据”(big data)研究机构gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
  根据维基百科的定义,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
  大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
  从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
  随着云时代的来临,大数据(big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像mapreduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(mpp)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
  最小的基本单位是bit,按顺序给出所有单位:bit、byte、kb、mb、gb、tb、pb、eb、zb、yb、bb、nb、db,
  它们按照进率1024(2的十次方)来计算:
  8 bit = 1 byte
  1 kb = 1,024 bytes
  1 mb = 1,024 kb = 1,048,576 bytes
  1 gb = 1,024 mb = 1,048,576 kb
  1 tb = 1,024 gb = 1,048,576 mb
  1 pb = 1,024 tb = 1,048,576 gb
  1 eb = 1,024 pb = 1,048,576 tb
  1 zb = 1,024 eb = 1,048,576 pb
  1 yb = 1,024 zb = 1,048,576 eb
  1 bb = 1,024 yb = 1,048,576 zb
  1 nb = 1,024 bb = 1,048,576 yb
  1 db = 1,024 nb = 1,048,576 bb

  

 
网站地图