大数据是什么概念?多大规模的数据才能称之为大数据?许多人对此感到困惑。实际上,企业端与个人端对大数据的数量级别有着显著差异。企业级数据达到十万级别即可称作大数据,而个人级数据则需达到千万级别。小规模数据,比如千到万级,虽然经过收集分析,能总结出特定群体的原则,但并不符合大数据的定义。
什么是大数据?以下是三种常见定义的概述: Gartner的定义强调大数据具备强大的决策支持、洞察力和流程优化能力,这些能力来源于海量、快速增长和多样化的信息资产,这些资产需要新颖的处理模式。 IDC的定义着重于数据的规模——海量数据量、快速的数据流、动态的数据速度、多样的数据类型和巨大的数据价值。
“大数据是以高容量、多样性、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。