普及一些高大上的概念
云计算的概念最早是 2006 年由 Google 提出的。
(按服务类型划分)
Infrastructure as a Service
) VMware vShpere
、Hyper-V
等。Platform as a Service
) Software as a Service
) Google Docs
目前,国内比较出名的云计算提供商有:阿里云、百度云、华为云等。
大数据 big data,相对云计算,大数据显得朴实多了,通俗直白。
云计算对普通人来说确实像云一样飘渺,而大数据则更加实际,是确确实实跟人们的生活息息相关的。
大数据的官方定义,指的是所涉及的数据集规模已经超过了传统数据库软件获取、存储、管理和分析的能力。
但是对于多大的数据量能被认为是大数据呢?这个问题并没有明确的答案。因为这个标准跟不同的行业有关系,也会随着技术的不断发展而不断变化。通常是从 TB 级别到 PB 级别甚至达到 ZB 级别。
但是,大数据通常有三个特征:
Hadoop 是云计算技术的一种实现方式,是云计算 PaaS 层技术的代表,以一种可靠、高效、可扩展的方式存储、管理大数据。
它提供了一个分布式存储和计算的软件框架,可以把它称为一个「大数据管理平台」。
它可以基于分布式存储进行分布式计算,横向扩展能力非常优秀,所以非常适合并能够胜任存储、管理、挖掘大数据的任务。
我们平时所听到的 Storm、Spark、Hive、HBase、Pig、Sqoop … 等等一些高大上的名词,都可以运行在 Hadoop 框架上。
Business Intelligence
商业智能,是一个统称,指的是用于支持制定业务决策的技能、流程、技术、应用和实践。