`

Hadoop架构——云计算的具体实现

阅读更多
Hadoop是IT行业一个新的热点,是云计算的一个具体实现、Hadoop本身具有很高的技术含量,是IT工程师学习的首选!下面我们来详细讲讲什么是Hadoop。

Hadoop是IT行业一个新的热点,是云计算的一个具体实现、Hadoop本身具有很高的技术含量,是IT工程师学习的首选!下面我们来详细讲讲什么是Hadoop。

完整hadoop讲解视频教程下载地址:

1、http://kuai.xunlei.com/d/CLCBYHQKJQNT

2、http://kuai.xunlei.com/d/CSMFERCHAGEE

Hadoop是什么:

Hadoop = The Hadoop projects

Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, Oozie

Hadoop要解决的两个问题:

1、海量数据的存储 -- HDFS

2、海量数据的分析 -- MapReduce

Hadoop发展的历史:

始于2002年的apache项目Nutch

2003年Google发表了关于GFS的论文

2004年Nutch的开发者开发了NDFS

2004年Google发表了关于MapReduce的论文

2005年MapR被引入了NDFS

2006年改名为Hadoop,NDFS的创始人加入Yahoo,Yahoo成立了一个专门的小组发展Hadoop

HDFS设计目标:

1、Very large files

2、Streaming data access

write-once, read-many-times

3、Commodity hardware

HDFS架构:

在Hadoop中,一个文件被划分成大小固定的多个文件块,分布的存储在集群中的节点中


Block:一个文件分块,默认64M

NameNode:保存整个文件系统的目录信息,文件信息以及文件相应的分块信息。

DataNode:用于存储Blocks

HDFS的HA策略:NameNode一旦宕机,整个文件系统将无法工作。

如果NameNode中的数据丢失,整个文件系统也就丢失了。

2.x开始,HDFS支持NameNode的active-standy模式。
1
1
分享到:
评论

相关推荐

    云计算第二版

    第1章 绪论 1 1.1 云计算的概念 1 1.2 云计算发展现状 3 1.3 云计算实现机制 5 1.4 网格计算与云计算 6 1.5 云计算的发展环境 9 ...11.4.2 云格(Gloud)——云计算的未来 347 习题 349 参考文献 349

    Hadoop实战中文版

    《Hadoop实战》作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分,深入浅出地...

    「大数据干货」基于Hadoop的大数据平台实施——整体架构设计.pdf

    「⼤数据⼲货」基于 「⼤数据⼲货」基于Hadoop的⼤数据平台实施 的⼤数据平台实施——整体架构设 整体架构设 计 计 ⼤数据的热度在持续的升温,继云计算之后⼤数据成为⼜⼀⼤众所追捧的新星。我们暂不去讨论⼤数据...

    云计算系统架构文档 下

    云计算系统架构文档 下 一路前行——Autodesk中国研发中心Scrum故事(李丁山).pdf 为社交网站构建新型数据产品(John Wang).pdf 云应用集成的N种成功模式(Richard).pdf 人人网开放平台验证与授权方面实践.pdf ...

    大数据云计算技术 淘宝网基于Hadoop的数据应用开发平台iData(共27页).pptx

    背景——进入淘宝数据平台 数据规模 ...概览——数据应用开发架构 产品架构 技术架构 深入——关键服务介绍 知识库(元数据) 调度 数据集成 IDE 成本优化 生命周期 展望——数据创造未来

    Hadoop实战中文版.PDF

    出版信息编辑译者:韩冀中出版社:人民邮电出版社出版时间:2011年10月版次:1.1开本:16开装帧:平装字数:417千字页数:253页内容简介编辑作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,...

    拥抱大数据——初识Hadoop,轻松应对海量数据存储与分析所带来的挑战

    2.3 大数据与云计算 三、HDFS(分布式文件系统) 3.1 hdfs架构 3.2 hdfs存储 四、MapReduce(分布式计算框架) 4.1 Map+Reduce 4.2 MapReduce架构 4.3 MapReduce数据处理 4.3.1 job与task 4.3.2 MapReduce数据处理 ...

    大数据、数据挖掘与智慧运营.pptx

    1 大数据、数据挖掘与智慧运营综述 1.2 数据挖掘的主要流程与金字塔模型 1.2.1 数据挖掘的任务 1.2.2 数据挖掘的基本步骤 1.2.3 数据挖掘的架构——云计算 1.2.4 "金字塔"模型 大数据、数据挖掘与智慧运营...

    学生成绩管理分析系统 毕业设计.zip

    Java在企业级应用开发中占据主导地位,广泛应用于服务器端Web应用程序开发,包括构建大型企业级应用系统、微服务架构以及云计算解决方案。同时,Java也在移动应用领域大放异彩,尤其在Android操作系统上是主要的应用...

    混合音乐推荐系统-Track Stacking-毕业设计.zip

    Java在企业级应用开发中占据主导地位,广泛应用于服务器端Web应用程序开发,包括构建大型企业级应用系统、微服务架构以及云计算解决方案。同时,Java也在移动应用领域大放异彩,尤其在Android操作系统上是主要的应用...

    Android毕业设计; Android, Music Player, for graduation.zip

    Java在企业级应用开发中占据主导地位,广泛应用于服务器端Web应用程序开发,包括构建大型企业级应用系统、微服务架构以及云计算解决方案。同时,Java也在移动应用领域大放异彩,尤其在Android操作系统上是主要的应用...

    Spark大型集群上的快速和通用数据处理架构

    但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。 Spark 是一种与 Hadoop 相似的开源集群计算环境,...

    HBase中Coprocessor的介绍以及实际业务场景中的使用.pdf

    一直致力于大数据基础架构和hadoop生态的学习与研发;同时在hbase与hdfs的基础上,和团队一起研发了大数据存储与分析相关系统,如blobstore、bitbase等。 内容概要:(1)讲解hbase coprocessor的原理以及使用场景,(2...

    大数据系统基础(自主模式)-清华大学-王建民、徐葳、陈康等 视频.txt

    │ 2 系统架构与Gossip协议.mp4 │ 3 一致性哈希与数据分区.mp4 │ 4 数据副本及一致性.mp4 │ 5 节点本地数据存储.mp4 │ └─7. 流计算 0 Video.mp4 1 Video.mp4 2 Video.mp4 3 Video.mp4 4 Video.mp4 5 ...

Global site tag (gtag.js) - Google Analytics