网页资讯视频图片知道文库贴吧地图采购
进入贴吧全吧搜索

 
 
 
日一二三四五六
       
       
       
       
       
       

签到排名:今日本吧第个签到,

本吧因你更精彩,明天继续来努力!

本吧签到人数:0

一键签到
成为超级会员,使用一键签到
一键签到
本月漏签0次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行补签。
连续签到:天  累计签到:天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月20日漏签0天
海牛学院吧 关注:151贴子:1,228
  • 看贴

  • 图片

  • 吧主推荐

  • 游戏

  • 0回复贴,共1页
<<返回海牛学院吧
>0< 加载中...

Hadoop入门应该看那些书?

  • 只看楼主
  • 收藏

  • 回复
  • poa115
  • 知名人士
    10
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
Hadoop作为大数据的主流技术框架,至今仍然在大数据技术圈占有重要的地位,大数据学习基本上也离不开Hadoop,从Hadoop开始,学习核心组件,逐步扩展到生态圈其他组件,这是比较建议的学习路线。今天我们就来和大家聊聊Hadoop入门应该看那些书?
1、Hadoop权威指南:大数据的存储与分析(第4版)
这本书作为Hadoop最全面的入门书,结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。内容包括:
Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。
MapReduce组件,MapReduce应用开发、MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。
Hadoop运维,构建Hadoop集群、管理Hadoop。
Hadoop相关开源项目,Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。
2、深度剖析Hadoop HDFS
这本书着重在Hadoop的分布式文件系统HDFS上,基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案。内容包括:
核心设计,HDFS的数据存储原理、HDFS的数据管理与策略选择机制、HDFS的新颖功能特性。
细节实现,HDFS的块处理、流量处理等细节,以及部分结构分析。
解决方案,HDFS的数据管理、HDFS的数据读写、HDFS的异常场景等。
3、HBase不睡觉书
Hbase在Hadoop生态当中,地位同样不可小觑。这本书对于Hbase作为非常详解的讲解,适合于零基础入门,并且希望深入掌握的大数据学习者。内容包括:
HBase概念、安装、配置、部署,让读者对HBase先有一个感性认识,再从应用角度介绍了高级用法、监控和性能调优。既兼顾了初学者,也适用于想要深入学习HBase的读者。
4、Hive实战
Hive在Hadoop生态当中,常常被定义为数据仓库工具,简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。内容包括:
Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性等等。


登录百度账号

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频!
  • 贴吧页面意见反馈
  • 违规贴吧举报反馈通道
  • 贴吧违规信息处理公示
  • 0回复贴,共1页
<<返回海牛学院吧
分享到:
©2025 Baidu贴吧协议|隐私政策|吧主制度|意见反馈|网络谣言警示