cloudera吧 关注:84贴子:171
  • 0回复贴,共1

为什么有这么多令人兴奋的事情?

只看楼主收藏回复

有很多因素推动了围绕大数据的炒作,具体包括以下因素。
在商用硬件上结合计算和存储:其结果是以低成本实现惊人的速度。
性价比:Hadoop 大数据技术提供了显著的成本节约(系数大约为 10),以及显著的性能改进(同样,系数为 10)。您的成就可能会有所不同。如果现有的技术输得如此一塌糊涂,那么就值得研究 Hadoop 是否可以补充或取代您当前架构的某些方面。
线性可扩展性:每一个并行技术都声称可以垂直扩展。Hadoop 具有真正的可扩展性,因为最新的版本将节点数量的限制扩展至 4,000 个以上。
可完全访问非结构化数据:具备良好的并行编程模型 MapReduce 的高度可扩展的数据存储在本行业中成为挑战已经有一段时间了。Hadoop 的编程模型并不能解决所有问题,但它对于许多任务来说都是一个强大的解决方案。
Hadoop 发行版:IBM 和 Cloudera
其中一个引起困惑的地方是,“我在哪里可以获得处理大数据的软件?” 本文中的示例都以 Hadoop 的免费 Cloudera 发行版为基础,其名称为 CDH(全称为 Cloudera distribution including Hadoop,包括 Hadoop 的 Cloudera 发行)。Cloudera 网站将其作为一个 VMWare 映像提供。IBM 最近宣布,它正在将其大数据平台移植到在 CDH 上运行。更多详细信息请参见 参考资料部分。
术语突破性技术 经常被严重过度使用,但在这种情况下,它可能是适当的。


IP属地:北京1楼2015-08-14 11:30回复