转帖 Hadoop教程:Hadoop扩展过程中的潜在危机

本文作者Raymie Stata是Hadoop即服务公司Altiscale的创始人兼CEO,也是雅虎前任CTO,协助雅虎完成开源策略,并参与Apache Hadoop项目的发起。Hadoop的扩展和运维是非常复杂的过程,在其具体的实施过程中隐藏着潜在的危机,Raymie根据经验罗列了7项危机信号和相应的解决方案,帮助使用者提前避免灾难的发生。

# 使用教程 # 2014-09-11 10:08:51.000 210
转帖 Hadoop教程:用hadoop计算PI值

# 使用教程 # 2014-09-10 10:09:02.000 1067
转帖 Hadoop教程:用外部存储构建Hadoop

用外部存储构建Hadoop,你不仅可以把存储管理分开,也可以利用独立的“增长的载体”(vectors of growth)。毋须增加其它多余的资源就可以容易地增加存储或者计算。由于与Hadoop的“总量”(gross)复制相比企业级RAID解决方案将使用较少的磁盘占用空间,因此也有成本支出方面的优势。

# 使用教程 # 2014-09-09 10:04:56.000 379
转帖 Hadoop教程:当机器大数据遇见Hadoop

根据数据来源划分,大数据主要包括三类:商业运作产生的数据、人类行为产生的数据和机器数据。目前,人们谈论最多的是前两类数据的处理和分析。创立于2004年的Splunk公司独树一帜,从公司成立之初就一直专注于机器数据的处理和分析。Splunk公司产品营销副总裁SanjayMehta在接受本报记者采访时表示,机器大数据未来具有非常广阔的发展前景。

# 使用教程 # 2014-09-04 09:59:42.000 295
转帖 Hadoop教程:Hadoop平台的基本组成与生态系统

在大数据处理软件系统上,随着Apache Hadoop系统开源化的发展,在最初包含HDFS、MapReduce、HBase等基本子系统的基础上,至今Hadoop平台已经演进为一个包含很多相关子系统的完整的大数据处理生态系统。

# 使用教程 # 2014-09-03 09:24:21.000 452
转帖 Hadoop教程:Hadoop在大数据中的角色

大数据是一个流行语。和许多流行语一样,大数据这个词用得有些滥了,但是它包含了一些真正的有用性和技术。我们决定在这个主题上对大数据进行一番分析,努力挖掘其中的真实性以及它们对存储解决方案的意义。

# 使用教程 # 2014-09-02 09:40:40.000 432
转帖 Hadoop教程:Hadoop和大数据在电信业里的典型应用

2013年11月22-23日,作为国内唯一专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)于北京福朋喜来登集团酒店隆重举行。来自国内外各行业领域的近千名CIO、CTO、架构师、IT经理、咨询顾问、工程师、Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举。

# 使用教程 # 2014-09-01 10:22:46.000 531
转帖 Hadoop教程:大数据处理平台Hadoop能为企业带来什么?

现在,“大数据”这个概念在IT行业是越来越流行了。美国国家海洋与大气管理局NOAA利用“大数据”进行各种分析。《纽约时报》使用大数据对于新闻分析和WEB信息进行挖掘。迪斯尼则利用主题公园、商店以及WEB资产进行客户行为分析。

# 使用教程 # 2014-08-29 09:42:08.000 312
转帖 Hadoop教程:Hadoop数据传输工具Sqoop

Sqoop(发音:skup)是一款开源的工具,主要用于在HADOOP(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递。Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为一个Apache项目。

# 使用教程 # 2014-08-28 10:00:27.000 1575
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP