原创
机器学习|如何使用Spark 开发Java电子邮件垃圾分类应用程序?

本文将带您了解如何开发和使用您自己的基于机器学习的电子邮件垃圾邮件分类系统。因为,谁会喜欢垃圾邮件呢?

2018-01-10 11:23:30.000
转帖
技术实操|Apache Spark 内存管理详解(下篇)

Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。

2017-04-01 09:39:14.000
原创
ZooKeeper原理及使用

ZooKeeper是Hadoop Ecosystem中非常重要的组件,它的主要功能是为分布式系统提供一致性协调(Coordination)服务,与之对应的Google的类似服务叫 Chubby。今天这篇文章分为三个部分来介绍ZooKeeper,第一部分介绍ZooKeeper的基本原理,第二部分介绍ZooKeeper提供的 Client API的使用,第三部分介绍一些ZooKeeper典型的应用场景。

2015-03-30 09:42:01.000
转帖
Windows下Eclipse连接Hadoop教程(附代码)

Windows下Eclipse连接Hadoop的方法。

2014-12-15 10:16:02.000
转帖
Hadoop教程:Hadoop令开发者纠结的十件事

在Hadoop生态繁荣的背后,是开发者们夜以继日的开发与支持。而在用户得益甚至赞赏这些应用的时候,开发者们却不得不面对Hadoop平台中一些可用性较差的地方。本文列举了网络上一些关于Hadoop的缺点,供大家探讨,部分观点来自InfoWorld及开发者博客。

2014-10-30 09:30:07.000
转帖
Hadoop教程:Hadoop在Facebook的应用

Hadoop在Facebook的应用

2014-10-11 09:35:47.000
转帖
Hadoop教程:淘宝Hadoop集群机器硬件配置

国内外使用Hadoop的公司比较多,全球最大的Hadoop集群在雅虎,有大约25000个节点,主要用于支持广告系统与网页搜索。国内用Hadoop的主要有百度、淘宝、腾讯、华为、中国移动等,其中淘宝的Hadoop集群属于较大的(如果不是最大)。

2014-09-18 09:56:27.000
转帖
Hadoop教程:Hadoop企业级应用新添重磅案例

当下大数据之热使得技术界对Hadoop的话题热火朝天。但在日常工作中,企业往往还是遵循既有模式,对于Hadoop到底能否真正帮到企业的应用依然心存顾虑。Hadoop是不是很年轻?这个开源的事物能否符合公司业务级的严谨要求?有没有企业真的应用过?一系列问题萦绕人们心头。这可以理解,毕竟任何一个新生事物出来都要有一个接受过程 。

2014-09-17 10:01:48.000
转帖
Hadoop教程:如何为Hadoop集群选择合适的硬件

在这个博客帖子中,你将会学到一些工作负载评估的原则和它在硬件选择中起着至关重要的作用。在这个过程中,你也将学到Hadoop管理员应该考虑到各种因素。

2014-09-15 10:26:16.000
转帖
Hadoop教程:Hadoop安全部署经验总结

通过Hadoop安全部署经验总结以下十大建议,以确保大型和复杂多样环境下的数据信息安全。

2014-09-12 09:38:39.000
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP