大数据干货一-慧都网

当前，整个互联网正在从IT时代向DT时代演进，大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义，它更代表着信息技术发展进入了一个新的时代，代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难，代表着大数据处理所需的新的技术和方法，也代表着大数据分析和应用所带来的新发明、新服务和新的发展机遇。

# 行业资讯 #

2016-07-20 09:23:09.000

342

转帖浅谈【数据地图】在数据分析中的作用

和以前用Excel制作数据地图相比，使用R语言确实便捷了许多，而且将鼠标悬停在地图上方时能够显示数据明细，通过拖动鼠标能够改变最大最小值，相应的地图区域会动态显示或隐藏，这些特点要在Excel中实现估计相当麻烦。

# 行业资讯 #

2016-07-14 10:23:00.000

1078

原创 IBM专家亲自解读 Spark2.0 操作指南

本文带大家一起进行Spark的大数据之旅。本文的内容主要分为两个部分：一是Spark的背景介绍，二是介绍Spark的基础。

# 行业资讯 #

2016-07-08 09:41:54.000

1398

转帖 2分钟读懂大数据框架Hadoop和Spark的异同

谈到大数据，相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是提留在字面上，并没有对它们进行深入的思考，下面不妨跟我一块看下它们究竟有什么异同。

# 行业资讯 #

2015-12-15 14:17:06.000

466

原创什么是Spark，如何使用Spark进行数据分析

Spark是UC Berkeley AMP lab所开发类似于Hadoop MapReduce的通用并行计算框架，Spark是基于map reduce算法实现分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出的结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce算法。

# 行业资讯 #

2015-12-09 10:39:24.000

1121

原创完全分布式HBase集群安装配置示例

HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库。它是面向列的，并适合于存储超大型松散数据。HBase适合于实时，随机对Big数据进行读写操作的业务环境。关于HBase的更多介绍请参见HBase项目官网。

# 行业资讯 #

2015-12-03 15:12:45.000

557

原创 HBase基础知识，面向列的实时分布式数据库

Hbase是运行在Hadoop上的NoSQL数据库，它是一个分布式的和可扩展的大数据仓库，也就是说HBase能够利用HDFS的分布式处理模式，并从Hadoop的MapReduce程序模型中获益。

# 行业资讯 #

2015-11-17 10:11:18.000