Pig (产品编号:13748)

Apache Pig是一个基于Hadoop的大规模数据分析平台。

标签:

开发商: Apache

当前版本: 0.15.0

产品类型:控件

产品功能:/

平台语言:

开源水平:不提供源码

用户推荐:

用户评分:

关于本产品的分类与介绍仅供参考,具体以商家网站介绍为准。

同类软件推荐:

Asta VoIP
Asta VoIP

Asta VoIP可通过IP执行H322 VoIP标准版,并对Win32客户端应用程序实行免费授权分配方式。

ApexSQL Log
ApexSQL Log

ApexSQL Log是一个SQL误操作恢复工具。

阅读更多
Apache Pig是一个用于分析大数据集的平台,它由用于表达数据分析程序的高级语言和评估这些程序的基础架构组成。Pig程序最突出的特性是程序的结构是适合大量并行化,这使得它们常被用来处理特大量数据集。
需要培训、定制、外包?请联系我们!企业QQ:800018081 慧都专业技术团队帮助您提高效率,节省成本,降低风险!

关于本产品的分类与介绍仅供参考,精准产品资料以官网介绍为准,如需购买请先行测试。

结构与特点:

目前, Pig的基础架构层由一个为Map-Reduce程序产生序列的编译器构成,它被用于已存在项目的大规模并行实现(如Hadoop的子项目)。 Pig的语言层由一个被称为Pig Latin的文本性语言构成,它包含了以下几个关键特性:

  • 易于编程-它能够轻松实现简单的并行执行,高度并行数据分析任务。对于包含多个相关数据转换的复杂任务可以通过数据流序列进行明确编码,使其易于编写,理解和维护。

  • 最佳化问题- 这是一种让系统自动对任务的执行进行优化的方式,它能够让用户关注语义而非效率。

  • 可扩展性 - 用户可以根据特殊目的来创建他们自己的函数。

Apache Pig的配置需求:

必选项(Unix 和Windows用户需要):

  • Hadoop 0.23.X, 1.X 或者2.X(通过设置HADOOP_HOME指向Hadoop的安装目录位置可以让 Pig运行在不同版本的Hadoop上,如果没有设置HADOOP_HOME,默认为运行在Hadoop 1.0.4上)

  • Java 1.7(设置JAVA_HOME为Java程序安装的根目录)

可选环境:

  • Python 2.7(当使用Streaming Python UDFs时)

  • Ant 1.8 (当用于build时)

类型 标题 发布时间
文章 关于Hadoop,你需要了解的一些相关大数据工具

如今Apache Hadoop已成为大数据行业发展背后的驱动力。Hive和Pig等技术也经常被提到,但是它们都有什么功能,为什么会需要奇怪的名字(如Oozie、ZooKeeper、Flume)

2016-01-27 16:09:47.000

更新时间:2016-01-25 15:02:18.000 | 录入时间:2016-01-25 14:58:31.000 | 责任编辑:佚名

登录慧都网发表评论登录


2016-01-25 17:38:41.000
0

大象身上的猪,hadoop身上的Pig,很贴切嘛:)


title
title
相关产品
Asta VoIP

Asta VoIP可通过IP执行H322 VoIP标准版,并对Win32客户端应用程序实行免费授权分配方式。

ApexSQL Log

ApexSQL Log是一个SQL误操作恢复工具。

ISDataSource

为 Intersoft data-bound 组件提供 Hierarchical Data 绑定

ExpertPDF Pdf Creator

ExpertPDF Pdf Creator SDK 是一个 .NET 函数库,用来提高我们已有的HtmlToPdf Converter 的性能。

Security Manager for Microsoft Outlook

Security Manager for Microsoft Outlook是一个单线程的编程工具,可以让你实现旁路安全设置,以及避免安全警告或快速附件和应用程序。

相关厂商
在线客服 在线QQ 电话咨询
400-700-1020
在线客服系统
live chat