专家解读:企业如何进入大数据行业?

转帖|行业资讯|编辑:陈俊吉|2016-11-30 09:27:13.000|阅读 47 次

概述:大数据产业是中国未来的希望,是未来的朝阳行业,但各个企业不要过于冒进,进入这个产业的企业必须了解这六个问题,找到解决这六个问题的方法,以技术和数据为基础,才能够创造价值,通过大数据这个工具帮助和推动传统产业发展。

相关链接:

大数据产业是中国未来的希望,是未来的朝阳行业,但各个企业不要过于冒进,进入这个产业的企业必须了解这六个问题,找到解决这六个问题的方法,以技术和数据为基础,才能够创造价值,通过大数据这个工具帮助和推动传统产业发展。
之前参加了Italk活动,听取的有关大数据公司和产业机构的讲座,因此萌生出一个写文章的冲动,想对目前大数据产业中的一些错误现象进行讨论。

陈宇认为大数据是哲学层面上的问题,属于统计学范畴,部分揭示了大数据产业的本质,但是实际上大数据这个概念自身就有着不同的诠释。利用数据进行军事分析,产品定位,交通管理,风险管理,精准营销等等,其实在几十年前就有了。最早的保险产品就是来源于偶然事件的概率分析,其参考历史数据分析,依据计算出的概率来,来对保险产品进行定价。中国古代的军事学家孙膑在战争中,通过逐步减少行军灶坑来迷惑对手,利用其师弟庞涓对数据信任,制造其带领军队溃败的假象,最后在对方轻敌冒进的前提下,突袭了对手,赢得了战争胜利。因此数据分析其实在很久远的古代就存在了。为什么过去的数据分析换成了时髦的名称大数据了呢?

\

相对于过去的数据,我们来讨论大数据的含义:

1)过于一些记录是以模拟形式出现的,或者以数据形式出现但是存贮在本地,不是公开数据资源,没有开放给互联网用户,例如音乐、照片、视频、监控录像等影音资料。现在这些数据不但数据量巨大,并且放到了互联网上,开放给整个互联网用户,其数量之大是前所未有了。举个例子Facebook每天有18亿张照片上传或被传播,形成了海量的开放数据。

2)移动互联网出现后,移动设备的很多传感器收集了大量的用户点击行为数据,已知iphone有3个传感器,三星有6个传感器。它们每天产生了大量的点击数据,这些数据被某些公司所有拥有,形成用户大量行为数据。

3)移动地图出现后,例如高德、百度、google地图,其产生了大量的数据流数据,这些数据不同于传统数据,传统数据代表一个属性或一个度量值,但是这些地图产生的流数据代表着一种行为、一种习惯,这些流数据经频率分析后会产生巨大的商业价值。基于地图产生的数据流是一种新型的数据类型,在过去是不存在的。

4)进入了社交网络的年代后,互联网行为主要由用户参与创造,因此有大量的互联网用户创造出大量的社交行为数据。这些数据是过去不曾想像的,是海量的。某些数据代表特定人群的特点和个性。

5)电子商户崛起带来了大量网上交易行为,其产生了大量的交易数据,包含支付行为,查询行为,物流运输、购买行为等等,产生了海量的信息流和资金流数据。

6)传统的互联网入口转向搜索引擎之后,用户的搜索行为和提问行为产生了海量数据。单位存贮价格的下降也为存储这些数据提供了技术上的可能。

现在我们所指的大数据不同与过去传统的数据,其产生方式、存储载体、访问方式、表现形式、来源特点等都同传统的数据不同。简单的讲大数据范围更接近于某个群体行为特点数据,全面的数据。移动互联网和社交网络创造出来了大量的行为数据。

大数据产业是朝阳产业,任何一个想进入此产业的公司和个人向先要思考好以下几个问题。

1、数据在哪里?

2、哪些是有用的数据?

3、如何分析这些数据?(如何将非结构化数据变成结构化数据)

4、需要用数据解决的问题是什么?或者是分析后数据后提出的观点是什么?

5、如何展现你的数据和推理?(图形、图表、曲线、分值、评价、归类、等级、概率、模型等等,大数据要么解决目前的问题,要么支持你的假设,要们引导出另一个未知观点)

6、重新审核数据分析的逻辑和数据来源,是否可以展现一份可以经过推敲的数据分析报告?

如果以上的问题都可以解决,这时你可以进入正产业。中国的大数据产业近几年来逐渐升温,政府有投入了大量的资金。目前正在困扰很多大数据公司的问题是数据在哪里?目前我们了解的大数据来源主要有以下几个方面;

1)电信运行商(由于其提供互联网接入服务,互联网行为记录数据)

2)第三方支付(支付行为产生的资金流和信息流数据)

3)电商平台(阿里为代表,几亿的淘宝用户和2万亿的网络购买行为的数据)

4)社交平台(微信和微博为代表的社区网络产生的互联网行为数据)

5)电子游戏平台(大量用户产生的数据)

6)移动入口产生大量数据(包含移动APP,导航,地图等)

7)搜索引擎上产生的数据

除了这些新兴的大数据来源,其实在传统行业,由于很多数据是不能公开和共享的,还有很多大数据来源没有被重点关注。例如:

1)政府掌握的经济社会的统计数据

2)金融行业内部交易和支付数据

3)医疗行业的病历数据

4)教育行业的考试数据

5)交通运输行业物流数据

6)科学研究方面大量重复的论文、专利、科研实验的数据

7)生物工程、农林牧渔等方面的数据

慧都控件网年末大促

目前在中国大数据产业投入最多的是政府,这是一个好事情,因为在中国政府是最大数据的拥有者,最财大气粗的投资者,最具有资源的市场参与者。如果政府可以有效利用手中的数据,经过科学严谨的分析后,利用其进行资源的配置、重大经济决策、市场未来趋势预见、经济风险提示、产业管理、投资管理、财政费用管理、等,将有利于政府进行宏观调控、技术干预、行政管理、资源配置、财富分配。同时也有助于政府提高对公共事务包含社会福利的管理水平。

但是我发现目前很多政府参与的大数据产业集中在两个领域,第一个搭建云计算和云存储平台,利用政府具有的资源,委托研究机构搭建政府主导的大数据生态圈,让企业将数据提供出来,政府提过产业机构来帮助企业分析数据,提供大数据解决方案。简单的讲营造大数据平台和生态圈,从事大数据收集和开发的工作。

第二个是委托具有大数据技术的公司,利用互联网公开的数据和政府拥有的数据进行舆情监控,了解自己重视和关心的焦点问题,关注社会群体的舆论行为、社交行为,以及区域电商交易行为、服务投诉行为等等。简单的讲是利用互联网采集技术来了解舆情,作为一种情报输入来帮助政府来制定工作决策。

这两种参与方式我都不十分赞同,第一种明显是过度参与市场,政府应该制定规则来帮助大数据产业健康发展,而不是作为运动员参与产业发展。政府应该制定相关制度,对不能采集和公开的数据进行管理,保护个体利益,同时应对大数据技术公司提供研发资金支持,鼓励大数据企业利用技术研发实力来推动产业发展,帮企业解决问题。千万不要搭建一个生态圈,产业平台,政府委托的机构会由于机制问题,效率较低,对人才和资源造成浪费,最终会阻碍这个产业发展。第二种虽然有部分积极意义,但是个人觉得舆情监控产生不了巨大的社会经济价值,投入的资金不会有效帮助整个社会的发展,反而在某些方面束缚了部分合理的商业行为,由于我们国家老百姓自身文化和科学常识的不全面,群体舆论的导向不一定代表正确的方向。前瞻性的政治经济决策往往来源于具有远见卓识的领导者,想一想我们的朱隆基总理在98年的几大经济决策,国企改革、金融改革、住房改革、大学生分配改革等等,如果采用舆情监控所得出的结论,肯定不能够推行,因为其影响大多数人的利益。但是正是这几个重大经济决策,将中国经济的活力释放出来,使中国经济保持15年左右的高速发展。

最后对本文进行个总结,大数据产业是中国未来的希望,是未来的朝阳行业,但各个企业不要过于冒进,进入这个产业的企业必须了解这六个问题,找到解决这六个问题的方法,以技术和数据为基础,才能够创造价值,通过大数据这个工具帮助和推动传统产业发展。政府在大数据产业的定位应该清晰,千万不要成为产业的主要参与者,应该从保护产业和个人、商业信息角度出发,成为产业规则制定者,产业技术投资者,大数据技术公司的投资者。政府应该公布自己拥有的、不涉及国家利益和个人隐私,可以公开的大数据,为大数据产业提供土壤和阳光。政府应该打破主要大数据公司对数据的垄断、要求大数据拥有的公司将可以公开的数据公开,在保护客人和企业隐私前提下,为大数据产业提供数据来源。政府可以作为技术伯乐,推动产业进行技术升级换代,成为大数产业发展的助推火箭。

via:网络大数据

慧都控件网超级促销月,全场6折起,豪礼抢不停>>>

截止时间:2016年11月30日

更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>

详情请咨询在线客服

客服热线:023-66090381



标签:大数据BI数据可视化数据分析Hadoop

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果

登录 慧都网发表评论


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
title
title
相关厂商
相关产品
Cognos Analytics

工业4.0优选产品 | 商业智能和绩效管理软件领导者,帮助企业成为业绩最佳的分析驱动型企业

SPSS Modeler

工业4.0优选产品 | 在历史数据中发现规律以预测未来事件,做出更好的决策,实现更好的成效

IBM BigInsights for Apache Hadoop

经济高效地存储、管理和分析大数据

IBM InfoSphere Streams

高效捕获和分析动态数据的软件平台

InfoSphere DataStage

助您发现、充实、集成和管理数据的整个生命周期

InfoSphere Data Replication

在异构数据存储之间复制数据

Watson Analytics

具备理解,学习和推理能力,实现更智能的人机互动,帮助人们做出更好的决策

InfoSphere Change Data Capture

在跨平台和异构数据库环境中实现变化数据的实时复制

i2 Analyst's Notebook

i2 Analyst's Notebook 能够及时提供具有执行力的情报,帮助发现、预测、预防和阻止犯罪、恐怖活动和欺诈活动。

在线客服 在线QQ 电话咨询
400-700-1020
反馈
在线客服系统
live chat