登陆注册
2841100000014

第14章 中国首批重视大数据的千亿公司(2)

由于大数据本身就是一个问题集,在众多的解决方案中,最重要和最有效的技术是云计算,两者结合起来,将产生1+1﹥2的效果。而这也是人们公认的处理大数据集最有效的分布式处理手段。云计算为大数据的处理提供了基础架构平台,大数据应用可以在这个平台上运行,双方密不可分,互相保障。

对于大数据给云计算带来的影响,美国一位IT公司的技术总监贝斯特表示,大数据对云计算的影响只表现在私有的云架构上,对于公有的云架构,对数据仓库没有影响。因为企业的CIO不会无缘无故把财务数据或者客户数据放到云上,因为那是一件极度危险的事情。而私有的云架构则不同,它对于数据仓库的影响有两点:

第一,通过私有云,可以巩固数据集,减少利用率不足的问题;第二,可以通过灵敏的方式将数据集成,实现业务价值。这保证了双方不会发生任何冲突,反而起到了互相补充的加强作用。

☆云计算与大数据的区别--应用的分工

概念的不同

从宏观的概念上来讲,云计算改变了IT,而大数据则改变了业务。同时,大数据必须有云作为它的基础架构,才能得以顺畅推广并体现出强大的实用价值。

目标受众的区别

双方的目标受众也是不一样的,云计算代表着一种IT层面的解决方案,是面向CIO的;而大数据则是一种战略构架,是面向管理者和业务层的,它能让我们在业务上展示出更强大的竞争力,完全提升综合实力。

在中国的发展

☆云计算在世界的发展状况

说起云计算的发展前景,各大互联网巨头就像看到一支飞速上升的A股一样,对于云计算充满了信心。为此,很多公司开始调整未来发展战略。例如,亚马逊使用弹性计算云(EC2)和简单存储服务(S3)来为企业提供计算和存储服务。其中,收费的服务项目包括存储服务器、带宽、CPU资源和月租费。月租费的含义与电话月租费类似,存储服务器、带宽按容量收费,CPU则根据时长(小时)运算量收费。亚马逊把云计算做成了一个类似于移动通信的生意,而且只花了不到两年的时间。

根据某第三方机构提供的数据,在亚马逊上注册开发的人员达到了44万人,其中有很多是企业级用户。而亚马逊与云计算相关的业务收入额也已经达到了1亿美元。在亚马逊所有增长最快的业务中,云计算就是其中之一。

要说云计算使用者最多的网站,当数谷歌。这一点是毋庸置疑的,因为支撑谷歌搜索引擎的,是分布于200多个地点、超过100万台服务器的基础设施,而这些设施的数量正在迅猛增长。无论是谷歌地球、地图、Gmail还是Docs等等,同样都使用了这些基础设施。从这一点来说,谷歌公司确实是非常厉害的,因为采用了GoogleDocs之类的应用,用户的数据都会保存在互联网上的某个位置。而且,用户可以通过任何一个与互联网相连的系统便捷访问这些数据。

谷歌还有一点值得称颂的就是它的“分享”精神。目前,它已经允许第三方在谷歌的云计算中通过GoogleAppEngine运行大型并行应用程序。而且,早先它就已经以学术论文的形式对外公开发表其云计算的三大法宝:GFS、MapReduce和BigTable。在美国、中国等一些高校,谷歌也开设了关于如何进行云计算编程的课程。

我们再来看IBM。2007年11月,IBM推出了改变游戏规则的“蓝云”

计算平台,这个云计算平台为客户带来了即买即用的体验。它包括一系列的自动化、自我管理和自我修复的虚拟化云计算软件,使来自全球的应用可以访问分布式的大型服务器池,使得数据中心在类似于互联网的环境下运行计算。

作为世界PC软件先导的微软公司同样紧跟云计算的步伐,在2008年10月的时候正式推出了WindowsAzure操作系统。Azure(中文译为“蓝天”)是继Windows取代DOS之后,微软的又一次颠覆性转型。通过在互联网架构上打造新的云计算平台,让Windows真正由PC延伸到“蓝天”上。微软拥有全世界不计其数的Windows用户桌面和浏览器,现在它将它们连接到“蓝天”上。为Azure的底层提供支撑的是微软全球基础服务系统,由遍布全球的第四代数据中心构成。

☆云计算在中国的发展实况

关于互联网的未来发展方向,中移动前董事长兼CEO王建宙就认为,毫无疑问的,必定是云计算和互联网的移动化。也就是说,中国互联网事业的发展前途,在很大程度上就取决于云计算在中国的前途。

云计算在中国的发展历程:

2008年5月10日,IBM在中国无锡太湖新城科教产业园建立的中国第一个云计算中心投入运营;

2008年6月24日,IBM在北京IBM中国创新中心成立了第二家中国云计算中心--IBM大中华区云计算中心;

2008年11月28日,广东电子工业研究院与东莞松山湖科技产业园管委会签约,广东电子工业研究院将在东莞松山湖投资2亿元建立云计算平台;

2008年12月30日,阿里巴巴集团旗下子公司阿里软件与江苏省南京市政府正式签订了2009年战略合作框架协议,在南京建立国内首个“电子商务云计算中心”,首期投资额达上亿元人民币;

2009年,世纪互联推出了CloudEx产品线,包括了完整的互联网主机服务CloudExComputingService,基于在线存储虚拟化的CloudExStorageService,供个人及企业进行互联网云端备份的数据保全服务等等系列互联网云计算服务。

从2010年开始,中国的云计算更是被纳入了国家重点工程,获得了政策、资金和技术上的倾斜支持。比如作为中国对云计算探索研究较早的中移动研究院,目前已经成功完成了云计算中心的试验。

对于“云安全”,中国企业创造的概念在国际云计算领域算是独树一帜。我们的“云安全”的概念是:云安全通过网状的大量客户端对网络中软件行为的异常监测,获取互联网中木马、恶意程序的最新信息,推送到服务端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。

中国对于“云安全”的策略构想是:使用者越多,每个使用者就越安全,因为如此庞大的用户群足以覆盖互联网的每个角落,只要某个网站被挂马或某个新木马病毒出现,就会立刻被截获。

“云安全”的发展就像一阵龙卷风,很快席卷了各大安全应用企业。瑞星、趋势、卡巴斯基、MCAFEE、SYMANTEC、江民科技、PANDA、金山、360安全卫士、卡卡上网安全助手等都相继推出了云安全解决方案。例如瑞星,基于云安全策略开发的2009新品每天拦截木马攻击的数量就达到了几百万次,而其中仅在2009年1月8日这一天就拦截了765万余次。

据悉,云安全可以支持平均每天55亿条点击量查询,从这些点击量中每天收集2.5亿个样本加以分析,根据这个庞大的资料库,第一次命中率就可以达到99%。借助云安全,趋势科技现在每天阻断的病毒感染数最高可达1000万次。

其实云安全的核心思想并不是第一次被提出,早在2003年,中国的云计算专家刘鹏就曾提出过反垃圾邮件网格,这与云安全的思想非常相似。刘鹏当时的想法是,针对网络垃圾邮件的泛滥,仅靠技术手段无法很好地自动过滤,因为邮件过滤所依赖的人工智能方法并不成熟。那么,根据垃圾邮件“将相同的内容发送给数以百万计的接收者”的特征,就可以建立起一个分布式的统计和学习平台,以大规模用户的协同计算来过滤垃圾邮件。

这个方法是怎么实现的呢?首先,用户需要在电脑上安装一个客户端,然后就可以为收到的每一封邮件计算出一个唯一的识别码,就像“指纹”,通过比对“指纹”就可以统计出相似邮件的副本数,当副本数达到了一定的数量,就可以判定哪些邮件是垃圾邮件。

其次,由于互联网上多台计算机比一台计算机掌握的信息更多,因而可以采用分布式贝叶斯学习算法,在成百上千的客户端机器上实现协同学习过程,收集、分析并共享最新的信息。

由此看来,用大规模统计方法来过滤垃圾邮件的做法确实要成熟很多,而且误判率低,具有很强的实用性。从思想核心来看,反垃圾邮件网格也更真实地体现了网格思想,因为每个加入系统的用户在作为服务对象的同时,也是完成分布式统计功能的一个信息节点。随着系统规模的不断扩大,系统过滤垃圾邮件的准确性也随之提高。

这既是一个服务的过程,也是反哺并提升技术进步的过程。反垃圾邮件网格就像一张“天网”,充分利用了分布于互联网中的千百万台主机协同工作,由此构建起一道拦截垃圾邮件的天然屏障。

IEEECluster2003国际会议曾把反垃圾邮件网格选为杰出网格项目,并且在香港作了现场演示,引起了世界各地广泛的关注。在2004年网格计算国际研讨会上,还作了关于反垃圾邮件网格的专题报告和现场演示,很多邮件服务商表现出极大的兴趣。而中国最大的邮件服务提供商网易创办人丁磊,对此更是非常重视。

所以我们再回到之前的看法,垃圾邮件尚可如此处理,那么病毒、木马等也是同样的道理,这样看来,与云安全的思想就很接近了。

对于大数据在中国的兴盛,中国有一位资深的大数据研究者表示出了这样的看法:“现在中国所谓的大数据公司,都还是在以互联网思维理解大数据,而非真正的大数据思维,未来还有着大量的创新空间。”

这就是说,大数据在中国的发展,虽然已经有了一定的进展,但还远远不是我们希望看到的。就像人们对于第一次信息技术革命的预测一样,谁也没有想到,现在会是信息技术的天下。很显然,中国的投资人们可不想再等上十年八年,到那时候,他们俨然已经错过在这场大变革中最早的布局机会,市场早被他人垄断,到时候黄花菜都凉了。

对于目前市场上的大数据公司,我们大体可以将其分为三类:第一类,拥有大量的用户信息,通过对用户信息的大数据分析解决自己公司的精准营销和个性化广告推介等问题。如亚马逊、谷歌和Facebook。第二类,通过整合大数据的信息和应用,给其他公司提供“硬件+软件+数据”的整体解决方案。如IBM和惠普。第三类,通过出售数据和服务更有针对性地提供单个解决方案。这一类基本上是新兴的创业公司。需要特别指出的是,作为第三类的新兴创业公司,它们将大数据进行商品化,这会引发继门户网站、搜索引擎、社交网络之后的新一波创业浪潮和产业革命,并且一定会对传统的咨询公司产生强烈的冲击。

不过,如果我们仅仅把大数据的影响力框定在对传统咨询公司的冲击之上,似乎也有些小看了它的威力。大数据分析与传统的数据分析、数据挖掘具有一定的延续性,关键不同在于其分析的数据量更为巨大,且多为非结构化数据。譬如很多段小视频,或是电子商务里的各种评价、晒单等等。这与传统数据分析多利用cookie获取诸如用户每月登录某网站几次等结构化的数据,在技术处理方式上有着很大的不同。

但是,从大数据分析在根本上要做的事情来说,它仍然是要在这些大量的数据中进行分析,得出一些对商业决策有帮助的pattern(模式、方法)。它的应用空间会非常广泛。

对于现在国内一些广告平台公司、市场公司都纷纷上马大数据业务的现象,我们不得不指出的是,它们很多并不真正了解自己的需求,也不明白大数据意味着什么。在实际应用中,大数据主要包括了大交易数据、大交互数据和大机器数据三类。第一类大交易数据已存在多年,从传统银行、电信的交易数据到各类网银支付数据都包括在内;第二类大交互数据,则主要是指来自脸书、推特、微博等社交网络的非结构化数据;第三类大机器数据,则是指由物联网内各种传感器所产生的数据。

如果不是真正做这三类工作并且处理它们之间关系的,即便上马了大数据,也只能是形似神不似,花钱不少,但获得不了多少实际的价值。

现在,中国的老板们眼中都看到了“数据财富”的可贵,也大都在采取一些行动。这是一个庞大的朝阳产业,仅仅在大数据自身的产业链上,就可以分为数据采集、数据清洗、数据分析和垂直行业算法四个环节。但由于中国的市场规模才刚刚起步,分工还没有细化,中国的大数据先行者必须从头开始,甚至在结合国外经验的基础上,要摸着石头过河,才能一步步总结出符合中国国情的大数据应用战略。

阿里巴巴:云帝国构想

我至今仍然对马云说过的一句话印象深刻:“再不动就要死!”阿里巴巴从创立开始,就始终遵循一种“不动即死”的战略原则。1999年,马云创立了作为企业对企业的网上交易平台阿里巴巴。2003年,又投资1亿元人民币建立了淘宝网。2004年,阿里巴巴开始推出支付宝服务,面向中国的电子商务市场提供基于中介的安全交易平台。

淘宝和支付宝,已成为阿里巴巴在电商领域的两大互补性支柱,一跃成为全中国最强大的电商企业。但是马云没有停止扩张的步伐,阿里巴巴仍在继续“动”。他先是购入高德地图,投资新浪微博,而且还增资UC。在十周年活动后,马云宣布卸任,但阿里巴巴的“云帝国”才刚刚开始。

☆传播渠道--天下网商

有了传播渠道,品牌的扩散就有了保证。传播也是信息辐射的重要平台,因此越是信息丰富的社会,媒体的重要性也就越突出。阿里巴巴在2010年和浙江出版联合集团倾力打造了一家新媒体《天下网商》,专门为其电子商务领域提供信息传播服务,这成为了阿里巴巴品牌战略的一大标志,也对它的品牌地位有了范围更广的提升。

☆核心数据源--旗下的拳头产品

好的产品才是成功的基础,阿里巴巴旗下的所有产品几乎都是一个强大的数据源。从1999年以来,包括阿里巴巴黄页、淘宝网、天猫、一淘、聚划算、阿里旺旺等产品相继崛起,独树一帜,占据了行业领先的地位,为阿里的品牌战略提供了无数充实的内容,也为阿里的大数据战略提供了坚实的核心数据,成就了马云的全网络战略梦想。

☆核心技术--阿里云

同类推荐
  • 如何经营一家最赚钱的餐厅

    如何经营一家最赚钱的餐厅

    本书以实用为目的,从客户管理、员工管理、设施管理、物流管理、财务管理、品牌管理六大方面,结合正反两方面的实战案例,为读者揭秘餐厅的经营之道,让读者更加清楚如何经营一家赚钱的餐厅,是一本真正速战速决的餐厅赚钱的秘籍,也是餐厅老板经营一家最赚钱餐厅的实战手册。
  • 互联网商业思维

    互联网商业思维

    围绕“互联网商业”关键词,《经理人》杂志意在用权威、热点的观念和事件为读者讲解“互联网”时代我们应该怎样开拓新商业模式。从互联网商战、互联网金融、互联网营销、互联网商业模式、互联网新平台运作方法以及对互联网未来发展预测的角度,全面阐述深入分析了极具价值的商业模式启发和最新的发展动态。
  • 全球顶级企业通用的10种人力资源管理方法

    全球顶级企业通用的10种人力资源管理方法

    只有基于人性的管理方法才是最好的;所有管理方法最终的目的只有一个,就是充分整合人才以发挥最佳功效。所有这些构成了本书的第一个视角——通用管理方法。所谓项级企业并不仅仅因为他们在销售或利润上有着惊人的数字,更重要的是他们所取得的成就从侧面反映了企业所采用的管理方法的成功。
  • 财务报表一本通

    财务报表一本通

    人们常常将财务和会计这两个概念混淆在一起,认为这两者之间没有什么区别,其实这是两个不同的概念。在讨论财务报表之前,让我们先来区分一下这两个概念。财务是什么?财务涉及的主要是融资、投资以及利润分配的管理问题。
  • 资本大鳄

    资本大鳄

    “资本”这个词原本的含义,是指用来获得更多财富的财富积累,包括现金及固定资产。在当今社会,它的含义已经被得到了扩充。
热门推荐
  • 嫡女棣王妃

    嫡女棣王妃

    “姨娘,夫人似乎断气了~”“哼!这么一碗药都下去了,难道她还能活着不成?”“那这······”一个年纪稍长的人朝着这位称作姨娘的人示意了一下自己手中的婴儿,似乎有些犹豫,“这好歹是个男孩,现在夫人已经死了,如果姨娘把他占为己有,然后得了这府中的中馈······”“嬷嬷?!”女子也不等她的话说完,就打断了她,“你记住了,我恨死了这个女人,她的儿子,只能随着她去,我就是以后自己生不出儿子,抱养别人的,也不会要她的。把他给我扔马桶里面溺了,对外就说一出生就死了!”猩红的嘴唇,吐出来的话却是格外的渗人。嬷嬷还想说什么,动了动嘴,却是一句话也没有说,转身朝着后面放着马桶的地方走去。却是没有发现旁边地上一个穿着有些破旧的衣服的小女孩此刻正瞪大了眼睛看着她们两。这是什么情况?自己不是被炸死了吗?怎么会······于此同时,脑中不断有记忆闪现出来,她们是自己的母亲和刚出生的弟弟啊?!不行,先救人。转头看见旁边谁绣花留下的针线跟剪刀,想到自己前世的身手,拿起一根绣花针就朝着那个嬷嬷飞了过去,却在半路上掉落下来,暗骂一声,这人是什么破身体。却引得那两个人听见动静看了过来。女人阴狠的盯着她,“你居然没有死?”微微眯起眼睛,自己的前身也是被她们弄死的了,看样子她们谁也不会放过,抓起旁边的剪刀就冲了过去。随着几声惨叫声,从此以后,府中府外都传遍了她的“美名”——凤家大小姐心肠歹毒,刺伤了府中无数的人,宛如一个疯子。
  • 网络世界

    网络世界

    科学是人类进步的第一推动力,而科学知识的普及则是实现这一推动的必由之路。在新的时代,科技的发展、人们生活水平的不断提高,为我们青少年的科普教育提供了新的契机。抓住这个契机,大力普及科学知识,传播科学精神,提高青少年的科学素质,是我们全社会的重要课题。科学教育,是提高青少年素质的重要因素,是现代教育的核心,这不仅能使青少年获得生活和未来所需的知识与技能,更重要的是能使青少年获得科学思想、科学精神、科学态度及科学方法的熏陶和培养。科学教育,让广大青少年树立这样一个牢固的信念:科学总是在寻求、发现和了解世界的新现象,研究和掌握新规律,它是创造性的,它又是在不懈地追求真理,需要我们不断地努力奋斗。
  • 绝世宠妃

    绝世宠妃

    甚至为她放弃整个天下。只为要一个她!,她是天朝特种兵,一朝穿越,从唯唯诺诺的废柴四小姐,步步为营,处心积虑的成为当朝太子妃,她是外人眼里的狐狸精,却是他的智慧小娘子,他宠她,用尽全心去宠她
  • 爱无戒

    爱无戒

    这个男女通吃、几乎每天换一个床伴的徐大总经理,给进入电影公司工作七年的陈希哲带来了无以言喻的灾难。公文有一字打错,哪怕是个“的”字,他也会遭到徐总一整个上午的训斥;咖啡冲淡一点,会被泼一身,然后徐极会给他三分钟时间去换一套新的,所以陈希哲每次上班都要带一两套干净的衣服。不论是搞基,还是拉拉,只要有爱就很完美。
  • 命定宫斗Ⅰ

    命定宫斗Ⅰ

    一场天劫,让两位仙女背负着生生世世的诅咒在凡间永生!一次情感的背叛,让她不计代价地穿越前生今世,只为与第三者一较高下!金枝玉叶的公主,突遭真相的打击,亡命天涯,誓死复仇!与人斗、与天斗、敌不过与自己的良心斗!赢得了表面风光,却输尽了人格与尊严!他与他是兄弟、是政敌、是情敌;违背伦理,他们终究得到了什么?她与她,几度挣扎在生死边缘,付出了一切代价,只为:人定胜天!
  • 间谍先生:豺狼的日子

    间谍先生:豺狼的日子

    惊动世界四大情报组织的间谍小说大师福赛斯!福赛斯在英国军情六处秘密工作二十多年,6岁开坦克,19岁成为战斗机飞行员!他对世界各国的间谍手法了如指掌,是美国中情局、以色列摩萨德重点关注对象!同时,他也是爱·伦坡奖得主,8部作品被改编成电影,累计销量超7000万册! 间谍的世界,你不能解决问题,你就会成为问题!1963年8月25日,星期天,法国总统戴高乐不顾劝阻,出席一场声势浩大的公众聚会。豺狼,受雇在这一天刺杀总统戴高乐。强大的法国警方对此一筹莫展。因为没人知道豺狼在哪儿,更没人知道该如何确保那位固执的总统的安全。此刻,豺狼的枪已远远架好。他能清楚地看见目标的五官:隐在平顶军帽下的眉毛,凝视着的双眼以及法国人那高耸的鼻子。这一次,戴高乐总统比他生命中的任何时候都更接近死亡……
  • 世界文学知识大课堂:世界近代文学发展概论

    世界文学知识大课堂:世界近代文学发展概论

    文学是一种社会意识形态,与社会、政治以及哲学、宗教和道德等社会科学具有密切的关系,是在一定的社会经济基础上形成和发展起来的,因此,它能深刻反映一个国家或一个民族特定时期的社会生活面貌。文学的功能是以形象来反映社会生活,是用具体的、生动感人的细节来反映客观世界的。优秀的文学作品能使人产生如临其境、如见其人、如闻其声的感觉,并从思想感情上受到感染、教育和陶冶。文学是语言的艺术,是以语言为工具来塑造艺术形象的,虽然其具有形象的间接性,但它能多方面立体性地展示社会生活,甚至表现社会生活的发展过程,展示人与人之间的错综复杂的社会关系和人物的内心精神世界。
  • 剑男诗选(中国21世纪诗丛)

    剑男诗选(中国21世纪诗丛)

    当一个人从扮繁复杂的异乡回到故乡,故乡是不需要辨别的。故乡就是我们与生俱来的深切记忆,一个人回到故乡,他就是回到母亲的怀抱,他就可以宠辱皆忘,直至消失在与故乡无边的融人中。与物欲横流,人情淡漠的他乡相比。只有故乡才是我们皓首单衣仍不忘返回的最后归宿,只有故乡,才能让一个游予在他的怀中快乐地哭泣。
  • 位面破坏神

    位面破坏神

    武侠、动漫、仙侠,历经各个位面。以破界珠为本,以大执念为宗,破碎万界,随心所欲。
  • 总裁请立正!

    总裁请立正!

    他与她,青梅竹马,然只为那一道莫须有的鸿沟分开十二年,相爱不敢爱~十二年里,他耐心守候,坚如磐石;她忙忙碌碌,只为忘却~再相遇,是剪不断的情!——小清新,小纯情片段一:日落,醉美夕阳。他说:我不轻易给承诺,给了定会实现!她说:承诺是莫须有的东西,我不要!