当前位置:首页 » 大数据精品文章 » 正文

第六章 颠覆与重塑思维,大数据与思维革命

1838 人参与  2018年10月16日 12:43  分类 : 大数据精品文章  评论

大数据所昭示的是一种颠覆性的思维方式,无论是人才的需求、支付方式,还是营销策略、发展预测等等,企业都要找到与之相匹配的经营思维方式。这注定是一场惊天动地的变革,而引导这场革命的正是大数据。

大数据时代的综合人才

人才是大数据时代最为稀缺的资源。谷歌的首席经济学家Hal Varian提到过,统计学家是未来最为性感的职业。大数据创新和创业最大的挑战就来自人才的招募、培养和使用。合理的模式将人才的价值放大,同时还将大 数据的价值释放出来。在大数据时代人才缺乏的原因是复杂的,破解的方式也是多种多样的,为此大数据实验室做了很多有益的尝试。

不少企业的数据基础是很不错的,还有很多待解决的有意义数学问题,并且大数据战略被引入的强烈愿望也因此体现。限于 企业规模或是企业发展的现状,总不会有那么多的企业可以和数据科学家合作,大数据战略便因此而搁浅。北京中关村,中国智力资源最为密集的地方,这里就有大 数据实验室,在高校密集的上海杨浦区还有中关村的分部,有了这个,中国顶尖的数据科学家就可以和大数据实验室合作。不少在大数据方面有着大抱负的企业或是 创业者他们看到了这种合作中,自己可以求助数据科学家为自己的大数据难题攻坚的机会。同时大数据实验室微信的多样数据科学家网络也将和大数据实验室共享, 在人才成本高,技术需求多样的今天,这些问题也得以解决了。数据科学家其实对此也非常感兴趣,毕竟这些问题具有多样性的特点,且现实意义很深远。

大数据的创新和创业除了需要数据科学家外,还要有拥有专业知识和技能的人才来协助。其中有IT能力、行业知识、创业 知识、投资知识等等方面的人才。在大数据实验室的支持下,具备多种专业技能的导师(mentor)网络就可以得以建立和维系。大数据的创新需要来自各个行 业的专家定期或是按需进行指导,大数据创新者的成功率也会因此提升。

此外,大数据人才从大数据实验室中获得了多种可能,他们可以由此来依照自己的特点来施展自己的才华。大数据人才一定 是对大数据研究感兴趣的,和大数据实验室开展合作并以此来研究分析大数据是最佳的选择。如果大数据人才能兼备商业和技术才能,就可以通过大数据实验室的资 助开始创业。

大数据人才展开了与大数据实验室的灵活合作,大数据人才会因此成长。数据价值实现就应当要依靠人才价值的实现。那么,我们应该思考这样的问题。

(1)各个国家的报业集团纷纷破产、停刊说明了什么?谷歌到底是互联网公司,手机制造商还是电信运营商呢?无法定位 的谷歌,事实上它的利润来源还是基于大数据的精准广告。谷歌的数据量越大,广告就越是精准,利润就越多。谷歌是一个精美绝伦商业模式的开创者,用户可以免 费使用它所提供的优秀服务,而谷歌做的只是用大家使用的数据向广告主收费。在大数据成功飞速运转的背后,就是谷歌的胜利。激烈的竞争压力下,传统报纸和杂 志举步维艰也就不足为奇了。

(2)美国总统似乎是最善于营销的,他的营销在于数据驱动的营销,这种模式为美国历史上的第44任总统奥巴马的续任 所起的作用是巨大的,同时也成了2012年大选中的一个决定性因素。这也传递出了一个信号,华盛顿那些原本从直觉和经验中决策的竞选人士失去了原本的优 势,反倒是依赖数据分析专家和电脑程序员的人们从大数据中获得了关键的优势,大数据提供了众多信息,从而使他们准确理解选举的形势。显然大数据在政治营销 领域也迎来了自己的春天。

(3)庞大的传媒业市场,正在高速发展。数据资产综合应用了新技术、新商业模式、更多维度以催生下一个巨人。

飞利浦的大数据营销策略

世界上最大的电子公司之一飞利浦,它拥有多个领域的电子产品。飞利浦将中国市场作为“极有潜力的本土市场”,在整个 营销战略中成了一个重点地区。所以,在大中华区,生产小家电的飞利浦优质生活事业部将其视为与欧洲、美洲同等级别的市场,成了“商务组织”的四大核心市场 之一。

飞利浦最具优势的小家电有个人护理小家电、榨汁机、吸尘器和空气净化器等等。只是在中国市场上,还有美的等品牌对手 带来的激烈竞争,飞利浦受到了极大的冲击。从2011年5月开始,在全国各个直辖市和重点省份,飞利浦小家电和精品小家电开展了一个季度的推广促销风暴, 以推广自己的品牌和网络的曝光量。

执行项目期间,传播活动重点推广和促销了飞利浦空气净化器、风景时尚灯、吸尘器、剃须刀、soudbar、avent六大产品。扩大品牌和产品网络的曝光量是此次传播活动的主要目的,但同时还要让目标的消费群体更多地认识飞利浦的相关产品,这样一来商业效益就会随之增加。

中国互联网环境的特征是网络数据各方割据,有显著的碎片化情况。除此以外,飞利浦的产品线过于繁多,导致了传播任务 十分繁重,飞利浦很难掌握单一品牌的互联网互动方式,这种方式也不利于其传播信息,品牌形象也难以树立。飞利浦的目标在于整合营销策略,中国消费者由此能 更深地体会到飞利浦品牌的优秀特性,有限预算的ROI也会大大提升。

实际上,飞利浦投放广告要是从互联网传播角度来看必然会迎来四大挑战。第一个挑战是借由大数据的洞察,人群和精品人 群的网络行为特征和心理特征也很快被洞察出来,网络传播就以此为策略依据。第二个挑战是媒体传播策略是在区域的销售策略基础上来制定的,线下销售和网络推 广得以有效地衔接。第三个挑战是多产品广告同步推送的问题解决了,有限的媒体版位也得到了有效利用,广告版位通过技术手段来展示消费者最感兴趣的广告,不 同的受众看到的广告是不同的,版位的价值因此提升。第四个挑战,在亿赞普ID数据的基础上,跨区域广告实现了频次调度,有限广告位产生了最大化的销售价 值。即便是同样的预算却达到了2倍以上的常规广告投放方式效益。

传播策略的确定先要来自由大数据建立的数据模型,再依据飞利浦消费群体做出相关数据,可是在飞利浦的全国推广中如何运用大数据呢?

飞利浦项目的执行基础是海量数据的存储基础,再经过数据挖掘和人工智能的算法,分析海量的互联网用户、内容和相关行为,从中发掘潜藏的营销机会,这才会收获最有价值和效率的营销效果,投资回报率才会更高。

执行策略的过程基础就是互联网的大数据分析,再同互动策略、数字创意、互联网媒体采购、互联网公共关系和监测服务全 面进行结合整合,构建一系列关于差异人群覆盖、品牌植入传播、多媒体组合策略、EPR互动口碑传播以及CRM用户持续管理系统等完善的体系,在技术和媒体 数据化结合的基础上提出基于智能化投放的360度传播策略,目标就是要全面覆盖飞利浦的全部受众。

这不单纯只是营销,还是数据、技术和营销的完美结合。

阿里小贷的“不可能的任务”

阿里巴巴在2012年8月对B2B小额信贷的业务(以下简称为小贷)范围进行扩大。以往只能是B2B平台付费用户的 小贷业务,普通注册用户从那以后也可以申请小贷,地域范围却仍然局限在江浙沪一带。此前就无地域限制的淘宝网和天猫商城贷款业务并没有因此发生变化,这也 在某种程度上意味着阿里巴巴小贷业务会激增,也会进一步提升它所占据的市场份额。消息一出,社会各界的反响都很强烈,只不过大家的意见并不统一,有人甚至 喊出了“颤抖吧,银行!”的口号。事实上阿里巴巴的这项业务会颠覆传统银行吗?谁也不知道,毕竟最后的结果是多种要素综合的结果。可是现在有一点可以确 定,在金融界,阿里巴巴的小贷业务确实有了自己的一片立足之地,传统银行业也因此受到了一定的威胁。

始于2007年5月的阿里巴巴小贷业务,其实是阿里巴巴在和中国建设银行、中国工商银行合作的基础上推出的中小企业 无抵押贷款,但后来因为种种原因,这次合作并没有维持太长时间。2010年和2011年,阿里巴巴和复星集团、银泰集团还有万向集团合作成立了浙江阿里巴 巴小额贷款和重庆阿里巴巴小额贷款两家公司,主营业务是网络贷款。总体来说,阿里巴巴的小贷有两大类,一种是B2C平台,也就是基于淘宝网和天猫商城客户 的贷款和信用贷款,另一种则是针对B2B平台,为阿里巴巴中国站和中国供应商会员提供阿里信用贷款,具体区分的话可以分为循环贷和固定贷两种类别。小贷的 贷款额度不超过100万元,计息的方式是按日收费,一般淘宝网、天猫商城的信用贷款和阿里巴巴的循环贷的贷款利率都是0.06%/天,剩下的贷款项目为 0.05%/天。这样很容易可以推算出前者的年利率大约为21.9%,后者的年利率大约为18.3%,贷款的利息均高于央行1年期贷款6%的基准利率,属 于小额贷款行业内中等水平的利率,在国家规定的基准利率4倍以内的要求。

中国中小企业60%以上的GDP都来源于此,80%左右人口的就业问题也因此解决,中国社会经济发展也由此推动。不 健全的中国信用体系,造成了非常艰难的信用记录和信用评估,国内金融界为了控制贷款的成本高额风险,长期以来主要以抵押、担保贷款为主,信用贷款还是比较 少。中小企业在创业初期既缺抵押物,又无担保,传统金融机构很难为他们提供更充分的融资。阿里巴巴的小贷既不需要抵押,也不需要担保,还有非常高的申请效 率,对于中小企业极其迫切的融资需求来说显然是一剂良方。适应市场发展要求的企业必须有强大的生命力,阿里巴巴小贷曾经创造出突出的经营业绩,它所凭借的 就是创新业务。阿里巴巴金融统计数据曾指出到2011年年底,接受阿里金融服务的小微企业已经多达9.68万家,占到了全中国4000多万家企业的 0.2%,投放贷款也高达154亿元,坏账率不及1%,和传统银行抵押类贷款产品的坏账率相比低了不少。阿里金融更让人惊讶的是仅仅2012年上半年投放 给小微企业的贷款就有170万笔,总金额有130亿元。每天平均完成了1万笔贷款,平均的贷款额度在7000元。

阿里巴巴金融的单日利息截止到2012年7月20日高达100万元,从这个趋势来看再有一年的时间,就会实现一年 3.65亿元的利息收入。相对而言一般的小贷公司一年的利息收入只会有几千万元。国家有政策规定,银行借贷的数额不得超过其注册资本金的50%。阿里金融 的两家小贷公司注册资金的总量在16亿元左右,照此计算,放贷资金就不能超过8亿元,那么日利息收入最多的时候可以超过120万元(日利息为 0.05%),上限大约是144万元(日利息为0.06%)。阿里金融现在的日利息大约是100万元,从国内来看算是业内顶尖的了。阿里金融的扩展还局限 在自己的生态体系内部,不过凭借着它7980万注册用户量、1030万个企业商铺和75.39万名付费会员量(截止到2012年3月的数据),阿里即便是 不算上淘宝网和天猫商城的庞大用户群,也可以随着自己生态体系的逐渐庞大推动自己金融未来的发展,这种势头不容小视。

既没有担保又没有抵押,对哪一家银行来说都是个大难题。如果还要实现每日1万笔贷款,单笔额度在7000元左右,单 日利息的收入要做到100万元,很多传统银行更是想都不敢想。阿里金融又是怎么实现上述所有的一切的呢?阿里巴巴的回答一定会是他们经营了多年的主要业 务,即从电子商业平台上累积了多年的海量数据帮了个大忙。

传统的金融机构为了规避信息不确定所带来的运作风险和经营损失,不得不用抵押和担保等手段,可是大数据时代到来,所 有信息都会日渐透明,商业运作的方式也会随着商业环境的变化而改变。经过十几年的运营发展,阿里巴巴旗下的阿里巴巴(B2B)、淘宝、支付宝已经有了大量 后台数据的累积,除了有用户的交易数据,还包括了资金流动、访问量、产品变化、投诉评价、用户注册等经营数据和身份信息,即时生成的这些数据都是自动产生 的,阿里小贷从中获得了海量的数据支持,更重要的是这种方式成本很低。阿里巴巴打通了旗下的所有平台,实现无缝连接,网络数据模式由此引入了海量的数据, 在在线视频调查和第三方验证等手段的配合之下,评估企业和个人的信用等级。与此同时,阿里金融还有一整套涵盖贷前、贷中、贷后的风险预警和管理体系,这就 是控制贷款风险的方式。阿里金融依靠这个方式在金融机构中做到了传统银行所做不到的事情。

阿里巴巴到现在更是认识到海量数据给予他们的巨大财富来源。阿里巴巴集团在2012年7月宣布设立首席数据官,也推 出了“数据共享平台”战略。2个月以后,阿里巴巴的董事局主席马云通过网商大会的平台宣布2013年起阿里巴巴开始转型,要重新整合平台、金融和数据三大 业务。马云的话当中不难透露出数据在阿里巴巴众多业务中的重要作用。显然,在土地、劳动力和资本之后,数据俨然是价值巨大的新资产,未来的企业竞争将围绕 大数据收集、挖掘和运用展开。

第三方支付业务的另一种思路

2010年6月起,央行前后四次发放了大约200张类型各异的支付牌照,涵盖了互联网支付、银行卡收单、预付卡发行 与受理、移动电话电话支付、固定电话支付、数字电视支付、货币汇兑七大类型的业务领域。由此可以看出,第三方的支付行业已经迎来了“后牌照时代”,行业的 准入门槛降低了,但市场竞争却越发激烈。第三方支付企业以往的利润均来自交易佣金,大致是交易金额的0.5%到1%之间。由于互联网支付市场一时间涌入了 各方资金力量,短时间内盈利空间被大大压缩了。

第三方支付企业为了摆脱瓶颈开始积极拓展新业务,他们先后推出了理财服务、行业解决方案、移动支付、跨境支付结算等 业务,大数据为基础的创新业务是其中最具潜力的发展方向。互联网的支付行业走过了多年的发展,有了海量用户数据和交易数据的积累,这些数据已经成了包含巨 大价值的“金矿”。第三方支付企业未来最重要的核心业务很可能就是基于数据挖掘和加工的商业创新应用,传统的支付结算的地位会降为“副产品”,之所以还留 存就在于它能够源源不断地为企业提供市场数据。

国内的第三方支付企业实际上已经认识到了蕴含巨大价值的大数据,也开始挖掘“金矿”的工作。阿里巴巴集团应该是这行 业中走得最快最前的企业了,它用支付宝把淘宝、天猫和阿里巴巴B2B旗下的几个平台都打通,还在网络小贷服务上收获了巨大的利润。除了阿里巴巴外,其他第 三方支付企业也开始了与阿里巴巴不同渠道的探索和开发,譬如快钱,它主要集中在企业应收应付账款融资服务的研发,快钱和合作银行之间采用将企业的应收账款 或应付账款信息和产业链上下游企业一段时间内的资金流转数据统一的方法来合作,企业客户就可以以此从银行贷到款项。还有易宝支付也尝试着和银行合作,主要 为航空领域的代理人提供周转资金,还在交叉营销业务进行新的尝试,通过这两个业务,易宝支付迄今为止的年收入大约是10亿元,在线支付的收入占80%,剩 下的20%是营销和信贷业务。上述每一家公司的信贷创新都和第三方支付企业所积累的海量数据有关,显然经营发展的关键资产就是海量数据。从现在的趋势来 看,未来基于大数据的新应用和新服务只会越来越多。

社会逐渐认可了第三方支付的独特业务模式,大量的买卖双方数据可以慢慢积累,也因此让第三方支付业务成了受众认可的 合法业务。将来假如想继续推进其独立发展的话,下面两个关键点需要关注,一个是为了构建巨大的数据源必须通过创新产品和服务来吸引更多的客户,另一个就是 扩展新型的业务,推动数据资产的开发和利用。

P2P网络借贷动了谁的奶酪

美国的Lending Club在新一轮的融资中,于2012年6月募集到了1750万美元,这当中包括了KPCB投资的1500万美元,还有摩根斯坦利前CEO John Mack以个人名义投资的250万美元。有了这两笔投资之后,KPCB合伙人,被人称作“互联网女皇”的Mary Meeker和John Mac都成了Lendjng Club的董事会的董事,从那以后,Lendjng Club的融资已经接近1亿美元。这两位来自互联网领域和金融领域的大腕为何如此关注Lendjng Club呢?这必须从充分了解这个公司开始说起。2006年成立的Lendjng Club,于2007年正式上线,它作为一个网上金融社区,聚集了大量的优秀贷款人和借款人,作为双方借贷关系的中间服务方,它在尝试用一种相较于传统金 融机构服务更为高效、便捷且成本更低的运作方式开展业务。

Lendjng Club平台上所设定的利率是不断调整的,依据贷款等级和期限的不同在6.03%到24.89%之间上下浮动。Lendjng Club平台上的贷款有A到G七个等级,一个等级下还有1-5五个等级,贷款时间上限为36个月。Lendjng Club向借贷双方收取中间费用,这是它利润的主要来源,每一笔交易成功后,借款人必须支付贷款总额的1.11%到5%不等比例的费用给Lendjng Club,具体金额由贷款等级和期限来决定,Lendjng Club随后再向贷款人收取借款人借贷总额的1%的服务费。倘若借款人的借贷服务不成功,Lendjng Club还是要收取15美元的费用。倘若借款人偿还贷款的时间超过了期限15天以上,Lendjng Club就要收取滞纳金。发展十分迅速的Lendjng Club,到了2013年1月,贷款发生总额已经超过了12亿美元,中间服务收入也突破了1亿美元。

作为一家典型的P2P网络借贷公司,Lendjng Club的发展情况已经从某种程度上展示了行业的整个发展趋势。最先发源于英国的P2P网络借贷业务,第一个P2P的创新借贷平台也出现在英国,那便是在 短时间内迅速将自己业务拓展到美国、德国等国家的Zopa。紧接着2006年Prosper在美国创立,到2013年1月初,平台的会员已经有160万名 左右,会员间的贷款也达成了将近4.44亿美元。与传统银行的金融中介相比,P2P金融交易有着高效率、低成本的特点,服务人群的数量和范围也扩大了,加 速了金融发展的进程,只不过双方数据信息的可靠与否是推动该项业务发展的关键所在。

相对于欧美各国,中国的P2P模式起步晚,一直到2007年才真正进入中国,不过发展的速度却十分惊人,很短的时间 内像是宜信、拍拍贷、红岭创投、贷帮等一批新兴P2P网络借贷公司纷纷出现,传统的网络大腕也参与到了这个市场的角逐中。中国平安集团于2012年3月投 资成立了网络投融资平台陆金所开始运营。几个月后的12月,国家开发银行、江苏省金融办和江苏金农公司合作推出了社会融资服务平台“开鑫贷”。投资机构看 到了如此巨大的市场想象空间,也“蠢蠢欲动”,最典型的要数向拍拍贷投资2500万美元的红衫资本。哈佛商学院在2012年5月做了一份《中国人人信贷概 览及其在中国金融体系中的潜力》,其中报告提到中国的P2P网络借贷平台数量已经超过了100家,而且还在以每年50%的增长速度在增长。显而易见,因为 迎合了市场的需求,P2P市场的发展速度很是惊人。由于不健全的信用体系,传统国内的银行开始纷纷提高自己的贷款门槛,而且在金融危机和欧债危机影响下, 银行更是收紧了银根,原本在资金周转上就有困难的中小企业更是苦不堪言。而对于普通的贷款人来说,股市低迷、楼市受限且理财渠道有限,也受到了不少的影 响。此时的P2P借贷平台显然为他们提供了最为有效的资金支持,用一种更为便捷的运行模式让中小企业和闲散资金的拥有者找到了最好的服务平台。

从运行模式来看P2P网络借贷和EBAY有些类似,他们都搭建了一个平台,为借款人和贷款人搭建了服务的网上平台, 借款人需要在平台上填写自己的贷款金额、用途、期限、信用记录以及个人信息等资料,通过对这些资料的初步审核,网站会判定借款人的信用评分和风险等级,再 为贷款人提供相应的投资方案。竞拍模式是网站的主要交易机制,贷款人利用贷款利率来竞标,最终利率最低的人被选为最终贷款人,成功后网站从中收取手续费。 两者的区别就在于P2P网络接待竞拍的是资金,而EBAY则竞拍实物商品。网站为了规避风险,借款人从贷款人那里获得的资金仅为其所需的一部分,贷款人剩 下的资金则分散给其他借款人,而借款人所需的其他资金则分散由不同的借款人提供,这样一来,借款和贷款就形成了复杂的交叉。

总体而言,P2P的运行模式同上述的方式很类似,只不过在特殊的中国市场环境中,引入中国的P2P做了一定的调整, 衍生出两种主流的发展模式,其中一种的代表是拍拍贷,它们是单纯的线上借贷平台,这和欧美国家的P2P网络借贷模式比较像,这种平台必须依赖完善的市场信 用体系和金融服务体系。在中国推行这模式,显然有成本低、扩张速度快的优势,只不过风险过高。另一种则是线上线下融合的借贷公司,以宜信为代表。这种模式 通常线下模式更重,尽管成本高、扩张速度慢,但是风险却低许多。中国的一部分P2P网络借贷平台为了吸引贷款人,会提出“保本承诺”。如果有了违约情况出 现,贷款人可以从网站获得本金赔偿,显然这个承诺是为了承担贷款违约的风险,只不过资金链和盈利会受到或多或少的影响。

大数据带来的智能化与柔性化

在商品市场供大于求的时候,企业的价值链就会迅速转向需求驱动。客户在大数据时代介入了企业当中,让企业价值链在引导之下深度整合,推动组织价值的智能化和柔性化,研发、设计、生产、供应、销售、售后服务等等的价值链环节都会有类似的体现。

大数据运用的企业可以对客户进行微分化、个人化的定位,对客户所有的需求特征实时、全面地把握,传统企业显然在智能 和柔性程度上缺乏这样的高效。举例来说,Kindle就有这方面特征的功能。用户在Kindle上阅读过的文档都会用附件的形式给亚马逊分配给其的邮箱发 送邮件,这个邮箱的真正作用不在于收发邮件,而是Kindle给用户的云存储空间。一旦Kindle连上网络,没下载过的文档就会自动下载下来,云存储空 间的任意文档都可以让用户随时随地反复下载阅读。

售后领域,大数据的智能化潜力也是十分巨大的。企业利用远程智能监测、远程辅导等等模式,把人员的投入有效地降低 了,服务质量和服务效率更是提高了。例如电梯制造商、飞机制造商、机床制造商等等设备制造商,会把传感器植入售出的设备当中,随时随地地记录设备的运行情 况,设备制造商因此即时获得设备在运行中的情况,对出现的问题进行及时诊断,不需要再到现场,通过远程就可以维护产品。远程智能维护过程中,设备保证系统 能够有效运转的核心必须是长期积累的海量数据。

生产流程由于大数据所带来的变化有:为了满足个性化需求而进行柔性生产;为了降低生产风险采用模拟技术;为了改善操作环境而进行实时远程监控。

未来生产商会听到越来越强烈的消费者的声音,消费群体也会因此拥有越来越大的群体力量,消费者最终会成为价值链的第 一推动力,所以未来商业模式的主流必然是“定制”。个性化需求必须要求多品种、小批量和快速反应,在竞争当中,能够实现柔性生产的企业会有较大的优势。要 实现柔性化生产,成本以及技术是最大的难题,尤其要注意生产中大量应用信息技术,这样才可能降低柔性化生产的成本,适应个性化需求的需要,信息技术的改进 还会带来生产线流程的进步,最终实现柔性化生产。实现柔性化的基础在于获取、传输、运用数据,就现在而言这样的应用已经在汽车、家具等制造业中非常常见 了。

种种风险都会在生产过程中出现,它们无一例外地会带来巨大损失。首先要对历史经验的数据和规律进行总结,模拟分析生产全过程,预见风险,做到防患于未然。

当人工操作已经和生产环境发生矛盾时,或是人工成本大幅增加时,人力就会为机器所替代。企业在机器当中植入传感器,实时传回机器工作的数据,实现远程监控设备的目的,操作人员就可以远程操作设备了。

市场需求预测是供应链管理中最为关键的环节。大量个性化的需求可以通过高效分析大数据而获得,加上了解各种辅助信息和合理的预测,供应链中的各个环节都可以灵活、适时地安排。

供应商通常都会累积一系列数据,对需求预测进行改进来安排供应计划。供应链上下游的数据透明了之后,生产和供应的安 排就可以变得更为合理了。例如零售商的数据反馈给生产消费品的企业,设备生产商的数据又反馈给生产零部件的企业,在他们获得数据之后,物流、生产、原材料 等供应链的环节就可以得到合理调配和安排。此外,上下游之外的数据也可以进行创新整合来创造价值。举个例子,一家跨国饮料企业将每天外部合作伙伴的天气信 息合成,再将其反馈给需求和存货规划流程,根据特定日子的温度、降水和日照三个数据点的分析结果,适当减少了欧洲一个重要市场的存货量,这当中预测的准确 率也随之提高了5%。

以往企业中的研发、设计、供应、生产、服务、销售等部门的信息总是彼此独立的,随着结构和非结构化数据技术的不断进 步,各个环节之间的信息不再是独立的,也是有机地结合在了一起,研发人员不论从哪个环节下手都可以提取到非常有意义的信息,譬如生产新产品中遇到的问题, 销售情况,还有客户的反应等等。定期的分析可以让研发人员获得这些信息,在大数据的时代,研发人员可以实时获得此类数据,通过分析来提取有价值的信息,从 而改善产品的设计方案,产品的更新进程和对客户的响应也会随之加速。

在海尔公司内部搭建了市场链研发和营销协同机制,除此以外,参与其中的还有研发部、企划部、市场部和售后部,新产品的市场监测体系建立在多维度的数据之上,一个对市场快速反应的开放系统由此形成,企业为此有了优化产品、推陈出新的重要保障。

长期占据亚洲市场四成份额的UC浏览器,之所以能保持这样的优势,正是因为其先进的研发理念,UC坚持在市场之上为 客户创造价值,推出了智能适应屏幕大小、夜间模式和语音等多个适应客户需求的功能,而这一切决策都来自对客户行为数据和反馈的不懈跟踪。UC的CEO俞永 福就曾经说过:“全球化的进程中,移动互联网企业要做的是全球化思考和本地化执行。在开拓重点区域的市场时,除了要在产品的语言翻译和横向移植上下功夫, 还要充分了解当地的文化。”俞永福的意思实际上就是要充分掌握和分析当地客户行为的特征数据。

在电子商务化已经深入企业的买卖关系之后,企业价值链受到大数据的影响就更加显现出来了。阿里巴巴集团的总参谋长曾 鸣说过:“互联网如果开始继续推动价值链的所有环节,网络和不同的player之间能通过信息实现协同分享的时候,电子商务的威力就会真正发挥出来,而这 当中全链条的价值就会得到再造,同时也是个价值创新的过程。”

生活、工作、思维的颠覆重构

大数据带来了时代的重大转型,这就好比是人们可以通过望远镜感受宇宙,通过显微镜观测生物一般的重大发现。人们的生活和理解世界的方式都正在被大数据所改变,一切的新发明和新服务都来自大数据,还有其他更多的改变也在酝酿中。

2009年一种新型的流感病毒出现,那就是结合了禽流感和猪流感特点的甲型H1N1流感,就在几周的时间里这种病毒 就快速传播开来。由此全世界的公共卫生机构都在担忧可能会有一场致命流行病蔓延开来。不少评论家开始发出警告称有大规模的流感会暴发,他们担心1918年 在西班牙暴发的那场夺走了上千万人性命,且影响了5亿人口的大规模流感的悲剧会再次重演。更为可怕的是,当时没有一个国家已经研发出对抗此类流感的疫苗。 公共卫生专家唯一能做到的就是减缓病毒传播的速度,就算是要做到这一点还需要了解的是这病毒究竟在哪里出现。

和其他的国家一样,美国也要求自己的医生一旦发现新型流感病例要尽快报告疾控中心。可是真正患病的人总是在患病多日 后才会到医院去,因此真正传到疾控中心的信息总需要一定的时间,正是因为这个流感病例的通报总存在一到两周的延后,疾控中心也只能一周汇总一次数据。可是 信息滞后两周对于一种飞速传播的流感来说实在是太可怕了。公共卫生机构因为信息滞后而在暴发流感疫情时总是感觉无所适从。

甲型H1N1流感暴发之前的几周,曾经在《自然》杂志上有一篇互联网巨头谷歌公司工程师发表的论文,很是令人注目。 公共卫生官员们和计算机科学家们为之震惊不已。文章中,将谷歌是如何能预测到这个冬季流感会传播的原因解释得非常清楚,他们认为传播不仅仅是在全美范围 内,还会蔓延到特定的地区和州。通过观察人们在网络上的搜索记录,谷歌完成了这样的预测,这用的是一种以前被忽略过的方法。多年来积累的搜索记录都被谷歌 给保存了下来,几乎每一天都会收到全世界30亿条以上的搜索指令,这么庞大的数据资源足以让谷歌可以选择用这种方法来推断结果。

谷歌公司拿着美国疾控中心2003-2008年间季节性流感传播的数据和美国人频繁检索的5000万条词条做一个对 比,通过人们的搜索记录,谷歌希望以此来判断人们是否患上了流感。除谷歌以外,其他公司也想用其他方式来考证这样的结果,只不过他们不具备谷歌公司那样的 庞大数据以及处理、统计数据的技术。

谷歌公司的员工虽然提出了推测,认为在网络上特定的检索词不过是为了得到关于流感的消息,像是“治疗咳嗽和发热的药 物有哪一些”,可是这并不是找出这些词的重点,甚至连他们自己也不知道最重要的是哪些词条。关键是他们所构建的系统和这些词义中间并没有依赖关系。这个系 统所关注的只有一个,那便是特定检索词条的使用频率和流感时间传播和空间传播的联系。谷歌一共处理了4.5亿个不同的数学模型只为测试这些词条。得出预测 的结论之后,再和2007、2008两年美国疾控中心所记录的实际流感病例数据一比对,就发现居然存在着45条检索词条的组合,而在一个特定的数学模型 上,他们软件所推测出来的结果和官方数据有着97%的相关。他们居然也能很准确地判断出流感是从哪里开始传播的,这和疾控中心的判断非常一致,而且还很及 时,不至于有延误的情况出现。

2009年甲型H1N1流感暴发的时候,谷歌显然要比习惯性滞后的官方数据要更为有效,更为及时。公共卫生机构的官 员因此得到了最有价值的数据信息。谷歌公司做到这一点居然不是通过分发口腔试纸或是联系医生,而是建立在与医学毫无关联的大数据的推测上。大数据可以称作 是现代社会所具备的一种新型能力,用一种前所未有的方式分析海量数据,从而产生巨大的价值或是深刻的见解。可以想见下一次流感来袭时,这样的技术理念和数 据储备会让全球人们拥有更好的预测工具,防止流感的大面积蔓延。

不但是公共卫生领域正在被大数据改变,几乎整个商业领域都在因为大数据而重新整合,譬如航空领域。

2003年,正准备从西雅图飞往洛杉矶去参加弟弟婚礼的奥伦·埃齐奥尼(Oren Etzioni)开始在网上订购机票,他知道越早买价格越便宜,因此几个月前他就在网上订购了一张机票。上了飞机,奥伦·埃齐奥尼非常好奇地向其他乘客询 问购买的价格,当他听到一个比他晚买很多天却价格便宜不少的乘客的话时,感到非常气愤气氛,结果越问就越是发现,很多人的票买得比他便宜。

大多数人或许碰到这样的事情很可能在他走下飞机的那一刻就会忘掉。可是作为美国最知名计算机专家之一的奥伦·埃齐奥尼,从他第一天开始担任华盛顿大学人工智能项目负责人开始,他就创立了很多典型的大数据公司,即便大数据这个概念在那时候还没有兴起。

1994年,在埃齐奥尼的协助下,最早的网络搜索引擎Meta Crawler诞生,后来为Info Space公司所收购。埃齐奥尼还联合创立了第一个比价网站Netbot,随后又被Excite公司所收购。还有路透社收购了他创建的能够在文本中挖掘信 息的Clearforest公司。在埃齐奥尼看来整个世界其实就是一系列的大数据,而自己可以来解决当中所有的问题。埃齐奥尼1986年毕业于哈佛大学, 作为第一届计算机科学专业的毕业生,他所有的精力都花在了如何解决这些问题上。

当飞机着陆,埃齐奥尼决定要开始开发一个新的系统,作为预测网络机票价格的系统。同一航班上的同一座位本来应该有相同的价格,但事实上人们购买它的价格却千差万别,而这当中的理由只有航空公司心里清楚。

埃齐奥尼认为,机票价格的奥秘无需他来解开,他所要做到的就是帮助人们预测未来一段时间机票价格会跌还是会涨,这个想法是可操作的,只不过操作起来还存在一定的困难。很显然,这个系统为人们所展示的是与购买时间无关的特定航线机票的销售价格变化。

一张机票的价格若是呈现下降趋势的话,系统就会提醒顾客可以延缓购票的时间,反过来如果是上升的趋势的话,系统就会 提醒用户当下就要买下机票。总而言之,埃齐奥尼开发了一套针对9000米高空的加强版信息预测系统,事实上这是个庞大的计算机科学项目,而它却是十分可行 的。于是埃齐奥尼着手启动了这个项目。

埃齐奥尼所创立的预测系统,虚拟的乘客可以通过它节省不少经费。41天内12000个价格样本是这个预测系统的数据 基础,而这些数据均来自一个旅游网站。预测系统能做到的是预测会发生什么,至于原因它是无法说明的。换句话说,它所推测的是推动机票价格波动的因素。机票 降价的因素很可能是因为季节原因或是卖不出去等等,还可能是由于“周六晚上不出门”等原因,这些和预测系统都没有关系,它不过是通过数据的分析和统计来预 计未来的趋势。埃齐奥尼总在思考是买还是不买这个问题,为此他还给自己的这个研究项目取了一个非常贴切的名字——哈姆雷特。

这个小小的项目逐渐壮大,成立了一家科技创业公司,还得到了风险投资基金的支持,取名为Farecast。该公司利用对机票价格走势和降价幅度的预测,指导消费者不错过最佳的购买时机,而这些都是消费者此前在其他网站获得不了的信息。

从保障自身透明度的角度来考虑,机票价格走势的预测可信度在这个网站上都可以查到,消费者可以以此进行参考。而海量 的数据正是支撑这个系统运转的基础。为了能让预测更为精准,埃齐奥尼发现了一个行业机票预订数据库。基于美国商业航空产业数据而推测出的结果,几乎每一条 航线上的每一个航班的每一个座位一整年的综合票价记录就是推测的依据。到现在,Farecast所拥有的飞行数据记录已经超过了2000亿条,用这种方 式,消费者利用Farecast省下了不少开支。

埃齐奥尼有着棕色的头发,笑起来常常露出牙齿,无邪的面容,怎么看都不像是那种有魄力让所有航空公司一年损失数百万 潜在收入的人。可是他确实是个目光非常长远的人。埃齐奥尼2008年开始在其他领域应用这项技术,像是预订酒店、二手车买卖等等。尽管所有领域中的差异不 大,但是还是有大幅度的价格差存在,并据此有很多可运用的数据都是这项技术的基础。埃齐奥尼在实现自己计划前,微软公司就与之协商以1.1亿美元收购了他 的公司。此后,Farecast并入了微软的搜索引擎中。

Farecast不过是所有大数据公司的一个小小的代表而已,它呈现出的是当下世界发展的趋势。时间往前推五年到十 年,埃齐奥尼绝对想不到这个。他自己也说过这仿佛是不可能的,只因为那时的计算机处理和存储价格太贵了。这一切发生仰仗技术上的突破,但这并非唯一的原 因,因为还有很多细微的重要改变在发生,尤其是人们有了数据使用的理念。

现在不再有人认定数据是静止的,不过从前收集了数据之后人们就会认定该数据没有价值了,就比方说航班落地之后,票价数据也就用处不大了(对于谷歌来说,检索命令完成以后数据就没有用了)。

因为数据而带来的便利随处可见,现代人人手一部手机,办公桌上均有一台电脑,而在办公室和办公室之间还有大型的局域 网相连。不过,似乎人们还不是太重视信息数据本身的用处。计算机技术在过去的半个世纪已经融入了社会生活的每个角落,信息大爆炸的时代到来还引发了重大的 变革。世界因此有了比以往更多的信息,增长速度也随之加快。信息总量的变革引起了信息形态的变化,换言之就是量变带来了质变。其中首当其冲的如天文学和基 因学,经历了信息爆炸,并因此提出了大数据这个概念。现在所有的领域几乎都有了这个概念的应用。

大数据这个概念并不确切。起初大信息量的处理就是大数据,它一般指的是超过一般电脑处理数据的常用内存量,所以工程 师为大数据而改进了数据处理的工具,新的技术处理方式也因此诞生,譬如有谷歌的MapReduce和开源Hadoop平台(最初源于雅虎)。人们有了这些 技术,能够处理的数据量飞速增加。更为重要的是,数据的排列也不再需要依据传统的数据库表格,很多消除僵化层次结构和一致性的技术也在这个时候应运而生。 与此同时,互联网公司还因此收集了大量充满价值的数据,并且在这些数据利用上发现了强烈的利益驱动力,而互联网公司也成了信息数据处理技术的领头羊,这一 切很顺理成章。它们的发展让它们成了新技术的领衔者,甚至超过了有几十年经验的线下公司的发展。

现在最可能的一种方式就是人们认定以大数据为基础能做到很多事情,而这一切在以往的小数据时代是几乎完成不了的。人们通过大数据来获知新知识,且创造新的价值,同时大数据也改变了市场和组织机构,包括政府和公民的关系。



来源:我是码农,转载请保留出处和链接!

本文链接:http://www.54manong.com/?id=1098

大数据技术与应用  

微信号:qq444848023    QQ号:444848023

加入【我是码农】QQ群:864689844(加群验证:我是码农)

<< 上一篇 下一篇 >>

网站分类

标签列表

最近发表

全站首页 | 数据结构 | 区块链| 大数据 | 机器学习 | 物联网和云计算 | 面试笔试

本站资源大部分来自互联网,版权归原作者所有!