登陆注册
16592500000023

第23章 有趣的大数据运用(1)

大数据下的地震预测

实现准确预测需要一些真实的因素。我们必须掌握足够多的历史数据来识别模式——与这些模式相关的事件必须始终发生。

而且我们必须有区分疑似事件和真实事件的能力,即众所周知的排除误报。但是,仅仅是准确预测还远远不够。要让预测派上用场,我们还必须具备根据预测及早并快速采取行动的能力。

比如,当地震真正发生的时候,相关数据会非常清晰地表现出来,例如地动山摇。而且一旦其威力够大的话,停电、爆炸、有毒气体溢出、火灾爆发都可能出现。当然,到那个时候,也就不再需要大量的计算机和天才科学家们来预测灾祸了。

所以数据要起到效用,当下的数据必须预先与过去的数据进行匹配,而且要给我们留下足够多的行动时间。如果在地震发生的前几秒才完成匹配的话,也就没什么作用了。我们需要足够多的时间得出结论、调动各方资助力量并疏散群众。而且,我们必须具备快速分析数据的能力,只有这样,数据分析才能发挥效用。试想一下,假如我们拥有足够多的数据,它们能让我们提前一天预测到地震的发生,而我们却花费了两天时间进行数据分析,那这些数据和我们的预测结果就起不到什么作用了。

因此,从本质上来说,准确预测地震既是大数据的机遇又是挑战。单纯拥有数据还远远不够。我们既要掌握足够多的相关数据,又要具备快速分析并处理这些数据的能力,只有这样,我们才能争取到足够多的行动时间。越是即将逼近的事情,越需要我们快速地实现准确预测。不过,在某种程度上,这种预测适用于收益递减规律。就算我们能在瞬间完成对预测地震所需的海量数据的分析处理,如果没有留下足够的时间将群众调离危险区域,这种分析就没什么意义。

2012年10月22日,6名工程师因为在预测地震时误导村民,均被判处有期徒刑6年。这次地震发生在2009年的意大利拉奎拉镇,300名村民因此丧生。那么,大数据能帮助地质学家实现更好地预测吗?

每年,世界各地约有7000次里氏4.0或更高级别的地震发生。

地震测量有两种,一是著名的里氏震级,二是更现代的矩震级。

前者是依据地震所含的能量定级,而后者是通过地震所释放的能量认定地震等级。预测地震的时候,有三个关键问题必须找到答案:何时、何地、何种震级?

在《庸医游戏》中马修·玛贝认为,虽然地震有预兆,但是我们仍然无法通过预兆可靠、有效地预测地震。相反,我们能做的就是尽可能地为地震做好准备——它的发生频率远比我们想象的要大得多。这些准备包括在设计、修建桥梁和其他建筑的时候就把地震考虑在内,并且准备好齐全的地震应急包,一旦发生大地震,这些基础设施和群众都能有更充足的准备。

我们知道,地震是由构造板块相互挤压造成的——构造板块则是偶尔会漂移的陆地板块。这种板块挤压发生在地球深处,而且各个板块的相互运动复杂难懂。因此,有用的地震数据来之不易,而要弄明白是什么地质运动导致了地震,基本上是不现实的。

归根结底,准确地预测地震,即回答何时、何地、何种震级这三个问题,需要掌握促使地震发生的不同自然因素,以及揭示它们之间复杂的相互运动的更多、更好的数据。

大数据的关键之处正在于此:预测不同于预报。科学家能预报地震,但是他们无法预测地震。1906年旧金山发生地震,导致3000余人伤亡,而其何时会再次遭遇这样的地震?其实,科学家们只能预报某个地方、某个具体的时间段内发生某级地震的可能性。例如,他们只能说未来30年,旧金山湾有80%的可能性会发生里氏8.4级地震,但他们无法完全确定地说出何时何地会发生地震,或者发生几级地震。这就是预测和预报之间的差异。

不过,虽然准确预测地震还有很长的路要走,但是黑暗中尚有一线光明,那就是,科学家已经越来越多地为地震受害者争取到几秒钟的时间了。

传统的地震探测仪需要花费3000美元甚至更多,而如今基本的地震探测只需通过连接至标配计算机的廉价的探测仪就可实现,甚至只需通过使用如今很多移动设备内置的动作感应功能就可实现,而这些功能原本是为了导航和游戏设计的。

斯坦福大学的“地震捕捉者网络”由参与分布式地震检测网络的大约200个志愿者的计算机组成。有时候,这个监测网络能提前10秒钟提醒可能会受灾的人群。也许10秒钟看上去不长,但是却很重要,因为这意味着你是搭乘运行的电梯还是走楼梯,是走到开阔处去还是躲到桌子下面。

“地震捕捉者网络”就是一个会生成大量数据的廉价监测网络的典型例子。以前,要捕捉和存储如此多的数据耗资巨大,但是,近期的技术进步使得这些数据的捕捉和存储成本大大降低。

有时候甚至比过去便宜了9成都不止。

是什么方便了我们的出行

10年前,大学生吴中亚第一次来到北京旅游。他带着激动的心情,打算参观故宫、天坛、颐和园、圆明园和众多的博物馆。

不幸的是,下火车后他和同伴走散了。两个人都没有手机,没法联系上,钱也在同伴身上,吴中亚傻眼了。同伴对北京很熟悉,所以此前吴中亚根本没做什么准备,他是想一路和同伴一起的。

现在,他要一个人到他们定好的旅馆与同伴会合。该怎么办呢?

他一个人很费劲地研究着地铁线路,好半天之后,他放弃了,决定还是问路。北京的大爷大妈们很热情地给吴中亚指路,“你往东走200米,在那个胡同那儿往南拐,再乘坐……”“你往北走,那边有一个天桥,你走到天桥北边然后往西,再坐……”吴中亚从来都不知道东南西北,面对各位大爷大妈的热情和不一致的指导,吴中亚还是不知道该怎么办。最后,吴中亚在报刊亭买了份地图,终于解决了问题。

地图真是一种非常有用的东西。吴中亚在地图上查看了公交和地铁的线路,顺利地找到了旅馆。地图上,每条地铁线路的颜色都各不相同,还可以在上面看到线路交叉的站点,如此一来,要知道在哪里换乘,就很容易了。可以说,就因为一份地图,弄清楚怎么走路突然之间变成了一件轻而易举的事情。

10年后,吴中亚再次到北京旅游。马虎的他出行前又没怎么规划,这次他有了经验,一下火车就买了份地图。他在地图上找了很久,还是没找到他要去的那个地方在哪里。没办法,他直接叫了一辆出租车。出租车司机是个新手,碰巧吴中亚要去的那个地方他完全没听说过。吴中亚一听急了,准备下车,司机却毫不着急,让他稍等。然后,司机不慌不忙地从口袋里拿出手机,依次打开了GPS定位功能和电子地图软件,将吴中亚要去的地方输入软件里,软件很快生成了一条线路,然后司机很顺利地根据线路开到了目的地。

吴中亚的这两次经历,告诉了我们什么呢?

第一次经历,吴中亚开始虽然有大爷大妈给他指路,却还是怎么都搞不清楚路线,后来借助一份地图就搞清楚了。因为大爷大妈非常口语化和个性化的指路,对于置身陌生城市的吴中亚来说,还是很难量化成具体线路,而地图犹如一份完整的有关公交、地铁、建筑的数据,有着非常精细的描绘和统一的量化标准。只要弄清楚地图是怎么查看的,吴中亚找到旅馆的可能性就大了很多。可是,为什么第二次经历,吴中亚还是拿着那份地图,却找不到位置了?因为随着中国各地经济建设的迅猛发展,各个城市的面貌在迅速发生着变化,地名也一样。可能一夜之间,很多老地方、老店铺消失了,很多新地标、新建筑诞生了,而地图的发行从勘察到印制要经历很多个环节,这些环节让地图永远跟不上城市的变化。而出租车司机使用的地图完全不一样,它是互联网地图。互联网地图具有实时性,哪个地方的线路和地名有了变化,网络地图上就可以直接呈现出来。

现在,出门前和路途中的人们问路越来越少,很多人都直接通过手机地图查询到目的地的线路。而且,手机地图已经越来越超出传统地图的功能定义。比如百度地图,既具有查地点路线、卫星导航等几乎“不值得一提”的常规功能,更具有一些超乎想象的便利功能,比如百度地图可以告诉你附近哪里有公厕、快餐、自助取款机和加油站,可以告诉你离你300米的某个商场正在举行一场女装三折特卖、楼下的餐厅在搞中餐六折大促销、1000米远的写字楼里有家公司在招聘员工、楼上有一套房子在招租、某某街道刚发生车祸并有某帅哥在现场发回的照片等等。细加辨别,不难发现,百度地图有个非常重要的特质就是:百度是在做一个微地图,以满足用户方方面面的需求,包括各种生活细节的服务。从总体功能上看,百度地图不再着眼于地图线路及覆盖范围,更不是侧重于导航,而是用大数据来支撑细分的本地生活服务。

电子地图相对于传统地图最大的优势是什么呢?答案自然是大数据。大数据是手机地图的绝对优势,数据量的大小直接决定了地图的详细程度和能够提供服务的多少。而且,电子处理的是全互联网数据。截至2014年12月,百度地图仅以导航为例,每天数十亿次用户的定位请求和响应转换成位置信息,实现了智能导航基础上的生活服务本地化。作为最具优势的主流生活服务平台,百度地图已容纳60余家数据合作伙伴,提供500多万生活服务类数据,日均定位请求超过35亿次。在此背后,除了预订酒店、电影票、餐馆之外,还包括附近的团购、优惠、外卖等,用户都能通过手机完成。

像百度地图这样借大数据为用户提供便利的软件还有很多,这些都是大数据时代给个人带来的便利。人们将各种新的信息发布到各个大数据平台上,而更多的人在分享着这些数据带来的便利。大数据时代,每个人都在创造着数据,每个人都在享受着大数据创造出的便利。

大数据帮了******

大数据看似枯燥无味,但很多时候,它会成为赢得一场“战争”最有力的武器。

2012年,美国总统******仰仗其大数据分析团队,击败竞争对手成功连任。好奇的人们想知道,到底大数据在选战里起到了怎样的作用?

在这次总统大选前,******能不能赢得连任充满变数。

从政绩上来看,******并没有做到之前承诺的将美国全国的失业率控制在7.4%以下;从选战的过程来看,竞争对手罗姆尼比******口才好,演讲水平也相当高超,公开辩论中,两个人不分上下;从对民众要求变革的呼应来看,临选前的民意调查,多数被调查者认为罗姆尼关于未来的见解更令人欣赏;从历来决定胜负的竞选资金投入来看,对手所花的费用比******多1亿美元。

这一切都说明,******要继续留在白宫似乎非常困难。但出人意料的是,******还是赢了罗姆尼。

后来人们普遍认为,让******赢得选举不是靠运气,而是仰仗他的竞选团队成效卓著的数据分析能力。******团队的竞选总指挥吉姆·梅西纳表示,在整个竞选过程中,******的每次活动都是以数据作为支撑,而对多种来源的数据进行搜集、整理、分析和运用,确保了以数据为基础的决策。

收集大量数据的工作是******团队在连任竞选两年前进行的,他们将民主党零散的选民数据汇总在一起。在考量了重要性和费用支出的前提下,******团队的数据专家们针对目标选民和拟开展的活动开发了不同的预测和分析模型。如对每一个群体的选民都进行建模,进而预测他们的政治意向。所建立的模型可以根据实际情况进行动态调整,这样提高了分析的精准性。当时,数据分析专家在俄亥俄州获得了约2.9万人的投票倾向数据,这是一个巨大的样本,占选民的1%。这个数据样本可以准确了解每一类人群和每一个地区选民在任何时刻的态度。******团队的一名成员表示,他们可以通过复杂的数学建模来找到目标选民。当第一次电视辩论结束后,选民的投票倾向会发生改变,团队通过相关数据分析就可以立即知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。在竞选过程中,他们筛选出目标选民并和他们接触,定向地说服他们,无疑这样的筛选就离不开数据的支持。

在连任竞选中,******团队充分信任数据分析,恰到好处地利用各种场合来争取选民。在每一次动员活动和公开辩论前,******团队都能根据受众的特点选取其最关心的议题,精心准备、博得支持。动员渠道和互动方式的选择也为目标选民量身定做。

同类推荐
  • 经济学的诡计大全集

    经济学的诡计大全集

    本书分为九大编,分别介绍了消费、生产、职场、理财、爱情、婚姻等方面与经济活动相关的内容,既新颖有趣,又能启发读者思考,引人入胜。我们力求让读者认识到经济学“诡”计多端的一面,从容看清商家使用的花招,以及经济学到底在我们身边布下了什么迷阵,到底生活中都隐藏了哪些秘密。到底工作中又有哪些不为人知的故事。同时通过日常生活中的常见例子,来介绍经济学的基本知识,并且让读者把经济学的智慧运用到生活和工作中去,让你既能在精神上得到知识的愉悦,在诡计、陷阱和谎言背后读懂经济学,更能学会在工作和生活中以经济学家特有的”法眼”识破一切机关,从而避开陷阱,有效地保护自身的利益。
  • 高盛阴谋

    高盛阴谋

    迪拜泡沫、希腊混乱、欧元危机……谁是这一连串事件的真正操控者?高盛!谁又能想到,这场连环局的终极目标,居然是中国!从北高加索到北非,从南北战争到2010年的希腊危机,作者用大量的事实、生动的中国黑话诠释了高盛这个金融危机中的最大赢家!高盛“欺诈门”事件震惊全球,一夜之间,股市、期货纷纷暴跌。高盛的能量到底有多大?美国证监会能否一查到底?这是否只美国政府和高盛合演的“双簧戏”?干掉贝尔斯登、雷曼、AIG、迪拜、希腊之后,谁将是高盛的下一个猎物?
  • 未来十年

    未来十年

    本书由中国证监会研究中心携手中国金融领域著名专家共同推出。邓小平预言,中国经济的崛起需要两个30年。我们正站在前30年的终点,后30年的起点,处于新的转型阶段。中国的经济总量排名全球第二位,已成为经济大国,但不是经济强国。中国经济正在经历前所未有的挑战,在增长、通胀和转型三个鸡蛋上跳舞,其中最具挑战的方式还是中国经济的转型,这是中国经济能否穿越围城,经济持续发展是否存在可行性的核心问题。
  • 现状·问题·对策:庆阳市“三农”问题研究

    现状·问题·对策:庆阳市“三农”问题研究

    本书包括十个专题:农村组织制度建设、农村市场制度建设、农业结构调整、规模经营与农业现代化、农业产业化及农业社会化服务等。
  • 云端经济学

    云端经济学

    作为商业传播领域的资深职业经理人,作者常年在各个城市上空往来穿梭,养成了在飞机上思考和写作的习惯。多年积累便有了这本8000米高空的经济学随笔。作者认为,方法论要比观点更重要!这本书所做的是引导思考,作者希望通过这种方式,帮助我们打破思维的墙,不固守成规,在云时代有效地助推经济发展。
热门推荐
  • 腹黑王爷得娇妻

    腹黑王爷得娇妻

    你说啥?肖千落和完颜拓真心相爱?!肖千落童鞋表示,传闻啥的不可信啊……他们若是真心相爱,肖千落童鞋认为,这肯定是她上辈子踩死了许多蚂蚁而导致的……【剧情一】她捏捏他的脸“你脸皮可不可以不要这么厚?”他煞有其事地点点头“恩……前几天有点瘦,这段时间又多长了点肉,脸皮自然也跟着厚了……不过还行……再补点估计赶得上城墙倒拐了”她气结。【剧情二】“你怎么会喜欢上那家伙?”他问“因为几年前我不正常呗……”她笑“那你怎么会喜欢上我?”她笑“因为我想变正常啊……”他抬眸“你还能正常么”她无语凝噎
  • 快穿今天又要哄男朋友了

    快穿今天又要哄男朋友了

    男孩子是要宠的,不怕男孩太傲娇,一宠就是小棉袄
  • 对的时间对的华晨宇

    对的时间对的华晨宇

    认识他,似乎是在很久之前,那个时候的我还是单纯的,懵懵懂懂的,对这个世界友好和热爱,那个时候,身边的一切喧嚣繁华都与他无关,在那个时候,我也懂得明星和我是两个世界的人
  • 凭什么我们要错过!

    凭什么我们要错过!

    【明明你也很爱我,没理由爱不到结果,只要你敢不懦弱,凭什么我们要错过】颜清秋以为自己可以感动陆文生,直到有一天,陆文生带初恋登堂入室,颜清秋的梦醒了!“清秋,我们离婚吧,我要娶凌曼。”“好。”她没有拖泥带水,迅速离开。他却后悔了,重新出现在她的面前,恳求她,“清秋,你回来吧,我才发现我爱的人其实一直都是你!”
  • 艾滋病特定高危人群的研究

    艾滋病特定高危人群的研究

    本书从艾滋病疫情分析入手,概要介绍了国内外艾滋病流行现状、主要高危人群情况、国家艾滋病防治策略、国际艾滋病防治策略新动态等。同时结合同性恋(MSM人群中的一个主要群体)形成的历史与现状,解析了同性恋何以成为艾滋病的高危人群,该人群HIV流行特点与感染艾滋病的特点,以及与HIV感染相关的最新生物学研究进展。本书还对在同性恋人群中开展流行病学调查研究和高危行为干预的方法以及效果进行了分析,介绍了在同性恋人群中开展艾滋病防治工作的社区经验,从理论到实践,综合全面地介绍了与MSM人群艾滋病防治相关的知识、经验,为深入开展科学研究以及现场防治工作提供了有益的借鉴。
  • 这个故事有点烂

    这个故事有点烂

    在这一个修仙者为天的世界里,强者为王弱者只有被蹂躏的份,我们来看主角是如何在这样的世界里“起舞”的
  • 没有色彩的年华

    没有色彩的年华

    本文以唯美、忧伤相结合的文字描写,讲述90后主人公若知经历了一次突如其来的沉重打击后的生活,带着对未来美好的憧憬和向往,拥有着善良、感恩、又仍然相信美好的他,勇敢地和死神作战,却仍然感觉不到太多的意义,直到遇到一个女孩,他才重新感受到了快乐和生活的意义,但是命运似乎不肯放过他,不允许他拥有正常人所拥有的东西。
  • 天道修行

    天道修行

    陷入泥潭中……
  • 潇洒过活

    潇洒过活

    一个来自21世纪的普通大学生,竟然奇迹般的穿越到古代?本来无心这里的一切,只想笑看古今,无奈自己却越陷越深。
  • 华尔街女神

    华尔街女神

    伊莎贝尔是一位独立勇敢的华尔街明星,三十多岁的她拥有一间上西区漂亮公寓、三个健康的孩子、帅气的老公和一份高薪而忙碌的工作。在这一切光鲜的外表下,她的现实生活却是另外一番景象:她的交易部门工作环境就像是1980年代的兄弟会聚会现场,被男性统治在手中;她的丈夫一直觉得自己在被雇主压榨,每日怨气冲天;大部分的育儿工作和家务活都落在她已不堪重负的肩膀上。贝尔的前未婚夫亨利的出现让一切仿佛出现转机。虽然她从未完全原谅过亨利,然而“对冲基金大亨”的名声让亨利在贝尔眼中仿佛熠熠生辉,并且他成了她最大的客户。同时,贝尔办公室中遭遇过性骚扰的女人们开始采取行动改善他们的工作环境,组建了一个叫“玻璃天花板俱乐部”的神秘组织。这个组织的目的,是让粗鲁而不平等的办公室文化变得温和,每个人的工作都得到公平的回报。自始至终,贝尔都有察觉到金融市场即将迎来一次历史性的崩溃,由此许多事情将发生变化:她的婚姻、她的职业生涯,她的整个世界都将不同。