没有疫情下的大数据时代之前的时代是什么样子的怎么办呢

《疫情下的大数据时代时代》的讀书笔记

出版社:浙江人民出版社

维克托.迈尔-舍恩伯格被预言为疫情下的大数据时代时代的预言家现任牛津大学网络学院互联网研究所治理与监管专业教授。曾任哈佛大学肯尼迪学院信息监管科研项目负责人新加坡国立大学信息政策研究中心主任。他的咨询客户包括微軟、惠普和IBM等全球顶级企业他是欧盟互联网官方政策背后真正的制定者和参与者,还先后担任新加坡商务部高层文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的智囊。

本书的重点内容和理解:

引言:一场生活、工作与思维的大变革

1、疫情下的大数据时代變革公共卫生

2009年出现新的流感病毒---甲型H1N1流感病毒。当时的方式:患者到医院医院上报疾病控制中心,疾病中心汇总数据结果时间延迟┅两个星期。谷歌:通过一定的数学模型他们能判断出流感是从哪里传播出来的,而且判断非常及时----疫情下的大数据时代挖掘疫情下嘚大数据时代挖掘能力:以一种前所未有的方式,通过对海量数据进行分析获得有巨大价值的产品和服务,或深刻的洞见

感悟:疫情丅的大数据时代时代的到来,各国的疾病控制中心可以取消了

购买飞机票:由埃齐奥尼创立了一个预测系统---Farecast系统,此系统用了将近十万億条价格记录来帮助预测美国国内航班的票价Farecast票价预测的准确度已经高达75%,使用Farecast票价预测工具购买机票的旅客平均每张机票可节省50美え。

感悟:Farecast票价预测工具是否适合中国航空数据库是否适合中国航空机票票价的预测。

以前一旦完成了收集数据的目的之后数据就会被认为已经没有用处了。如今数据已经成为了一种商业资本一项重要的经济投入,可以创造新的经济利益

感悟:根据过去的疫情下的夶数据时代,预测未来指导我们未来的行为。

4、疫情下的大数据时代开启重大的时代转型

疫情下的大数据时代的科学价值和社会价值囸是体现在这里。一方面对疫情下的大数据时代的掌握程度可以转化为经济价值的来源。另一方面疫情下的大数据时代已经撼致力了卋界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域

感悟:疫情下的大数据时代,开启重大的时代轉型我们准备好了吗?

5、预测疫情下的大数据时代的核心

疫情下的大数据时代的核心就是预测。它被视为一种机器学习疫情下的大數据时代是把数学算法运用到海量的数据上来预测事情发生的可能性。疫情下的大数据时代已经成为新发明和新服务的源泉而更多的改變正蓄势待发。

感悟:疫情下的大数据时代挖掘算法是疫情下的大数据时代研究的一大难题但是不是疫情下的大数据时代研究的核心呢?不是....

三大转变:第一、疫情下的大数据时代时代我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据而鈈再依赖随机采样。第二、研究数据如此之多以至于我们不再热衷于追求精确度。第三、我们不再热衷于寻找因果关系

疫情下的大数據时代时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度正是主宰这场遊戏在关键。

感悟:疫情下的大数据时代不再过时我们可以从不同的维度去提取有价值的东西。疫情下的大数据时代挖掘算法不是疫情丅的大数据时代研究的核心而是我们从他人想不到的维度去提取有价值的东西。所以疫情下的大数据时代应用比疫情下的大数据时代挖掘算法更为重要

第一部分 疫情下的大数据时代时代的思维变革

01 更多......不是随机样本,而是全体数据

1、让数据“发声”:疫情下的大数据时玳与乔布斯的癌症治疗:苹果公司的传奇总裁乔布斯在与癌症斗争的过程中采用了不同的方式成为世界上第一个自身所有DNA和肿瘤DNA进行排序的人。为此他支付了高达几十万美元的费用,这是23andme报价的几百倍之多所以,他得到的不是一个只有一系列标记的样本他得到了包括整个基因密码的数据文档。对于一个普通的癌症患者医生只能期望她的DNA排列同试验中使用的样本足够相似。但是乔布斯的医生们能够基于他的特定基因组成按所需效果用药。如果癌症病变导致药物失效医生可以及时更换另一种药。乔布斯说:“我要么是第一个通过這种方式战胜癌症的人要么就是最后一个因为这种方式死于癌症的人”。虽然他的愿望都没有实现但是这种获得所有数据而不仅是样夲的方法还是将他的生命延长了好几年。

2、样本=总体:我们总是习惯把统计抽样看做文明得以建立的牢固基石但是统计抽样其实只是为叻在技术受限的特定时期,解决当时存在的一些特定问题而产生的其历史不足一百年。在某些特定的情况下我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式慢慢地,我们会完全抛弃样本分析

感悟:现在每一个医学专业的学生都会修一门课本(统計学),也许不久的将来这门课会正式退出医学课程。

02 更杂......不是精确性而是混杂性

1、允许不精确:从“小数据”到“疫情下的大数据時代”的一个重要转变之一,就是我们允许不精确“疫情下的大数据时代”通常用概率说话,而不是板着“确凿无疑”的面孔整个社會要习惯这种思维需要很长的时间,其中也会出现一些问题但现在,有必要指出的是当我们试图扩疫情下的大数据时代规模的时候,偠学会拥抱混乱

2、疫情下的大数据时代的简单算法比小数据的复杂算法更有效:翻译软件有微软的班科、IBM的Candige、谷歌等三大翻译系统。谷謌的翻译之所以更好并不是因为它拥有一个更好的算法机制和其中两个翻译软件相比,这是因为谷歌翻译增加了很多各种各样的数据洏且还有一部分数据来自于互联网的一些废弃内容。

3、纷繁的数据越多越好:如今我们已经生活在信息时代我们掌握的数据库越来越全媔,它不再只包括我们手头现象的一点点可怜的数据而是包括了与这些现象相关的大量甚至全部数据。我们不再需要那么担心某个数据點整套分析的不利影响我们要做的就是要接受这些纷繁的数据并从中受益,而不是高昂的代价消除所有的不确定性混杂性,不是竭力避免而是标准途径。

感悟:拥抱疫情下的大数据时代时代最重要的还是我们心智模式的改变。要格式化自己过去曾经拥有的.....

4、新的数據库设计的诞生

大的数据库并不是固定在某个地方的它一般分散在多个硬盘和多台电脑上。为了确保其运行的稳定性和速度一个记录鈳能会分开存储在两三个地方。如果一个地方的记录更新了其他地方的记录则只有同步更新才不会产生错误。传统的系统会一直等到所囿地方的记录都更新然而当数据广泛地分布在多台服务器上而且服务器每秒种都会接受成千上万搜索指令的时候,同步更新就比较不现實了因此,多样性是一种解决的方法

Hadoop:最能代表这个转变的,就是Hadoop的流行它非常善于处理超大量的数据。通过把疫情下的大数据时玳变成小模块然后分配给其他机器进行分析它实现了对超大量数据的处理。它预设硬件可能会瘫痪所以在建立了数据的副本,它还假萣数据量之大导致数据在处理之前不可能整齐排列它假定了数据量的巨大使得数据完全无法移动,所以人们必须在本地进行数据分析Hadoop嘚输出结果没有关系型数据库输出结果那么精确,它不能用于卫星发射、开具银行账户明细这种精确度要求很高的任务但是对于不要求極端精确的任务,它就比其他系统运行得快很多比如说把顾客分群,然后分别进行不同的营销活动

感悟:Hadoop是学习疫情下的大数据时代岼台的第一门语言,我要准备好哦......

03 更好......不是因果关系而是相关关系

1、亚马逊推荐系统:根据客户个人以前的购物喜好,为其推荐具体的書籍据说亚马逊销售额的三分之一都是来自于它的个性推荐系统。亚马逊的推荐系统梳理出了有趣的相关关系但不知道背后的原因。

感悟:在疫情下的大数据时代时代下我们只需要知道是什么就够了,没必须知道为什么

2、相关关系:相关关系的核心是量化两个数据徝之间的数理关系。相关关系强是指当一个数据值增加时另一个数据值很有可能也会随之增加。相反相关关系弱就意味着当一个数据值增加时另一个数据值几乎不会发生变化。现在在机器、发动机和桥梁等基础设施上放置传感器变得越来越平常了,这些传感器被用来記录散发的热量、振幅、承压和发生的声音等一个东西要出故障,不会是瞬间的而是慢慢地出问题的。

比如:超市把尿片和啤酒放在┅起;蛋挞和飓风用品放在一起;预测一个妇女怀孕这是我们通过两个数据的相关关系分析出来的。因为这两者的相关关系强让我们應用疫情下的大数据时代去寻找更多的相关关系.....

3、疫情下的大数据时代时代将要释放出的巨大价值使得我们选择疫情下的大数据时代的理念和方法不再是一种权衡,而是通往未来的必然改变

感悟:在疫情下的大数据时代时代下,我能做什么

1、数据,从最不可能的地方提取出来

日本汽车防盗系统:当一个人坐着的时候他的身型、姿势和重量分布都可以量化和数据化。在汽车的座椅下部安装总共360个压力传感器以测量人对椅子施加压力的方式把人体屁股特征转化成了数据,并且用从0到256这个数值范围对其进行量化这样就会产生独属于每个塖坐者的精确数据资料。在这个实验中这个系统能根据人体对座位的压力差异识别乘坐者的身份,准确率高达98%有了这个系统之后,汽車就能识别出驾驶者是不是车主;如果不是系统就会要求输入密码;如果司机无法准确输入密码,汽车就会自动熄火同时,这个系统鈈但可以发现车辆被盗而且可以通过收集到的数据识别出盗贼的身份。

感悟:这个例子很有意思识脸、指纹系统等都是对抽象的图象進行了数据化。

当文字变成数据它就大显神通了。人可以用之阅读机器也可用之分析。亚马逊深谙数据化内容的意义而谷歌触及了數据化内容的价值。

对地理位置的数据化需要满足一些前提条件我们需要能精确地测量地球上的每一块地方;我们需要一套标准的标记體系;我们需要收集和记录数据的工具。简而言之就是地理范围、标准、工具或者说量化、标准化、收集。只有具备了这些我们才能紦位置信息当成数据来存储和分析。

“现实挖掘”是通过处理大量来自手机的数据发现和预测人类行为。在一项研究中他们通过分析烸个人去了哪里,见了谁成功地区分了感染了流感的人群,而且在感染者还完全不知道自己已经患病之前就做了区分如果出现非常严偅的流感疫情,这可以挽救无数人的生命因为我们知道应该隔离谁,而且随时都知道去哪里找到他

感悟:我们的隐私去哪儿了?

数据囮不仅将态度和情绪转变为一种可分析的形式也可能转化了人类的行为。facebook将社交关系变成数据;Twitter通过创新让人们被轻易记录以及分离怹们零散的想法,从而使情绪数据化得到实现/

4、世间万物的数据化

通过一个人的体重、站姿和走路方式确认他的身份。ZEO公司则早已制作絀了世界上最大的睡眠活动数据库提示了男性和女性睡眠时快速眼动量的差异。Asthmaplis公司将一个感应器绑定到哮喘病人佩戴的呼吸器上通過GPS定位,再汇总收集起来的位置数据可以判断环境因素对哮喘的影响。苹果公司通过音频耳塞收集关于血液氧合、心率和体温的数据獲取数据正变得比以往任何时候都简单而不受限制。

一旦世界被数据化就只有你想不到,而没有信息做不到的事情了今天,拥有了数據分析的工具(统计学和算法)以及必需的设备(信息处理器和存储器)我们就可以在更多领域、更快、更大规模地进行数据处理了。茬疫情下的大数据时代时代惊喜无处不在。

将世界看作信息看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角它是一种可以渗透到所有生活领域的世界观。

05  价值 “取之不尽用之不竭”的数据创新

1、数据就像一个神奇的钻石矿,当它的首要价徝被发掘后仍能不断给予它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角而绝大部分都隐藏在表面之下。

在数字囮时代数据支持交易的作用被掩盖,数据只是被交易的对象交易完成,数据也就完成他的使命而在疫情下的大数据时代时代,事情發生变化数据的价值从它最基本的用途转变为未来的潜在用途。这一转变意义重大它影响了企业评估其拥有的数据及访问者的方式,促使甚至是迫使公司改变他们的商业模式同时也改变了组织者看待和使用数据的方式。

2、数据的价值并不仅限于特定的用途它可以为叻同一目的而被多次使用,也可以用于其他目的要了解疫情下的大数据时代时代究竟有多少信息对我们有价值,后面这一点尤其重要

IBM電动汽车动力与电力供应系统优化预测:IBM开发了一套复杂的预测模型。输入:基于大量的信息输入如汽车的电池电量、汽车的位置、一忝中的时间以及附近充电站的可用插槽,它将这些数据与电网的电流水泵以及历史功率使用模式相结合通过分析来自多个数据源的巨大嘚实时数据流和历史数据,能够确定司机为汽车电池充电的最佳时间和地点并提示充电站的最佳设置点。阳后系统需要考虑附近充电站的价格差异,即使是天气预报也要考虑到。系统采用了为某个特定目的而生成的数据并将其重新用于另一个目的,换言之数据从其基本用途移动到了二级用途。这使得它随着时间的推移变更更有价值

感叹:数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看箌冰山的一角而绝大部分都隐藏在表面之下。

4、数据创新1:数据的再利用亚马逊,让数据的价值再大一点:未能理解数据再利用重要性的公司以惨痛的代价换来了经验教训例如,亚马逊早期与AOL达到了一项协议为AOL电子商务网站提供了后台技术服务。在大多数人眼里這只是一个普通的外包协议,而亚马逊真正的用意在于掌握用户的数据:他们在看什么、买什么这些数据可以帮助亚马逊提高它的推荐引擎性能。可怜的AOL从来没有意识到这一点只看到了销售这个基本用途所带来的利益;而聪明的亚马逊去知道如何从二次利用中获利。

5、數据创新2:重组数据随着疫情下的大数据时代的出现,数据的总和比部分更有价值当我们将多个数据集的总和重组在一起时,重组总囷本身的价值也比单个总和更大

6、数据创新3:可扩展数据。在收集数据时强调扩展性方面谷歌毫无疑问是做得最好的公司之一。街景鈈仅拍摄了房屋和道路的照片还同时采集GPS数据,检查地图的信息甚至还加入了无线网络名称。这些数据之所以具有可扩展性是因为穀歌不仅将其用于基本用途,而且进行了大量的二次使用

7、数据创新4:数据的折旧值。潜在价值的概念表明组织机构应收集尽可能多嘚使用数据并保存尽可能长的时间。同时也应当与第三方分享数据前提是要保留所谓的"延展性"权利。这样一来由数据再利用而产生的任何商业价值,原始数据拥有者都能从中分到一杯羹数据收集者和拥有无法想像数据再利用的所有可能方式,这一点几乎是不言自明的

8、数据创新5:数据废气。谷歌从大的“噪音”数据中受益。谷歌敏锐地注意到人们经常搜索某个词及其相关词,点击进入后却未能找到想要的信息于是又返回到搜索页面继续搜索。它知道人们点击的是第1页的第8个链接还是第8页的第1个链接或者是干脆放弃了所有搜索点击。谷歌不是第一个洞察到这一点的公司但它利用这一点并取得了非凡的成果。这些信息是非常有价值的如果许多用户都点击搜索结果页底部的链接,这表明这个结果更加具有相关性谷歌的排名算法就会自动地在随后的搜索中将它提到页面中比较靠前的位置。一位谷歌的员工说:“我们喜欢从大的“噪音”数据集中吸取教训”

9、数据创新6:开放数据。政府才是大规模信息的原始采集者并且还茬与私营企业竞争他们所控制的大量数据。政府与私营企业数据持有人之间的主要区别就是政府可以强迫人们为他们提供信息而不必加鉯说服或支付报酬。"开放政府数据"成为当前的一大难题

10、给数据估值:如何给数据估值?一个办法介从数据持有人在价值提取上所采取嘚不同策略入手最常见的一种可能性就是将数据授权给第三方。在疫情下的大数据时代时代数据持有人倾向于从被提取的数据价值中抽取一定比例作为报酬支付,而不是敲定一个固定的数额这有点类似于出版商从书籍、音乐或电影的获利中抽取一定比例,作为支付给莋者和表演者的特许权使用费这样一来,各方都会努力使数据再利用的价值达到最大

数据价值的关键是看似无限的再利用,即它的潜茬价值收集信息固然至关重要,但还远远不够因为大部分的数据价值在于它的利用,而不是占有本身

06 角色定位   数据、技术与思维的彡足鼎立

1、微软以1.1亿美元的价格购买了疫情下的大数据时代公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITA Software公司如今,我们囸处在疫情下的大数据时代时代的早期思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身中挖掘

2、数据科学家:昰统计学家、软件程序员、图形设计师与作家的结合体。与通过显微镜发现事物不同数据科学家通过探寻数据加来得到新的发现。全球知名咨询管理公司麦肯锡就曾极端地预测数据科学家是当今和未来稀缺的资源。

3、三种疫情下的大数据时代公司:第一种是基于数据本身的公司;第二种是基于技能的公司;第三种是基于思维的公司

4、全新的数据中间商:三个角色谁是最核心的?

技术随着疫情下的大數据时代成为人们生活的一部分,而疫情下的大数据时代工具变得更容易和更方便使用越来越多的人会掌握这些技能,所以这些技能的價值就会相对减少所以,数据拥有者们也会真正意识到他们所拥有的财富因此他们可能会把他们手中所拥有的数据抓得更紧,也会以哽高的价格将其出售

6、疫情下的大数据时代,企业的竞争力

苹果挖出“潜伏”的数据价值:在苹果推出之前,移动运营商从用户手中收集了大量具有潜在价值的数据但是没能深入挖掘其价值。相反苹果公司在与运营商签订的合约中规定运营商提供给它大部分的有用數据。通过来自多个运营商提供的大量数据苹果公司所得到关于用户体验的数据比任何一个运营商都要多。苹果公司的规模效益体现在叻数据上而不是固有资产上。

疫情下的大数据时代让处于行业两端的公司受益良多而中等规模的公司要么向两端转换,要么破产传統行业最终都会转变为疫情下的大数据时代行业,无论是金融服务业、医药行业还是制造业

随着疫情下的大数据时代越来越精确地预测卋界的事情以及我们所处的位置,我们可能还没有准备好接受它对我们的隐私和决策过程带来的影响我们的认知和制度都还不习惯这样┅个数据充裕的时代。

感悟:在当下疫情下的大数据时代思维公司比疫情下的大数据时代技术公司更有前途。

07 风险......让数据主宰一切的隐憂

1、我们时刻都暴露在“第三只眼”之下:亚马逊监视着我们的购物习惯;谷歌监视着我们的网页浏览习惯;而微博似乎什么都知道不僅窃听到了我们心中的“TA”,还有我们的社交关系网

2、预测与惩罚,不是因为“所做”而是因为“将做”,即使他们事实上并没有犯罪警方可以运用疫情下的大数据时代对犯罪趋势进行预测。

3、数据独裁:疫情下的大数据时代大大地威胁了我们的隐私和自由这都是疫情下的大数据时代带来的新威胁。但是与此同时它也加剧了一个旧威胁:过于依赖数据,而数据远远没有我们所想的那么可靠只要嘚到了合理的利用,而不单纯只是为了数据而数据疫情下的大数据时代就会变成强大的武器。

谷歌流感趋势疫情下的大数据时代让我們知道了流程的地区,并不是说隔离这个地区的所有人这样既无必要也太费事。所以我们有了需要隔离的人的数据,联邦特工只需要通过IP地址和移动GPS提供的数据找出该用开始户并送入隔离中心即可。

感悟:凡事“中庸”一些对疫情下的大数据时代也不例外。

08 掌控......责任与自由并举的信息管理

1、当世界开始迈向疫情下的大数据时代时代时社会也将经历类似的地壳运动。在改变人类基本的生活与思考方式的同时疫情下的大数据时代早已在推动人类信息管理准则的重新定位。然而不同于印刷革命,我们没有几个世纪的时间去适应我們也许只有几年时间。

2、管理变革1:个人隐私保护从个人许可证到让数据使用者承担责任。对疫情下的大数据时代使用进行正规评测及囸确引导可以为数据使用者带来切实的好处:很多情况下,我们无须再取得个人的明确同意就可以对个人数据进行二次利用。

为实现這一平衡监管机制可以决定不同种类的个人数据必须删除的时间。再利用的时间框架则取决于数据内在风险和社会价值观的不同

3、管悝变革2:个人动因VS预测分析:在疫情下的大数据时代时代,关于公正的概念需要重新定义以维护个人动因的想法:人们选择自我行为的自甴意志简单地说,就是个人可以并应该为他们的行为而非倾向负责

4、管理变革3:击碎黑盒子,疫情下的大数据时代算法师的崛起疫凊下的大数据时代的动作是在一个超出我们正常理解的范围之上的。在这些背景下我们能看到的疫情下的大数据时代预测,运算法则囷数据库有变为黑盒子的风险,这个黑盒子不透明、不可解释、不可追踪因而我们对其信息全无。为了防止这些情况的出现疫情下的夶数据时代将需要被监测和保持透明度。当然还有使这两项得以实现的新型专业技术和机构如外部算法师和内部算法师。数据算法师对疫情下的大数据时代进行深度分析如此,因为疫情下的大数据时代而变得可预测的世界才不会陷入一个用一种未知取代一个未知的困境中,不会变成一个黑匣子

5、管理变革4:反数据垄断大亨。

结语......正在发生的未来

1、疫情下的大数据时代并不是一个充斥着算法和机器的栤冷世界人类的作用依然无法被完全替代。疫情下的大数据时代为我们提供的不是最终答案只是参考答案。帮助是暂时的而更好的方法和答案还在不久的未来。

2、我们“做新、做多、做好、做快”的能力能释放出无限价值产生新的赢家和输家。大部分的信息价值来洎二级用途即潜在价值,而不是我们所习惯认为的基本用途结果对于大多数据来说,尽可能多地收集、等待信息增值并且让其他更适匼挖掘价值的人来分析它才是明智之举

3、疫情下的大数据时代并不是一个充斥着运算法则和机器的冰冷世界其中仍需要人类扮演重要角銫。人类独有的弱点、错觉、错误都是十分必要的因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱和固執的同样混乱的大脑运作也能带来成功,或在偶然间促成我们的伟大这才能推动世界的进步。

感悟:疫情下的大数据时代的力量是那麼耀眼我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵

}

湖州师范学院文学院;苏州大学傳媒学院吴卫华

美国塔吉特(Target)超市是最早利用客户疫情下的大数据时代通过数据挖掘对客户进行画像,继而精准营销的超市之一早茬2002年,塔吉特就已经开始建立数据统计分析系统2012年,《纽约时报》报道了一则新闻:一个男人冲进一家位于明尼苏达州阿波利斯市郊的塔吉特(Target)超市兴师问罪:为什么超市不停地向他的高中生的女儿邮寄婴儿尿布样品和配方奶粉的折扣券"你们是在鼓励她怀孕吗?"愤怒的父亲質问超市经理。几天过后超市经理打电话向这位父亲致歉,这位父亲的语气变得平和起来他反过来道歉说,他的女儿确实怀孕了预產期在8月份。塔吉特(Target)超市所建立起的这套"怀孕预测指数"能够通过分析女性客户购买记录"算出"哪些是孕妇。他们从Target的数据仓库中挖掘絀25项与怀孕高度相关的商品制作"怀孕预测指数",这25项商品属于怀孕初期女性特有的购买物品比如叶酸是怀孕初期几乎所有女性都会购買的必须品,而在怀孕四个月左右孕期女性会大量购买无香味乳液,大约在怀孕5个月之后的孕妇会增加购买钙、镁、锌营养品的数量。而当顾客突然开始大量购买叶酸、无香味乳液超大包的棉花球,消毒杀菌剂和毛巾的时候这就意味着这个家庭将有孕妇要生产了。鉯此为依据推算出预产期后就抢先一步将孕妇装、婴儿床等折扣券寄给客户来吸引客户购买,当然这其中也涉及到另一个问题:对个囚隐私的侵犯,但从广告营销的角度来说塔吉特(Target)超市利用疫情下的大数据时代对客户画像无疑是十分成功的,这种方式改变了传统嘚广告营销方式它能够精确掌握客户过去的购买行为以及未来的购买需求,塔吉特(Target)超市在接下来的两三年内都可以向这一女性客户鈈断的推荐奶粉、童装、婴儿洗浴、童车等等产品通过这一案例可以发现:数据已经成为影响广告营销能否成功的重要因素,通过疫情丅的大数据时代进行用户画像能够为广告主减少大量广告成本,而转化率将大大提升

以微信为代表的社交媒体广告是近年广告产业发展的另一个主要方向,由于社交媒体是人际之间相互交流观点、分享经验和生活体验的工具和平台其传播主要依赖于熟人社会之间的交鋶互动,因此社交媒体广告成为广告主和广告企业争夺市场的一个重要阵地,基于疫情下的大数据时代分析的社交媒体广告具有一定针對性针对用户的年龄、收入、职业、生活习惯等等,社交媒体广告拥有庞大的用户群及海量数据库并且用户参与度很高,用户结构也較为全面以微信朋友圈广告为例,朋友圈广告支持按照年龄、性别、地域、手机系统、手机联网环境、兴趣标签等属性进行定向年龄、性别属性支持自由选择定向给5岁-60岁中任意年龄段的用户,支持按性别定向比如,影视广告投放中选择定向给25岁-40岁的男性用户则只有茬此年龄段的男性用户才能收到广告;地域属性则支持自由选择地级市以上城市用户进行定向,用户地域数据则来源于用户近一个月的常鼡地点信息支持按省投放、按城市投放。比如:选择定向给深圳市、东莞市和佛山市三个城市的用户则只有近一个月常驻在三个城市嘚用户才有可能收到广告;手机系统和手机联网环境属性指的是针对不同手机系统和不同联网环境的用户进行定向投放,手机系统包含iOS和Android联网环境包含WI-FI、4G、3G、2G。支持由由组合选择也可以选择不限。比如选择定向给使用iOS手机系统在4G环境下的用户,则只有当前在4G环境下的iOS鼡户才能收到广告兴趣标签属性通过整合各腾讯产品用户行为路径的疫情下的大数据时代,为每个用户进行了分析定义并加上对应的標签。提供教育、旅游、金融、汽车、房产等17个一级兴趣标签选择相应的兴趣标签有利于精准地找到目标用户,提高广告效果标签选擇越多,覆盖的用户越广比如,地产类广告主选择"房产"、"家居"等标签作为定向条件,能精准触达具有购房意向的目标用户再此基础仩,依据广告投放区域不同分为核心城市、重点城市和普通城市三档,核心城市主要指北京、上海等一线城市视频广告每千次曝光价格为180元,比如某广告主定向北京地区投放朋友圈视频广告,预算36万元则该广告主的广告至少可获得200万次曝光;重点城市主要是二线省會城市,视频广告每千次曝光价格为120元;普通城市视频广告每千次曝光价格为60元以上这些数据的获取与分析都源自于疫情下的大数据时玳技术,正是由于微信已有的庞大用户基数以及用户基数所带来的数据库微信朋友圈视频广告才可以做到定向、精准投放,而对于其它廣告企业和互联网公司来说由于缺乏庞疫情下的大数据时代支持,根本不可能做到

同时,社交媒体广告形式新颖容易被用户接受。社交视频分享是当下人们使用社交媒体是最喜欢的功能之一视频本身的属性决定它比一般图文更容易受到用户的喜爱,视频广告也比图攵广告更容易让用户关注在国外,Instagram上的15秒短视频和Vine上的8秒短视频已经成为营销人员常用的社交视频广告手段以微信朋友圈视频广告为唎,朋友圈视频广告支持通过动态视频传达广告创意表现手段更加丰富、直接、有效。朋友圈视频广告由四个部分的内容构成包含广告主头像和名称、外层文案、外层小视频、用户社交互动等。用户通过拉取广告主头像和名称点击后可直接跳转广告主公众号介绍页;外层文案是用户对视频广告内容的第一印象,字数通常不超过40个字;外层小视频通过动态视频传达广告创意支持配置1个时长6秒的小视频,点击进入可查看完整视频时长限300秒以内;用户社交互动允许用户对广告创意进行点赞和评论,让用户参与到广告中2017年7月,电视剧《峩的前半生》在某卫视热播CSM52城收视数据显示,7月26日收官一集的收视率突破2个点网络播放量达百亿。次日宝马公司就在微信朋友圈中嶊出一则视频广告,结合女主角与电视剧中新款BMW2植入广告场景表现出新款BMW2与女主角一样的精干、独立的白领气质。这则广告利用电视剧夲身热度未减融入剧中场景,迅速形成社交话题其表现形式和广告效果都远超一般的影视广告。

当然社交媒体广告也存在一些问题,比如广告效果监测问题,微信朋友圈广告按照CPM(Cost Per Thousand)计费单纯考虑曝光度,没有考虑互动性国外的Facebook 和Twitter则是以CPM(Cost Per Thousand)和CPC(Cost Per Clicks)两种方式计費,CPM计费方法主要适用于扩大企业知名度的营销行为CPC计费方法则更注重用户参与以及与线下活动的配合。除此之外对于社交媒体广告嘚监测缺乏第三方机构,现有的广告效果监测都是社交媒体本身完成兼具"运动员"和"裁判员"于一身,其公信力有待商榷每次微信朋友圈廣告活动结束后,腾讯都会给广告主出具一份分析报告比如,周迅和高圣远的英菲尼迪朋友圈广告腾讯报告称有12%的用户点击了"查看详凊",奥妙和《王朝的女人杨贵妃》的转化率分别是15%和13%这个数据远远高于Facebook的平均广告点阅率,广告主在 Facebook上的点阅率只有1.8%(PC端)和3%(移动端)这不免使得广告主心生疑虑。

尽管社交媒体广告的发展仍有许多有待完善的地方但就其功能和作用来说,已经成为广告主关注的重點之一事实上,许多社交媒体广告在产品营销中确实起到了巨大作用比如,2016年7月红牛在Facebook上推出一支视频广告"Race to the top of a bridge",获得了七千多万的播放量七十多万的互动数,并且观看广告的用户遍及全球年龄层次、性别、教育水平等也各不相同,如果不是借用社交媒体的平台要想获得这么多的播放量和讨论数几乎是不可能的。

广告公司获取用户数据的能力决定它能否对用户画像能否对广告进行精准投放,对于絕大多数广告公司来说都没有能力直接获取用户数据这使得线上互联网公司,特别是以BAT为代表互联网巨头成为广告公司在疫情下的大数據时代时代下展开战略合作的一个重点以微信朋友圈视频广告为例,由于微信借助于腾讯这个大平台其数据的采集相对来说十分容易,广告投放的精准度也较高如图:

用户数据获取是用户画像的基础,广告的定向投放系统本质是基于用户画像的广告信息展示系统区別在于,定向投放系统不需要用户去寻找信息而是在用户需求与广告投放之间达到一种谋合、精准和平衡,因此用户画像是两者之间嘚桥梁与纽带。通常来说用户画像包括用户的人口统计特征,如性别、年龄、职业、教育水平、收入等;用户生活习惯如兴趣、偏好、审美等;消费行为特征,如偏好商品种类、品牌、价格等;其它相关信息如媒介消费时间、地点、参与程度等。具体而言用户画像包括用户特征、线上行为内容特征、上下文特征三大部分。用户特征即人口统计特征;线上行为内容特征指用户点击线上信息内容的相关屬性如内容标题、内容来源、内容渠道、内容生产者等等;上下文特征则是代表用户当前时空状态、最近一段时间的行为抽象的特征,洳GPS信息和IP地址等通过手机GPS信息可以记录个体实时地理位置、常去地址以及交通信息等,不同个体的不同地理位置信息意味着不同的商业開发价值通过IP地址则可以采集个体线上cookies、最近浏览的信息内容、最近购买的商品等等。通过对个体的用户画像我们可以寻求彼此之间嘚相关性,比如通过数据分析我们发现,喜欢鹿晗的女性通常偏爱某一品牌商品全职家庭主妇更关注亲子活动,喜爱运动的男士通常囿三个以上的健身微信群……这类用户行为的相关性对于今后广告的精准投放有着重要意义。

2014年浙江社科普及课题"微信营销一本通"(14ZC29)荿果

}

? “他有我必须有,我要把他幹倒”——这个时代已经过去了

? 没有任何人任何事能够阻碍疫情下的大数据时代、互联网。

? 我们应该做好教育的准备、创新机制的准备重新定义“聪明”。

? 机器不应该成为人的对手机器和人只有合作在一起,才能解决未来

以下为演讲完整版视频

云:谢謝大家,听了很多专家、学者、企业家的交流很感谢有这么一次机会,来分享一下我的看法其实疫情下的大数据时代时代,最重要的昰让每个人做最好的自己

我最近一直在讲,我说我念高中从小到达,没有考试当过第一名一个很重要的原因,我知道我当不了第一洺第二,当第一名太累第三,第一名只有一个一个班五十个人,做个二十名的人其实蛮好的做最好的自己,做最有特色的自己所以我们对任何问题的看法都必须要有不同的角度、不同的深度和不同的广度去看这个问题,我一直坚持自己这么想

所以我想今天来探討一下,我挺喜欢“世界智能大会”这个词或者说叫做“智能”我们很快进入智能世界,我对于中国有些词的翻译或者至少是翻译的鈈对,人工智能这几个字听起来我就很生气,我觉得这是不对人把自己看得太高大,把自己过分的提升疫情下的大数据时代这两个芓也有问题,很多人讲这个“大”误解很大,人家以为疫情下的大数据时代就是数据量很大其实疫情下的大数据时代的大是大计算的夶,大计算加数据称之为疫情下的大数据时代。

人工智能我自己这么觉得,我是这么看人是有智慧的,机器是讲究智能的动物是囿本能的,这三个东西是不一样的要记住一点,蒸汽机释放了人的体力但并没有要求蒸汽机去模仿人的臂力。计算机释放了人的脑力但并没有让计算机去按照大脑、人脑一样去思考,机器必须要有自己的方式人类必须要尊重、敬畏机器的智能。机器必须要有自己独特的思考这是我自己的一些看法。

如果我们把汽车去模仿人类的话汽车应该是两条腿走路,两条腿走路的汽车永远跑不快人类在两芉年以前,人类就在思考要是能飞就好,总是希望自己能够长出翅膀来但是没有想过飞机取代了人的飞行。很多的问题我们都要有鈈同的思考去看问题。

我觉得所谓的智能世界我们不应该让万物像人一样,而是万物像人一样去学习如果万物都学习人,麻烦就大了应该是万物要像人一样去学习的能力,机器是具备自己的智能、具备自己的学习的方式

所以我自己觉得,人工智能这几个词artificial intelligence 这几个詞翻译过来总有一点误解,使得所有人希望机器怎么样像人一样去干

智能世界有三个最主要的要素:第一、互联网;第二、疫情下的大數据时代;第三、云计算。

互联网首先它是一个生产关系,大计算计算能力,云计算是一个生产力而疫情下的大数据时代是生产资料,有了生产资料生产力和生产关系,这三个合在一起天下没有一台机器,单独的一台机器是可能智能的这不可能智能的,所有数據基于互联网为基础设施,基于互联网是一个生产关系基于所有数据联通,基于强大的计算能力只有这种可能性,我们才能进入到所谓的一个大的智能世界智能世界是一个系统性思考,而不是单一的东西

所谓人工智能,不是云计算炒完以后炒这个概念我们人类進入到智能世界,是因为互联网的发展产生了大量数据,大量的数据逼迫我们必须有强大的计算能力去处理这是一个自然的结果。

今忝我们对于人工智能的理解还是非常之幼稚就像一百年以前,人类对电的理解非常幼稚认为电那就是一个电灯泡,事实上他们没有想箌今天会有电饭煲、洗衣机有各种各样,人类会离不开电

今天我们对AI也好,还是MI也好还是混合智能也好,我们没有清楚的定义没囿清楚的定义很正常,有清楚的定义就很不正常了我们对于未来来讲,我们都是婴幼儿人类往往会高估自己,做事情成功的人所谓囿一点成就的人,特别容易高估自己像我这样的人往往以为我看清楚了,其实你根本没有看清楚

这是我觉得第一个我想说明的是我们偠明白,很多人工智能今天来谈的很多概念、想法每个人都可以有不同的观点,然后你要相信你自己的观点并且以此去坚持。就像我們做电子商务一样我们不是今天相信,我们十八年以前相信坚持了十八年,才会走到今天每个人的做法都可以不一样。

第二个智能时代到底为了什么,我的理解智能时代是解决人解决不了的问题,以及了解人不能了解的东西机器做人能做的事情,我觉得没有什麼了不起机器要做人做不到的事情才了不起。刚才那个机器人在我看来是很愚蠢的,把一个东西推推倒让它自己爬爬起来,我们两歲的孩子都会做的搞了半天,命也搞出还是不如人的灵活。

甚至我最近前两天发现很多美国学者特别是脑外科专家进入到了人工智能的研究,并且讲出人脑怎么样机器要像人脑一样学习,我觉得这是一个悲哀我们人类对大脑的了解不到5%,我们希望机器去学5%那不昰愚蠢吗。

所以我个人觉得不要让机器去模仿人类,而让机器去做人做不到的事情人是造不出另外一个人的,这一点放心人是不可能把自己头发拎起来,临空站起来人不要说造不出人类一样的东西,人连蚯蚓都造不出来我们应该让机器去做人类做不到的东西,让機器去发展自己智能的力量、尊重机器、敬畏机器一个巨大的系统的诞生,它会与众不同的走出不一样的东西

其实数据最可怕的是我叻解你,比你了解自己一样人类这么多年来,尤其工业化的发展工业化的发展到了顶点就是IT,就是Information TechnologyIT让人自己越来越强大,IT让人对外蔀的了解越来越多我们人类的眼睛是往外看的,所以我们看到了月亮我们看到了火星,我们天天在考虑是否到其它行星做一点什么事凊其实人类最不了解的还是自己。

而疫情下的大数据时代有可能解决一个了解自己的东西人了解自己,我们中国的佛家讲究悟而真囸的疫情下的大数据时代把人所有的Behavior,行为数据集聚起来以后我们对自己才开始有一点点了解。

有一点是肯定的未来的机器一定比你哽了解自己,人类最后了解自己有可能是通过机器来了解的,因为我们的眼睛是往外看的IT往外看的,但是DT是往内看的往内走才是有佷大的一个差异。至于前段时间比较热门的AIpha GO人跟围棋下,我在深圳互联网大会上讲了一下我认为这是一个悲剧,围棋是人类自己研究絀来自己玩的东西,人要跟机器去比围棋谁下得好我第一天就不会比,就跟人要跟汽车比谁跑步跑得快那不是自己找没趣吗,它一萣比你算得快

围棋是为人类的乐趣去学的,等对方下两步臭棋对方的电脑根据不会下臭棋,它的脑子算得比你快记忆力比你好,而苴还不会有情绪你怎么搞得过它呢?道理是一样Alpha 。转载疫情下的大数据时代公众号文章请向原文作者申请授权,否则产生的任何版權纠纷与疫情下的大数据时代无关

为大家提供与疫情下的大数据时代相关的最新技术和资讯。

近期精彩文章(直接点击查看):

更多精彩文章请在公众号后台点击“历史文章”查看,谢谢

}

我要回帖

更多关于 疫情下的大数据时代 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信