《大数据时代》读后感
  一、《大数据时代》作者简介:本书作者维克托·迈尔·舍恩伯格,现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人、哈佛国家电子商务研究中网络监管项目负责人,并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授,“大数据时代的预言家”,最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一,具有很强的技术权威,被誉为“大数据商业应用第一人”。他花十余年潜心研究数据科学,提出只要知道“是什么”,而不需要知道“为什么”,这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战,开启了一次重大的时代转型。本书的译者周涛是电子科技大学互联网科学中心主任、教师、博士生导师,发表了SCI论文150余篇,领域一流期刊90余篇。
  二、《大数据时代》内容简介:本书分为引言、第一部分大数据时代的思维变革第二部分大数据时代的商业变革第三部分大数据时代的管理变革结语 已经发生的未来等五个部分十个章节。作者认为大数据的核心就是预测。这个核心代表着我们分析信息时的三个转变:第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某
个特别现象相关的所有数据,而不再依赖于随机采样;第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度;第三个转变因前两个转变而促成,即我们不再热衷于寻因果关系。大数据将为人类生活创造前所未有的可量化维度,已经成为新发明和新服务的源泉,更多的改变正蓄势待发。
        周涛在序中,对全书内容做一个简要概述,“首先,作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果;接着,从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后,作者冷静描绘了大数据帝国前夜的脆弱与不安,包括产业生态环境、数据安全隐私、信息公正公开等问题”。
  在文中,作者前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,讲述了大数据时代的思维变革、商业变革和管理变革。《大数据时代》上过《纽约时报》、《华尔街日报》的专栏封面,进入美国白宫网的新闻,并频繁出现在互联网、移动互联网、电商、电信、金融等领域的大佬们的话语中,是国外大数据研究的先河之作。书中展示了谷歌、微软、亚马逊、IBM、苹果、Facebook、Twitter、VISA等大数据先锋们具有价值的应用案例。
三、大数据概念:指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据预测的原理:貌似这部分是最吸引我的,我之前一直认为“数据挖掘是挖到了事件的原因,能够很理性的解释为什么会发生这样的事情”,后来发现,大数据预测只是基于已有数据的推测,得到未来可能发生的事件。说来说去大数据挖掘根本不需要知道 原因,只需要知道可能发生什么就行。这就是相关关系。
大数据处理的对象:大量数据,数量扩大到把以前【采样分析方法】的抽样数据数量扩展到所有数据。与采样数据最大的区别是不用那么规整的数据,不用那么精准的数据,不用每条数据包含的信息都完全一样。也就是说乱七八糟的数据,无序的数据都可以被大数据技术利用
大数据发展的核心动力来源于人类测量、记录和分析世界的渴望,人们一直以为,信息技术的变革重点在“T”(技术)上,而不是在“I”(信息,)上,而大数据思维者认为,是时候
把聚光灯打向“I”,开始关注信息本身。
四、读后感:
1. 专家评论。
⑴我们生活在社会中,就不得不同数据打交道。我们也是数据的一部分,不论我们想不想与大数据牵扯到一起,数据都会到我们,覆盖我们。大数据时代已经来临,如何从海量数据中发现知识,寻隐藏在大数据中的模式、趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,都需要我们拥有更好的数据洞察力。——沈浩(中国传媒大学教授)
大数据时代的商业变革分为内容数据化、数据价值实现、数据公司类型三部分。本人认为随着信息技术的变革,我们将文字、方位、沟通甚至是世间万物都变成数据,然后通过数据的再利用、重组、扩展等实现价值,创造大数据公司。同时,根据所提供价值的数据本身、技能和思维三种不同来源,分别出现了基于这三种来源的互联网公司,而谷歌、亚马逊等则是包含三者,全面发展的大数据公司。
我的大学读后感
⑵随着大数据热潮的不断升温,相信今后几年会有更多以大数据为主题的著作问世。这本先河之作用各种案例生动阐述了大数据所带来的变革。你可以不同意书中的某些观点,但是大数据所带来的变革已经开始发生并将继续深入。我们需要共同面临的挑战是:越来越大的数据如何才能让世界变得越来越美丽?——汪小帆(上海交通大学长江学者特聘教授,致远学院常务副院长)
本人认为大数据带来的风险主要包括个人生活的监视、隐私的泄露、预测惩罚以及数据独裁,对此,通过一定的管理变革,比如个人隐私保护从个人许可到让数据使用者承担责任,预测分析并不决定个人动因及相应惩罚,避免数据独裁而培养大数据算法师以及反数据垄断大亨等,来限制大数据的发展不超过我们可以控制的范围。
早在互联网大咖们都在谈论着大数据时,阿里巴巴的前CEO马云提出大数据时代 改变才是未来物联网的本质,首先必须是一个智联网。核心的不是物,核心的是连,更核心的是把这个连起来以后,能够把它变成智能化。
2.阅读前后的感受。大数据拉近了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。
“大数据”现在已经是一个被处处滥用的词汇,但是有多少人真正明白它蕴含的意义?虽然它是一个名词,但是却包括了互联网时代的一种新的技术手段、工作方式和思维模式。当年即成为百万级超级畅销书。全书对大数据革命的前因后果、优势劣势、具体应用和前景展望都给出了详实可靠的回答。大数据的到来,像镜子一样反映出科技的变革直接影响到社会发展:史上首次,我们有能力收集存储巨量信息,以一种快捷简单又低成本的方式。这在以前根本不可想象。这样的转变,宣告人类有能力从浩如烟海的数据中提取出精准的信息,而不再被传统的取样方法所限制,或者只能采用自己都不太相信的大致估计。 “大数据”一词可以说是随处可见,获得了商业、学术甚至政府的高度关注
这本书之前,一直觉得大数据,大数据挖掘,不过就是从大量的采样数据中抽象出一些模模糊糊的因果关系,用来说明某些数据的变化并预测某些情景可能发生。这些我自认为的理解一定存在理解错误和自我臆断的情况。传统的解决问题做法:大数据的思路是回溯式的,我们先收集数据,然后通过分析数据出现了哪些模式来得到结论,最后再去探究背后原因所在。
  读书之后,对大数据这个概念有了一些的概念,总的来说,这是一本科普类休闲书籍,没
有过多的专业术语和大量的推论,适合想要了解大数据的读者入门。正如该书作者所述,“当我们谈到大数据,此处‘大’更像是一个相对说法,指的是数据集本身的复杂庞大。”相较于以前对数据的片段化处理,现在我们希望囊入分析过程的数据越多越好,最终把整片森林尽握掌中,而非仅仅其中几十棵树!个人觉得,大数据时代可以称之为第四次技术革命。而数据将成为战略资源,数据的争夺势必取代能源,成为今后各个国家争夺的重要资源。正如马云所说,“数据是国家和企业的‘核武器’。谁掌握了数据,谁将引领未来。
3.文章观点。
(1)舍恩伯格分三部分来讨论大数据。在第一部分"大数据时代的思维变革"中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据二、更杂:不是精确性,而是混杂性三、更好:不是因果关系,而是相关关系。三点思维上的转变是大数据思维的基础,也是最重要的部分,只有接受并理解了这种大数据理念,才能在此基础上合理利用大数据。
对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高
的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
    第二个观点中,作者本身也承认 “错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在”。那大数据的特征究竟是精确性还是混杂性?那么,大数据的品质如何控制:首先,本身就不要求精确,但是不精确到何种程度是需要定义的,否则就乱套了,换个角度,如果定义了容错度,那符合条件的都是精确的(或者说我这句话还是停留在小数据时代?这里的逻辑我没有理顺)。就像品质管理大师克劳斯比提出过零缺陷理论,我一直觉得是一个伪命题,缺陷是一定存在的,就看如何界定了;其次,大量非结构化数据的处理,譬如说对新闻的量化、情感的分析,目前对非SQL的应用还有巨大的进步空间。
对于第三个观点,我认为人类都在对因果关系中存在,如果放弃对它的追求,也就放弃了自身最优秀的品质:意志力。很多人不愿意相信算命是担心一旦知道了命运,就无法再去奋斗。即使我相信算命,也在探求相关关系中的因果要素。我放弃第一份工作的原因之一是厌倦了如此确定的明天:一个任务发出去,大概能预测到哪些环节会出问题,只要不去 追逐,这些环节经常会出问题。
(2)大数据与电子商务
电子商务本质上是一种销售模式,与线下相比它具有更容易获取消费者数据、商品数据的特点,天猫双十一那天,就有2.13亿独立用户访问,超过1亿笔订单,191亿销售额,这些数据并不只是衡量网站当日的销售情况之后就可以功成身退,而是可以通过用户的购物以及其他行为,分析用户喜好,实现个性化页面展示和推荐,提高广告转化率。同时,类似京东商城等自建物流的B2C电子商务网站,通过相应的大数据分析,有利于合理安排仓库库存,调配物流路线,在效率提高和成本节约上发挥重要作用。     
书中举到的很有意思的一个例子是,亚马逊从一开始就已从每个客户身上捕捉了大量的数据,比如他们购买了什么数据?哪些书他们只浏览却没有买?他们浏览了多久?哪些书是
他们一起买的?通过数据分析发现,喜欢海明威作品的客户许多也喜欢菲茨杰拉德的书,所以,亚马逊总会将向浏览会购买海明威作品的客户推荐菲茨杰拉德的书,从而增加了销量。如今,据说亚马逊销售额的三分之一都是来自它的个性化推荐系统。可见,大数据创造了一种新的销售模式,主动引导用户增加购买。同时,对电子商务企业来说,对大数据的充分利用,就可以探索进行个人化、个性化、精确化和智能化地进行广告推送和产品推广,有利于进行更便捷的用户调研,更精准的产品营销,以及更完善的售后监测。