大数据怎么学习大数据和数据挖掘的区别推荐几本入门书

扫一扫下载手机客户端
扫描我,关注团购信息,享更多优惠
||网络安全
| | | | | | | | | | | | | | | |
||电子电工
汽车交通| | | | | | | | | |
||投资理财
| | | | | | | | | | | | | | | | |
| | | | | | |
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
||外语考试
| | | | | | | | |
| 视频教程|
大数据书籍&&&& 所谓大数据处理技术是指从各种各样类型的数据中,快速获得有价值信息的能力。本专区为从事大数据管理和处理分析人员以及对大数据时代感兴趣的人员,推荐关于大数据处理分析技术的书籍,包括大数据分析处理、数据挖掘入门、数据管理等大数据热门畅销经典书籍。&&&& 其中包括涂子沛编著的《大数据》、(美)拉贾拉曼(anand rajaraman)和(美)厄尔曼(jeffrey david ullman)共同编著的《大数据:互联网大规模数据挖掘与分布式处理》等经典畅销热门数据处理分析书籍。&&
数据分析特价图书推荐
【市场价】¥139【PUB价】¥55.6 【市场价】¥59【PUB价】¥44.25 【市场价】¥59【PUB价】¥44.25 【市场价】¥68【PUB价】¥61.2 【市场价】¥20【PUB价】¥18 【市场价】¥49【PUB价】¥37.73 【市场价】¥49.8【PUB价】¥37.35 【市场价】¥79【PUB价】¥59.25 【市场价】¥45【PUB价】¥33.75
数据分析经典图书推荐
【市场价】¥69【PUB价】¥51.75
【市场价】¥35【PUB价】¥30.8
【市场价】¥88【PUB价】¥66
【市场价】¥45【PUB价】¥33.75
【市场价】¥32【PUB价】¥24
【市场价】¥49【PUB价】¥36.75
【市场价】¥59【PUB价】¥44.25
【市场价】¥59【PUB价】¥44.25
【市场价】¥78【PUB价】¥58.5
【市场价】¥139【PUB价】¥122.32
数据分析最新图书推荐
【市场价】¥79【PUB价】¥67.94 【市场价】¥58【PUB价】¥46.4 【市场价】¥59【PUB价】¥51.92 【市场价】¥69【PUB价】¥51.75 【市场价】¥49【PUB价】¥38.22 【市场价】¥56【PUB价】¥43.12 【市场价】¥59【PUB价】¥44.25 【市场价】¥79【PUB价】¥59.25 【市场价】¥45【PUB价】¥36 【市场价】¥49【PUB价】¥36.75
数据分析推荐资讯
? ? ? ? ? ? ? ? ? ?
计算机精彩资讯
? ? ? ? ? ? ? ? ? ?
计算机最新资讯
? ? ? ? ? ? ? ? ? ?
订单处理配送
北京奥维博世图书发行有限公司 china-pub,All Rights Reserved后使用快捷导航没有帐号?
查看: 2292|回复: 7
大数据方面书籍推荐
高级会员, 积分 971, 距离下一级还需 29 积分
论坛徽章:13
本帖最后由 许熙平 于
11:41 编辑
大数据现在正在被称为一个时代的标志,了解和学习大数据,要从理念上彻底转变,彻底理解大数据思维,并渗透到血液和骨髓中,换句话说,你的世界观要彻底转变!而要实现这个转变,必须经过初级、中级和高级三个阶段的学习。以下是这三个阶段大数据方面的书籍推荐。初级阶段:《大数据时代》作者:[英]维克托·迈尔-舍恩伯格,[英]肯尼思·库克耶,翻译:盛杨燕,周涛不用说了,肯定是这本书。读完这本书,要求你形成大数据的概念,即知道这么几点:1、绝不是有很多数据就叫大数据;2、大数据是一种数据分析方式,与传统数据分析方式有着本质上的不同;3、大数据的特点是“关注相关性,不关注因果”,这是大数据最核心的东西,一定要真正理解,并牢牢记住,不然你就很容易被别人忽悠;4、大数据采用的是统计的方法;5、大数据主要是结合进行机器的自动数据挖掘;6、大数据主要是用来作预测的。而不是象一般的数据分析,只是分析出历史情况和现状,未来还是要靠人去预测,大数据则是直接告诉你未来的结果。中级阶段:《失控》作者:凯文·凯利(KEVIN KELLY),很多人都亲切地叫他KK,翻译:东西文库为什么是这本书呢?学完初级阶段要记住的几件事还没忘吧?对,用统计的方法,而不是因果的方法,预测未来。在对预测机制进行剖析的时候,法默最喜欢用这个例子来进行说明:「来,接着!」他说着就朝你扔过来一个棒球。你抓住了球。「你知道你是怎么接住这个球的吗?」,他问道。「通过预测。」用f=ma(公式)来预测,或者说线性预测,就是通过因果推理来进行预测,即根据球的质量、加速度等等因素,找出这个球为什么会从那个地方飞到这个地方的原因;而“归纳”即是“统计”的意思,或者说是较粗略的统计,归纳是不问原因的,接住这个球就完了,管它是什么原因。你想成为大数据高手,你想用统计的方法来对某些东西进行预测? 好了,现在你来告诉我,还有什么理由不去好好读这本书?高级阶段:《复杂性》作者:[美]尼古拉斯·雷舍尔(NICHOLAS RESCHER),翻译:吴彤学完中级阶段,你接触到了一件事,“复杂性”,知道了事情复杂到一定程度,就不可能用寻找因果的方法去进行预测。那么到底什么是复杂性,它的本质和原理是什么?想成为大数据高手,你不能对此一无所知,因为你将一辈子与复杂甚至是极其复杂的事情打交道。推荐这本书还有个原因。大家都知道大数据是研究数据的相关性,即找出数据之间的关系。当我经历了15年统计学人工智能数据相关性的探索和研究,感觉已经研究得差不多了,但又觉得要解决所有的问题还有不小的距离,这时就感到很迷茫,不知下一步的研究该往何方去,有种路越走越窄的感觉,又有一种达到顶峰的幻觉,直到看到这本书中的一句话:“可以考虑它们的关系,再考虑这些关系中的关系,如此下去。”大家千万不要小看这句话中的“如此下去”几个字,他指明了一个无穷叠代,即 “关系的关系的……关系”,而智能将在这里涌现,解决复杂性问题预测的关键很可能就在这里,这句话打开了一个非常广阔的前景,将象宇宙一样没有穷尽。高级阶段(2):《量子物理史话》作者:曹天元,辽宁教育出版社你一定有疑问,“这本书就能让我改变世界观?”那么我们就来看看书中说些什么吧:量子世界的本质是“随机性”。传统观念中的严格因果关系在量子世界是不存在的,必须以一种统计性的解释来取而代之,波函数ψ就是一种统计,它的平方代表了粒子在某处出现的概率。当我们说“电子出现在x处”时,我们并不知道这个事件的“原因”是什么,它是一个完全随机的过程,没有因果关系。因果性必须死,因为物理学需要生!停止争论吧,上帝真的掷骰子!随机性是世界的基石,当电子出现在这里时,它是一个随机的过程,并不需要有谁给它加上难以忍受的条条框框。……而统计规律则把微观上的无法无天抹平成为宏观上的井井有条。——摘自《量子物理史话》“统计规律则把微观上的无法无天抹平成为宏观上的井井有条”,这句话实际上就是表明,统计方法可以使极其复杂的随机事件成为可预测。我认为,社会、市场、股票等等与量子世界有着很多相似之处。由于量子理论实际上是从最本质上去研究我们存在于其中的这个世界,因此正如书中的一句话:“这个世界的本质:它本就是统计性的!作者:玻尔兹曼大脑的放逐,大家可以关注他的微博:原文地址:
金牌会员, 积分 2061, 距离下一级还需 939 积分
论坛徽章:4
谢谢分享 ~~
论坛徽章:42
谢谢分享。
中级会员, 积分 489, 距离下一级还需 11 积分
论坛徽章:0
只看过第一本
高级会员, 积分 765, 距离下一级还需 235 积分
论坛徽章:13
论坛徽章:23
多谢分享。
高级会员, 积分 530, 距离下一级还需 470 积分
论坛徽章:4
扫一扫加入本版微信群大数据技术丛书《数据挖掘:实用案例分析》.pdf
扫描二维码,下载文件到手机
当前文件信息
浏览:6421次
保存:190次
下载:2042次
您的VIP会员已过期,是否续费?
用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。举报邮箱:
京网文[0号 京ICP证100780号在数据分析、挖掘方面,有哪些好书值得推荐? |
我的图书馆
在数据分析、挖掘方面,有哪些好书值得推荐? |
【肖智博的回答(1142票)】:
更新,由于经常接到私信要求在这个书单之内再推荐两三本,每个人的行业背景也不一样,所以就把下面的书单归类整理一下。
入门读物:
(豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。 通过案例来说事情,而且是最经典的例子。难易程度:非常易。 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。难易程度:易。 这本书非常棒啦,入门读起来很不错!
数据分析:
这本书可以归类为数据分析书吧,因为numpy和scipy真的是非常强大啊。
作者是Pandas这个包的作者,看过他在Scipy会议上的演讲,实例非常强!
很好玩的书,作者的角度很不同。适合入门的教程:
学习数据分析、、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。难易程度:中。 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博:王斌_ICTIR)已经翻译这本书了 。这本书本身质量就很高,王老师的翻译质量也很高。难易程度:中。我带的研究生入门必看数目之一! 虽然是英文的,但是由于写得很简单,比较理解,又有 Python 代码跟着,辅助理解。 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。难易程度:中上。 也是通过实例讲解机器学习算法,用R实现的,可以一边学习机器学习一边学习R。
稍微专业些的:
半监督学习必读必看的书。
微软亚院刘铁岩老师关于LTR的著作,啥都不说了,推荐!
李航老师关于LTR的书,也是当时他在微软亚院时候的书,可见微软亚院对LTR的研究之深,贡献之大。 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。 这个是Jordan老爷子和他的得意门徒
在 Foundation of Machine Learning Research上的创刊号,可以免费下载,比较难懂,但是一旦读通了,graphical model的相关内容就可以踏平了。 NLP 经典,其实主要是讲 NLTK 这个包,但是啊,NLTK 这个包几乎涵盖了 NLP 的很多内容了啊!
机器学习教材:
这本书有对应的中文版:。书中配有R包,非常赞!可以参照着代码学习算法。 李航老师的扛鼎之作,强烈推荐。难易程度:难。
去年出版的新书,作者Kevin Murrphy教授是机器学习领域中年少有为的代表。这书是他的集大成之作,写完之后,就去Google了,产学研结合,没有比这个更好的了。
这书和上面的书不是一本!这书叫:Machine Learning: An Algorithmic Perspective 之前做过我带的研究生教材,由于配有代码,所以理解起来比较容易。
经典中的经典。 看名字就知道了,彻彻底底的Bayesian学派的书,里面的内容非常多,有一张图将机器学习中设计算法的关系总结了一下,很棒。 鸿篇巨制,这书谁要是读完了告诉我一声。
凸优化中最好的教材,没有之一了。课程也非常棒,Stephen老师拿着纸一步一步推到,图一点一点画,太棒了。
【HanHsiao的回答(24票)】:
肖智博已经说得很全面了,再补充一些:)
之前回答过这类问题,有兴趣的话建议先看一看:
二、因为问题已经更新到了马年,所以推荐几本2014年刚出的数据科学好书。(网上已经有PDF版可以下载,此处不再给出)
《Doing Data Science: Straight Talk from the Frontline》:作者之一Rachel Schutt本科在密歇根大学学习数学,同时拥有纽约大学数学硕士学位,以及斯坦福大学工程经济系统和运筹学双硕士学位,美国哥伦比亚大学统计学博士学位,而后在谷歌研究所担任统计学专家。Johnson研究实验室的高级科学家兼创始人之一,目前在哥伦比亚大学讲授“数据科学导论”(Introduction to Data Science)课程。她提出了数据科学家的概念即“计算机科学家、软件工程师和统计学家的混合体。”另一位作者Cathy O’Neil是哈佛大学数学博士,麻省理工学院数学系博士后,目前在华尔街的德劭基金(D.E.Shaw)做quant。(总之是两个大牛XD)
本书前面几个章节大致介绍了数据分析法、一些机器学习算法、线性回归和逻辑回归、朴素贝叶斯等等。其中有一些内容需要一些数学基础才能吃透。 第六到十章节是本书的精华,详细介绍了如何利用金融及社交网络中的数据进行数据建模分析,值得反复回味。
《Agile Data Science: Building Data Analytics Applications with Hadoop》:本书适合刚入行的数据爱好者以及有两三年工作经验数据科学家,作者立志打造一个full-stack解决方案(包括开发框架、运行环境等,有了它无需再下载别的软件)来减少前期在数据准备上必须花费的大量时间。此外书中的一些例子放在了GitHub上,建议一边看书一边DIY。
《Fast Data Processing with Spark》:
目前市面上关于Spark的书籍不多,这本120多页的薄书可以当做预热。Spark同Hadoop一样是基于Mapreduce算法实现的分布式计算,不同的是任务的中间输出结果可以保存在内存中无需读写HDFS,所以更加适合需要进行反复迭代的机器学习算法实验。作者Holden Karau曾在亚马逊数据挖掘项目组,目前是一名在谷歌工作的软件研发工程师。
以上,有时间再来更新。祝挖掘快乐:)
【小斯的回答(34票)】:
被最高答案私信了,所以共享删除了,虽然整理的书其实来自好几个书单
【知乎用户的回答(13票)】:
个人觉得这本书,绝对是经典中的经典,值得从事有关机器学习研究和应用的朋友们,好好研读
【知乎用户的回答(6票)】:
推荐两本入门了解概念的书:
《New Internet:大数据挖掘》 —— 是MS的一位资深专家写的,从算法到工具,再到DM在日志分析、营销邮件、电商、移动等业务中的实际应用,内容有较全面的介绍,语言浅显易懂,作DM领域进门读物很不错。并且在每章节后都有提供本章提到的工具或数据来源,方便学习。
《数据挖掘与数据化运营实战:思路、方法、技巧与应用》—— 这是ALi的一位数据专家写的,从书名能看出这本偏运营实践,里面有很多电商方面的实践案例。当然也有几章节概述DM工具和算法,作为入门介绍。
【Louise的回答(3票)】:
《数据挖掘技术(第3版)——应用于市场营销、销售与客户关系管理》
对做数据分析的从业人员也有帮助,不深
【江海涛的回答(4票)】:
推荐陈哲的"数据分析:企业的贤内助",读起来有乐趣,案例比较分许,适合初学者
【何史提的回答(2票)】:
Bishop, Pattern Recognition and Machine LearningManning, Raghaven, Schutz, Introduction to Information RetrievalJanert, Data Analysis with Open Source ToolsSegaran, Programming Collective IntelligenceHastie, Tibshirani, Friedman, The Elements of Statistical Learning
【冉敏的回答(1票)】:
在看数据之魅。。。感觉还不错
【刘一鸣的回答(3票)】:
怎么感觉像卖书的软文,第一批的8和10是需要好好研究的。
第二批的有一半没看过。主要是越看越觉得偏数学,现在干脆就直接学数学了。
数学的教材和资料网上到处都是,coursera,udacity, khan academy 都有很多,mit open course甚至有全套的。
如果只是基本应用的话, 可以从第二批的3,10,11入手,3用的是R语言讲的。
【王继达的回答(2票)】:
我理解的数据分析和数据挖掘是50%的技术能力+50%的业务能力,不太清楚LZ的问题是偏业务向还是科研向的,数据分析向还能推荐一些书,数据挖掘向等我修炼好再推荐(希望能比较快)^_^
1、 其实EXCEL在工作中还是大杀器,原因是易传承,好传播
2、 统计学肯定要了解,统计学书都可以的
3、 SPSS的内容,我是从这本书开始看的,因为这本书每个方法都有案例,可以直接看案例明白理论的作用,再加上 SPSS官方说明文档 基本上就够了
4、 ali的专家写的,看了这本书能理解很多方法的适用场景,适用场景和数据解读能力对于业务能力要求很高。
水平有限,不停修炼不停补充。
【MuXiaoyu的回答(1票)】:
youtube上有一门UBC的课很不错,另外凸优化那本书的作者也有教学视频
【知乎用户的回答(2票)】:
如果要实用而不是学理论的话,
《数据仓库工具箱:维度建模的完全指南》
《Microsoft数据仓库工具箱》
《SQL Server 2008 分析服务从入门到精通》
《SQL Server 2008 报表服务从入门到精通》
【ShanShan的回答(1票)】:
machine learning
通俗易懂,接地气!适合没有任何engineering 背景入门!
最近看deep learning, 发现Goolgle brain project创始人也是他!!继续膜拜
【BoMa的回答(0票)】:
用python的,在看机器学习实战,非常有启发。
【Bumblebee的回答(0票)】:
【RichieFeng的回答(0票)】:
Last semester, I took the class "data mining". The instructor was Jiawei Han. I think he might be the expert in field of data mining, though the class was easy for me.
【2gua的回答(0票)】:
初学者,还是只看一本《数据挖掘导论》吧!!
【知乎用户的回答(0票)】:
推荐一本入门书,是之前上数据挖掘时候的教材,看完可以对数据挖掘有个大概认识,了解数据挖掘的分类和一些技术方法和具体算法
Introduction to Data Mining
Pang-Ning Tan, Michigan State University,
Michael Steinbach, University of Minnesota
Vipin Kumar, University of Minnesota
【PennyWong的回答(0票)】:
补充一本比较新的
mining of massive data sets
jeffery ullman的书,google一下可以在stanford的网站上下到,里面有一些很新很流行很专业的方法。看完可以对dataset的处理这一块有个基本的把握
发表评论:
馆藏&57731
TA的推荐TA的最新馆藏}

我要回帖

更多关于 如何学习大数据 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信