在机器学习科学计算领域,有哪些工具能让python和matlab一样好用

用pandas 还是matplot
可能会由于工作的环境的原因,两个感觉起来都很不错.2015/03: 把我以前用python的一个项目用R 和Rcpp重写了.说实话Rcpp非常好用,完全省去了写wrapper这一步,效率大挺升.一些sugar function也用起来得心应手.但是R总体体验还是让我有很多顾虑,总感觉这是一个工具,而并不是一门语言.比如R没有lint这种神器,使得我debug时间花费很多.最致命的就是内存管理太差.这次我处理的数据有点大,binary file就有5.3G,就算学校server有64G内存,R还是
我感觉我目前用的方法很傻a = a.append(pd.DataFrame(np.matrix(np.repeat(1, 11)),columns = a.columns)) 感觉这个步骤是不是新建了一个对象,然后重新赋值给a,这样的话Dataframe大了就会很慢.python - Efficiently add single row to Pandas Series or DataFrame看评论That's probably as efficient as any, but Pandas/
假设有个10g的csv文件, 每行是每个人对每个电影的评分记录 比如 kq,superman,5,( kq对超人这个电影评5分) 现有机器的内存是1g,怎么样利用pandas求给kq推荐的电影列表呢?用chunk选项df=pd.read_csv('test.csv',chunksize=10000)forchunkindf:# TODO: process the chunk as a normal DataFrame 看这个人写的总结: 最近使用 pandas 的总结 6
最近在学习python绘制图形的相关知识,学习到了这几个库,所以想请教一下各位知友.希望用python来做数据挖掘相关的任务.想问问各位知友,python做数据挖掘是否足够强大?学习数据挖掘需要学习哪些知识呢?我是一个本科生,本科学习的话能从事数据挖掘相关工作吗?Python for Data Analysis (豆瓣)先学这本书然后去官网下载对应的refer,跟着做就好系统的 ...
不是特别明白题主想问的是什么意思.如果是说方便自己在远程调试,可以试着用 ipython notebook 的远程版本,把 ipython notebook 搭建在远程服务器上,自己在本地通过浏览器登录进行交互式的计算.如果是说将分析出的结果,展示在前端,可以试试看将数据用 pandas 处理后,前端用 D3.js 来展示. 4
现在两个都不懂,数据处理只会 Numpy/Scipy/scikit-learn,所以感觉两个至少要学一个.初看了一下感觉 Graphlab 的 SFrame 比 Pandas 的 dataframe 要厉害些,那么是不是只学 Graphlab 就行了?或者说 Pandas 能做什么 Graphlab(的SFrame)不能做的?谢谢.sframe只用过一两次,并不熟悉,所以很难做出客观比较.但我认为重要的不是学哪个,而是你要用熟其中任意一个,这样之后再换用另一个也很容易.老实说这些东西用法都差不多
使用Python的Pandas库处理数据,现在有一个DataFrame,比如TMP=DataFrame({'key1':['A','B','A','B'],'key2':['X','X','X','X'],'key3':[1,2,3,4]}),执行TMP=TMP.groupby(['key1','key2']).sum(),之后,会成为key3key1 key2 A X 4B X 6这样的一个有复合索引的Series,我如果想把它做成一个key1 key2 key3 0 A X 41 B X 6
有些时候我们的数据是字符串形式的,pandas也能方便的处理,今天我们就举几个例子来操作字符串.先来创建一个Series查看下其中的内容将数据转换为小写查看下是不是转换为了小写转换为大写获取字符串的长度,使用len现在所有的字符串转换为了数字,也就是字符串的长度我们还可以切割字符串,将字符串转换为list查看list构成的数据列如果list构成的数据列比较怪,我们可以使用get方法获得列中的某个元素结果为:替换字符串,使用replace,replace的第一个参数是正则表达式,第二个参数是要替换
转一篇文章给楼主看下.中文原文:长篇巨献|数据科学界华山论剑:R与Python巅峰对决英文原文应该是这里:Choosing R or Python for data analysis? An infographic如果你是数据分析领域的新兵,那么你一定很难抉择--在进行数据分析时,到底应该使用哪个语言,R还是Python?在网络上,也经常出现诸如&我想学习机器语言,我 ...
Python与Java各自适合的场景是哪些?有什么不同定位?python能做什么?1, 网站业务逻辑的开发python有一个优良的网页开发框架django, django支持各种主流数据库,有好用的orm系统和模板系统,完善的第三方库能帮助解决遇到的大部分问题. 并且支持各种操作系统.2, 数据分析和科学计算python有numpy,scipy等一大批科学计算库,有pandas数据分析库 还有matplotlib等绘图库,在科学计算和数据分析领域已经成为主流语言3, 网络爬虫scrapy做为py
在这里提了一个自问自答的问题来推广一种十分优雅的数据可视化工具,R的ggplot2包.其实我自己现在主要在使用Python和Pandas和Numpy工作,ggplot2应该是我留守在R里面最大的理由之一~在介绍ggplot2之前,我首先来介绍一下作者Hadley Wickham.Hadley (Rice University Department of Statistics : ...
Python是非常适合做quant类工作的语言,本身就是科学计算方面的统治级语言,现在加入了IPython,pandas等重量级神器,为Quant类工作量身定做,而且仍在飞速发展中,以后会越来越重要.关于其他语言,首先介绍一下我自己最喜欢的一个比较小众的组合,Mathematica+Java/Scala. Mathematica的优点在于:本身提供函数式的编程语言,表达能力非常强大,比如Map/Reduce是标配,很多时候不需要去做烦人的for循环或下标控制,排版经常可以直接照数学公式原样输入,
能既有效率,进度也相对较快,能对实际问题分析较为快速上手的学习方法!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!严 禁 转 载 !!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!学R主要在于5点三阶段:第一阶段有一点:基础的文件操作(read. ...
实验人员,在实验中会得到一系列数据,类似于一个excel 文件很多列那种.需要以其中若干列作为坐标画图,请教如何优雅地将数据导入python, 方便下一步自由定义各列坐标画图?最后,最好答案包含一段实现代码.-------------------------------------------------------------看了答案,所以解释一下.最近在家休假,所以谷歌什么 ...
RT上知道日报了,来更新点自己的Python知识体系,个人经验,欢迎拍砖.-------------------------------------------------------------------------------------------------------------谢青木资本龙哥邀!答主更多应该算一个trader而不是quant(虽然对quant的一些 ...
我平时是做图像上的机器学习实验的,识别和检测之类的.从去年入学一直是用的matlab(老板和实验室同学们都用).但是似乎很多人觉得numpy+matplotlib+scipy比matlab更方便,而且我实际实验中也发现matlab的mex接口很难debug,,而且有时候要用到cuda的话也感觉很难调试,经常就把matlab搞crush了需要重启matlab调试,于是是尝试用python.但是我感觉python很难用诶.我的环境是ubuntu14+pycharm比如:我经常需要在程序中设置断点去看
看到最新Python版本是3.4,但是网上的资料,包括出版的书籍,都是最晚到13年左右,很多细节都不同,语法也过时了.那此时应该直接学习3.X还是2.X?如果前者的话,有什么推荐的资料或者书么?最好中文.英文看起来效率会比较低.必须果断学 3,并且,万一有需要要写 Py2 的东西,记得最开始写上from__future__importdivision,print_function LiTuX 0用Python做爬虫的注意一下,scrapy不支持Python3. Frequent
我翻了CPA的教材,没有找到.自己总结可能不太全面,所以才想麻烦大家帮忙.重点想问的是,哪些假设你觉得非常不靠谱?Plus:不是作业,没有答案!作业自己做~PhilippeS 2DCF的第一个假设就是认为公司的内在价值由未来现金流折现而成.这与基于市场的估值(market-based valuation)不同,说不上是缺陷,所以经常互为补充.折现因子discounted factor - WACC - weighted average cost of capital.折现因子用
三者都是开源的,python的通用性,R的统计特性,Julia的高性能会对本身有哪些影响?讨论发展趋势什么的,自觉还没有那么远见卓识,我就抛砖引玉一下好了.想到哪说到哪,大家多多包涵吧!Python :现在的我工作上的主力语言.因为Python在经过这么多年的发展还有这么多年的积累之后,已经能适应绝大多数的数据分析和科学计算的任务了.科学计算有:SciPy.NumPy,画图有:matplotlib.Chaco,数据分析有:Pandas.Scikit-learn,所以,从我的使用感受来说,pyth
全部用过的人来回答一下:spss对用户的要求是只要会点击菜单就可以了,有编程窗口但是一般没人用,用户多是收到过一些统计训练的,但不需要高深的分析能力,市场调研用的比较多,统计专业大二一般要求掌握sas内装许多写好的procedure 而且都是经过Fda认证的 有保障的东西 所以死贵好处是权威 坏处是不够灵活 算法更新慢 还有 死贵.语法奇怪 不是那种传统意义上做编程的语言 所以 ...
这个问题问得好...诸葛王朗 2人民银行和印钞厂是上下级关系,并非各自独立运营,不是客户和供应商的关系,不存在&购买&,不涉及货款问题.ace zh 3犯人印的 ...
Satya Nadella 执掌 Microsoft 后发生了不少变化,但如果换作 Jobs 会有什么不同?繁杂的产品线会把他累死...所以估计第一件事就是砍掉大量产品线 0从此微软服务,只有自家的 ...
目前犹豫于 GoodReader 和 iAnnotate PDF 两款 app 之间,要求流畅能原笔迹批注,标签检索等,文件管理方便.有用过的求推荐,或者有更好的选择?感激不尽.----------已用goodrea ...
人的身体里住着一群馋虫,总想寻摸好吃的,或者一日无肉不欢,或者隔三差五打牙祭.为了满足肚皮 ...
味道足以诱人,让人回味无穷!!!食材食谱热量:3846(大卡)主料面粉500g老来少400 ...
WEBOX教程 盒子到手,教你怎么连接电视机和安装,流畅看电视适合HDMI口的电视机工具/ ...
味道香,好吃,美味.食材食谱热量:1809.65(大卡)主料大米一碗芝麻15克辅料水适量白 ...
英雄联盟基本常识第2篇工具/原料装有英雄联盟客户端的电脑一台方法/步骤&小常识: ...
很多东西不是复杂就好的,简单的几个线条或许就能够表达很多东西.今天,小编在网上看到网友求助 ...
2015年新版100元人民币在日开始发行.新版100元的防伪性明显提升 ...在机器学习科学计算领域,有哪些工具能让python和matlab一样好用? - 知乎636被浏览46554分享邀请回答0添加评论分享收藏感谢收起在机器学习科学计算领域,有哪些工具能让python和matlab一样好用? - 知乎636被浏览46554分享邀请回答20352 条评论分享收藏感谢收起}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信