大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所...
干货分享:数据可视化工具大集合
所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。 数据可视化技...
一份机器学习资料整理,全是干货!
学习Machine Learning也有很长一段时间了,前段时间在paper中应用了GTB(Gradient Tree Boosting)算法。在我的数据集上GTB的performance比Rando...
Python实现抓取城市的PM2.5浓度和排名
原作者:王庆ustcwq 原文链接:http://www.oschina.net/code/snippet_2284672_46423 本文给大家介绍的是一则使用Python实现抓取城市的PM2.5数...
入门数据分析,我应该学习什么编程语言?
很多时候,当和人们讨论怎么开始学习数据科学,一个疑惑总是出现在我们面前: 我不知道应该学什么编程语言。 不仅仅是编程语言,这还包括软件系统,例如TABLEAU,SPSS等,这是个更加广阔范畴的工具和编...
史上最全的“大数据”学习资源(下)
资源类型主要包括:大数据框架、论文等实用资源集合。 服务编程 Akka Toolkit:JVM中分布性、容错事件驱动应用程序的运行时间; Apache Avro:数据序列化系统; Apac...
将Python和R整合进一个数据分析流程
编译:丁一 黄念 丁雪 校对:席雄芬 姚佳灵 程序验证:郭姝妤 ◆ ◆ ◆ 序言 在Python中调用R或在R中调用Python,为什么是“和”而不是“或”? 在互联网中,关于“R ...
深入对比数据科学工具箱:Python和R之争
概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data ...