大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所...
R语言多项式回归
含有x和y这两个变量的线性回归是所有回归分析中最常见的一种;而且,在描述它们关系的时候,也是最有效、最容易假设的一种模型。然而,有些时候,它的实际情况下某些潜在的关系是非常复杂的,不是二元分析所能解决...
干货分享:数据可视化工具大集合
所谓数据可视化是对大型数据库或数据仓库中的数据的可视化,它是可视化技术在非空间数据领域的应用,使人们不再局限于通过关系数据表来观察和分析数据信息,还能以更直观的方式看到数据及其结构关系。 数据可视化技...
【译文】R语言自定义函数搞定异常值
统计学中离群值被定义为离开大部分观测较远的样本点,多数是由于测量误差而产生。因此,数据分析中离群值的识别和移除(如有必要)是很重要的一个步骤。 鉴定离群值的方法有很多种,包括基于标准差的方法和基于四分...
【R语言教程】520的礼物♥
一切都是从一个故事开始的:1650年,斯德哥尔摩街头,一个宁静的午后,笛卡尔邂逅了18岁的瑞典公主克里斯汀。机遇巧合,一段纯粹、美好的爱情悄然萌发。然而,没过多久,他们的恋情传到了国王的耳朵里。国王大...
一份机器学习资料整理,全是干货!
学习Machine Learning也有很长一段时间了,前段时间在paper中应用了GTB(Gradient Tree Boosting)算法。在我的数据集上GTB的performance比Rando...
入门数据分析,我应该学习什么编程语言?
很多时候,当和人们讨论怎么开始学习数据科学,一个疑惑总是出现在我们面前: 我不知道应该学什么编程语言。 不仅仅是编程语言,这还包括软件系统,例如TABLEAU,SPSS等,这是个更加广阔范畴的工具和编...
莆田医院的可视化(R语言版)
Idea来自于这里原文作者用python完成了数据爬取,可视化的过程,本文用R实现一遍... 基本的流程如下: 爬取数据与整理 根据医院获取经纬度 根据获取的经纬度完成可视化 数据爬取与整理 数据来源...
学习R语言,一篇文章让你从懵圈到入门
在实际工作中,每个数据科学项目各不相同,但基本都遵循一定的通用流程。具体如下: 数据科学工作流程 数据导入 数据整理 反复理解数据 数据可视化 数据转换 统计建模 作出推断(比如预测) 沟通交流 自动...
金融信用风险建模之 R 实战案例
来源数据人网:http://www.shujuren.org/article/113.html Cynthia Li, CFA 银行贷款 — 信用违约 1. 定义 * 银行与借款人之间的协议 —- 贷...