实现R与Hadoop联合作业的三种方法 Hadoop

实现R与Hadoop联合作业的三种方法

实现R与Hadoop的联合作业,R就拥有了在分布式文件系统(HDFS)上处理大数据的能力。本文的目的就是阐述实现二者联合作业的不同技术。但同时,这几种方法也各有利弊。 为了满足用R语言处理pb量级数据...
阅读全文
数据挖掘与数据分析梳理 数据分析

数据挖掘与数据分析梳理

一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通...
阅读全文
R语言实战:R语言介绍 R语言

R语言实战:R语言介绍

我们分析数据的方式在近年来发生了令人瞩目的变化。随着个人电脑和互联网的出现,可获取的数据量有了非常可观的增长。 商业公司拥有TB级的客户交易数据,政府、学术团体以及私立研究机构同样拥有各类研究课题的大...
阅读全文
学习R的三种境界,你达到了吗? R语言

学习R的三种境界,你达到了吗?

王国维在《人间词话》中将读书分为了三种境界:"古今之成大事业、大学问者,必经过三种之境界:'昨夜西风凋碧树,独上高楼,望尽天涯路'。此第一境也。'衣带渐宽终不悔,为伊消得人憔悴。'此第二境也。'众里寻...
阅读全文
谈一谈到底该如何学习数据分析? R语言

谈一谈到底该如何学习数据分析?

看到不止一个QQ群里面的有很多人都问过如何学好数据分析,这个一个比较大的命题,很难一两句话弄说的明了,所以这个的问题很难在QQ群里得到一个满意的答案。好吧,那我就以一个这方面的从业者的身份来说一说怎么...
阅读全文
分分合合之数据科学家浅析 大数据

分分合合之数据科学家浅析

随着国家大数据行动计划的发布,大数据相关的新词频出,其中“数据科学家”一词更是横空出世貌似高不可攀。那我们来看看这个所谓的数据科学家到底是新瓶装旧酒还是新瓶装新酒? 让我们来问问度娘,她说“数据科学家...
阅读全文
提升R语言代码运算效率的11个实用方法 R语言

提升R语言代码运算效率的11个实用方法

众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简...
阅读全文