十款卓越工具助力大数据与分析技术 Python

十款卓越工具助力大数据与分析技术

数据已经成为现代化企业中最为重要的宝贵资源。一切决策、策略或者方法都需要依托于对数据的分析方可实现。随着“大数据分析”逐步替代其上代版本,即“商务智能”,企业正面临着一个更加复杂、且商业情报规模更为庞...
阅读全文
实现R与Hadoop联合作业的三种方法 Hadoop

实现R与Hadoop联合作业的三种方法

实现R与Hadoop的联合作业,R就拥有了在分布式文件系统(HDFS)上处理大数据的能力。本文的目的就是阐述实现二者联合作业的不同技术。但同时,这几种方法也各有利弊。 为了满足用R语言处理pb量级数据...
阅读全文
数据挖掘与数据分析梳理 数据分析

数据挖掘与数据分析梳理

一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通...
阅读全文
分分合合之数据科学家浅析 大数据

分分合合之数据科学家浅析

随着国家大数据行动计划的发布,大数据相关的新词频出,其中“数据科学家”一词更是横空出世貌似高不可攀。那我们来看看这个所谓的数据科学家到底是新瓶装旧酒还是新瓶装新酒? 让我们来问问度娘,她说“数据科学家...
阅读全文
数据科学家日常工作的15项原则 数据科学家

数据科学家日常工作的15项原则

作为一个数据科学家,我为我的日常工作总结开发出15项原则,这些是我本人也遵循的: 1、不要用数据说谎或吹牛: 对经验性证据要诚实坦率。最重要的是不要用数据自欺欺人。 2、建立永久工具并分享给他人: 花...
阅读全文
如何创建一个大数据平台 Hadoop

如何创建一个大数据平台

创建大数据平台,是个系统性的工程,并不像简简单单开发一款APP一样,你要深度的了解当前的环境以后的发展。大数据,曾几何时似乎很少出现,组织多半会选择以增量方式实现大数据解决方案。不是每个分析和报告需求...
阅读全文