“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上! 第一、信度与效度思维 这部分也许是全文最难理解的部分,但我觉得也最为重要。没有这个思维,决策者很有可能在数...
手把手教你使用R语言的主成分分析对城管事件数据分析
概念性的东西就不说那么多了,这次使用主成分分析主要目的并不是降维,而是分析城管数据中的事件类别之间是否存在关系,当然,城管事件类型有好几百,这里就只选取从去年九月到目前发生量前十的事件类别;如下图,排...
如何成为一名真正的数据分析师或者数据工程师
一.入门:高屋建瓴 数据分析的坑很大,一开始走上这条路,就要明确基本的方向,依托于核心的思想,不然只会越走越偏,最后觉得山太高水太深,不了了之。 1.数据与数据分析 数据其实就是对事物特征的定性指称以...
技能 | 利用SAS进行数据清洗技术——缺失值查询
数据清洗技术是统计分析之前必做的一步,而且也是非常麻烦的一步,有时甚至花费的时间比统计分析都长。所以没有一定的技巧,这将是个非常烦人的工作。 本篇文章介绍如何利用sas进行缺失值的查询工作。 假定我们...
R可视化—用gglot2做工资的炫酷展示
我们基于美国职业足球大联盟球员的薪水,试用ggplot2做出队员名字对应Club及工资水平的可视化(数据集回复可得)。探索性的展示,我们需要载入plyr和ggplot2包。 1、数据处理 sj <...
案例|数据驱动精准化营销在大众点评的实践
作者:美团点评技术团队 精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器。在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高...
如何使用线性回归分析来预测发电厂的发电量
在这篇文章中,我将会教大家如何通过拟合一个线性回归模型来预测联合循环发电厂(CCPP)的发电量。这个数据集则来自于UCI Machine Learning Repository。这个数据集包含5列,也...
三点经验给有志于从事数据分析师的年轻人
现在确实是属于数据分析师的天下了,如果你有能力,有经验,充满好奇心以及永不倦怠的热情,作为数据分析师的你可谓前景广阔,有一大批公司乖乖站在你家门前挂着牌子等着你的挑选。 但是在评估到底去哪家公司的平台...
数据分析应该要避免的6个错误
曾经有个运营总监告诉说,有个分析师给我做了个分析,运营目标要完成,最重要提提升流量,因为转化率提升太难,需要涉及到东西太多了。流量提长就是要引入流量,然后做了各个渠道的分析,各个流量测算。 数据分析要...
R语言多项式回归
含有x和y这两个变量的线性回归是所有回归分析中最常见的一种;而且,在描述它们关系的时候,也是最有效、最容易假设的一种模型。然而,有些时候,它的实际情况下某些潜在的关系是非常复杂的,不是二元分析所能解决...