Python 十款卓越工具助力大数据与分析技术 数据已经成为现代化企业中最为重要的宝贵资源。一切决策、策略或者方法都需要依托于对数据的分析方可实现。随着“大数据分析”逐步替代其上代版本,即“商务智能”,企业正面临着一个更加复杂、且商业情报规模更为庞... 邬侯09月24日 3,367 阅读 发表评论 阅读全文
Hadoop 一文读懂Hadoop、HBase、Hive、Spark分布式系统架构 机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据库,hbase是分布式kv系统,看... 淘数宝网09月02日 7,293 阅读 发表评论 阅读全文
Hadoop 实现R与Hadoop联合作业的三种方法 实现R与Hadoop的联合作业,R就拥有了在分布式文件系统(HDFS)上处理大数据的能力。本文的目的就是阐述实现二者联合作业的不同技术。但同时,这几种方法也各有利弊。 为了满足用R语言处理pb量级数据... 南霁月08月15日 3,680 阅读 发表评论 阅读全文
数据分析 数据挖掘与数据分析梳理 一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: 1、在应用工具上,数据挖掘一般要通... 淘数宝网08月15日 6,021 阅读 发表评论 阅读全文
数据分析 数据分析师、数据科学家常见的77个面试问题 随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问... 淘数宝网08月01日 6,338 阅读 发表评论 阅读全文
大数据 分分合合之数据科学家浅析 随着国家大数据行动计划的发布,大数据相关的新词频出,其中“数据科学家”一词更是横空出世貌似高不可攀。那我们来看看这个所谓的数据科学家到底是新瓶装旧酒还是新瓶装新酒? 让我们来问问度娘,她说“数据科学家... 淘数宝网07月29日 3,430 阅读 发表评论 阅读全文
数据科学家 数据科学家日常工作的15项原则 作为一个数据科学家,我为我的日常工作总结开发出15项原则,这些是我本人也遵循的: 1、不要用数据说谎或吹牛: 对经验性证据要诚实坦率。最重要的是不要用数据自欺欺人。 2、建立永久工具并分享给他人: 花... 淘数宝网07月20日 2,768 阅读 发表评论 阅读全文
大数据 重磅出炉丨2016年上半年大数据方向就业形势 一、大数据介绍 1、大数据概述 对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量、高增长率和多样... 淘数宝网07月16日 9,310 阅读 发表评论 阅读全文
Hadoop 如何创建一个大数据平台 创建大数据平台,是个系统性的工程,并不像简简单单开发一款APP一样,你要深度的了解当前的环境以后的发展。大数据,曾几何时似乎很少出现,组织多半会选择以增量方式实现大数据解决方案。不是每个分析和报告需求... 南霁月07月03日 3,785 阅读 发表评论 阅读全文
Python 我的数据分析/数据挖掘/机器学习必读书目 总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本上我写的都是读完过的,... 南霁月06月24日 5,439 阅读 发表评论 阅读全文