数据挖掘 过去5年,数据科学家都用哪些算法? 在“数据为王”的今天,越来越多的人对数据科学产生了兴趣。数据科学家离不开算法的使用,那么,数据科学家最常用的算法,都是哪些呢? 最近,著名的资料探勘信息网站 KDnuggets 策划了十大算法调查,这... 36大数据02月08日 6,596 阅读 发表评论 阅读全文
R语言 R 语言的聚类方法合集 距离和相似系数 r 语言中使用 dist ( x, method = “ euclidean ”, diag = FALSE, upper = FALSE, p = 2 ) 来计算距离。其中x是样本... 淘数宝网01月25日 12,307 阅读 发表评论 阅读全文
数据分析 互联网巨头数据挖掘类招聘笔试题汇总 1 从阿里数据分析师笔试看职业要求 以下试题是来自阿里巴巴招募实习生的一次笔试题,从笔试题的几个要求我们一起来看看数据分析的职业要求。 一、异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常... 淘数宝网12月08日 6,583 阅读 发表评论 阅读全文
数据科学 数据科学中最常用的十种算法 最新一期的 KDnuggets 调查展示了一份数据科学家使用度最高的算法列表,这份列表中包含了很多惊喜,包括最学术的算法和面向产业化的算法。 哪些方法/算法是您在过去 12 个月中运用到一个实际的数据... 淘数宝网10月17日 4,638 阅读 发表评论 阅读全文
R语言 R语言数据分析实战:十大算法之K-均值聚类 一、准备 K-均值算法是聚类分析算法的一种。通常情况下,我们可能不知道每个数据样本从属的类别,样本没有分类标签,这时我们可以尝试采用K-均值聚类来解决这个问题。 K-means算法是最简单的一种聚类算... 南霁月09月23日 15,375 阅读 发表评论 阅读全文
人物观点 从央企财会到数据分析师,他都经历了什么? 作者:李运超 大家好!我叫李运超,我目前是在中国人寿保险分公司做分析师,我是CDA第四期的学员,也是刚刚从一个数据分析的学习者变成从业人员。 我以前其实是做财务会计的,在座可能有的人对财务会计有些了解... 淘数宝网09月20日 13,575 阅读 发表评论 阅读全文
数据分析 常见数据分析方法汇总 一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率\回归法、决策树法。 2、正态... 淘数宝网09月09日 5,886 阅读 发表评论 阅读全文
Python 聚类分析实战解析与总结 聚类分析是没有给定划分类别的情况下,根据样本相似度进行样本分组的一种方法,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根据数据自身的距离或相似度划分为若干组,划分的原则是组内距离最小化... 淘数宝网09月08日 5,113 阅读 发表评论 阅读全文
数据分析 数据分析:8月热门事件盘点 2016年8月即将过去,这个月的舆论焦点无疑大多集中在里约奥运会相关的人物和事件,“最当红炸子鸡”并非任何一位金牌得主,而是“洪荒少女”傅园慧。即便是因离婚事件从一众奥运新闻中突出重围的演员王宝强也没... 淘数宝网08月30日 4,655 阅读 发表评论 阅读全文
大数据 KDD2016落幕,雅虎获最佳论文,附10年最佳论文合集 2016国际知识发现与数据挖掘大会(KDD)于8月17日圆满落幕,其中包含5个主题报告、6个全天研讨会和12场特邀演讲。吸引了来自全世界的数据挖掘、知识发现、大规模数据处理等领域的专家学者。同时,世界... 淘数宝网08月19日 10,662 阅读 1 阅读全文