实际工作中的数据挖掘流程 数据分析

实际工作中的数据挖掘流程

数据工作者最长也是有效的一种工作方式是带项目,无论是数据分析还是专项挖掘,项目制能使数据尽量贴近业务并且有效理解业务和数据的各个维度。那么如何建立面向业务落地的数据分析(挖掘)流程? 在做本篇介绍之前...
阅读全文
数据挖掘的聚类算法和优势 数据分析

数据挖掘的聚类算法和优势

文|十方 比较分类算法的话,大概考虑这几个维度:时间空间复杂度,鲁棒性,参数敏感性,处理不规则形状,适合的类数量,类间差异(范围大小,样本个数,形状差异) 可以参照一下sklearn网站给出的列表:2...
阅读全文
数据分析师的自白 ! 数据分析

数据分析师的自白 !

“数据分析师”被誉为二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。其实,数据分析师就是采用科学方法、运用数据挖掘工具发现问题并提出改进建议。为了满足大家对...
阅读全文
一篇文章,掌握所有开源数据库的现状 MySQL

一篇文章,掌握所有开源数据库的现状

作者:黄东旭 数据库作为业务的核心,在整个基础软件栈中是非常重要的一环。近几年社区也是新的方案和思想层出不穷,接下来我将总结一下近几年一些主流的开源数据库方案,其背后的设计思想以及适用场景。本人才疏学...
阅读全文
芝麻信用评分模型解析 数据分析

芝麻信用评分模型解析

传统的征信系统,其数据来源比较单一,但是这些系统当中记录的都是关于个人和企业比较核心的金融数据,如信贷、保险、税收等,都是“真金白银”,与个人信用关联度比较强。互联网公司积累的数据虽然多,但是这些数据...
阅读全文