最近写了较多的 Python 脚本,将最近自己写的脚本进行一个总结,其中有些是 Python 独有的,有些是所有程序设计中共有的: 考虑使用 Logger(logger 怎么配置,需要输出哪些信息 —...
15道大数据岗位面试题
你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好? 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉...
R vs Python|R是现在最好的数据科学语言吗?
Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后面补充了 2016 年...
R语言抓取链家网数据代码(附数据集下载)
今天看到有人用Python爬取了链家网成都站的楼盘信息,我尝试用R做了同样的事情,具体代码如下: library(rvest) url0 <- 'http://cd.fang.lianjia.c...
R语言和Python绘制圣诞树
今天圣诞节,我分别用R语言和Python绘制了圣诞树,祝大家圣诞节快乐。 Python篇 @方法一 n = 50 from turtle import * speed("fastest") left(...
如何七周成为数据分析师?
写这个系列,是希望在当初知乎某一个回答的基础上,单独完善出针对互联网产品和运营们的教程。不论对数据分析或数据运营,我都希望它是一篇足够好的教材。 得承认我有标题党之嫌,更准确说,这是一份七周的互联网数...
Spark下使用python写worldCount
安装spark就省略了,网上很多方法。 test-data.txt文件 a b c aaa bbb ccc a b c c b a vi wordcount.py #!/usr/bin/env pyt...
机器学习初学者入门学习资料
这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源...
Python双色球数据分析(3):用线性回归模型作预测
本次将进行下期双色球号码的预测,想想有些小激动啊。 代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。 发现之前有很多代码都是重复的工作,为了让代码看的更...
Python双色球数据分析(2):双色球中蓝红球分析统计
将上一篇收集的数据处理下,newdata.txt数据样子 ... 2005-08-21, 05,10,23,27,28,30,15 2005-08-18, 04,05,17,18,26,33,04 2...