Python Python 代码实践小结 最近写了较多的 Python 脚本,将最近自己写的脚本进行一个总结,其中有些是 Python 独有的,有些是所有程序设计中共有的: 考虑使用 Logger(logger 怎么配置,需要输出哪些信息 —... 36大数据05月11日 4,910 阅读 发表评论 阅读全文
大数据 15道大数据岗位面试题 你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好? 1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉... 淘数宝网03月07日 7,985 阅读 发表评论 阅读全文
Python R vs Python|R是现在最好的数据科学语言吗? Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后面补充了 2016 年... 淘数宝网01月08日 5,274 阅读 发表评论 阅读全文
Python R语言抓取链家网数据代码(附数据集下载) 今天看到有人用Python爬取了链家网成都站的楼盘信息,我尝试用R做了同样的事情,具体代码如下: library(rvest) url0 <- 'http://cd.fang.lianjia.c... 淘数宝网12月26日 16,816 阅读 发表评论 阅读全文
Python R语言和Python绘制圣诞树 今天圣诞节,我分别用R语言和Python绘制了圣诞树,祝大家圣诞节快乐。 Python篇 @方法一 n = 50 from turtle import * speed("fastest") left(... 淘数宝网12月26日 9,651 阅读 发表评论 阅读全文
数据分析 如何七周成为数据分析师? 写这个系列,是希望在当初知乎某一个回答的基础上,单独完善出针对互联网产品和运营们的教程。不论对数据分析或数据运营,我都希望它是一篇足够好的教材。 得承认我有标题党之嫌,更准确说,这是一份七周的互联网数... 秦路11月27日 7,147 阅读 发表评论 阅读全文
Python Spark下使用python写worldCount 安装spark就省略了,网上很多方法。 test-data.txt文件 a b c aaa bbb ccc a b c c b a vi wordcount.py #!/usr/bin/env pyt... 白起11月24日 3,792 阅读 发表评论 阅读全文
机器学习 机器学习初学者入门学习资料 这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源... 白起11月01日 4,328 阅读 发表评论 阅读全文
Python Python双色球数据分析(3):用线性回归模型作预测 本次将进行下期双色球号码的预测,想想有些小激动啊。 代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。 发现之前有很多代码都是重复的工作,为了让代码看的更... 白起10月23日 17,670 阅读 1 阅读全文
Python Python双色球数据分析(2):双色球中蓝红球分析统计 将上一篇收集的数据处理下,newdata.txt数据样子 ... 2005-08-21, 05,10,23,27,28,30,15 2005-08-18, 04,05,17,18,26,33,04 2... 白起10月23日 11,870 阅读 发表评论 阅读全文