最近写了较多的 Python 脚本,将最近自己写的脚本进行一个总结,其中有些是 Python 独有的,有些是所有程序设计中共有的: 考虑使用 Logger(logger 怎么配置,需要输出哪些信息 —...
Python 代码实践小结
工欲善其事必先利其器-大数据分析工具集
文 | 沈浩老师 大数据时代需要大数据挖掘,我习惯把大数据分成四个领域:数据科学、网络科学、空间地理科学和可视化技术; 最近的主要兴趣在空间地理领域,学习如何获取POI,Polygon,经纬度,空间匹...
R vs Python|R是现在最好的数据科学语言吗?
Sharp Sight Labs 近日在 r-bloggers 上发表了一篇文章,论述了为什么当今的数据科学工作者应该学习 R 语言的原因。为了给大家提供一个明晰的对比,我们在后面补充了 2016 年...
R语言抓取链家网数据代码(附数据集下载)
今天看到有人用Python爬取了链家网成都站的楼盘信息,我尝试用R做了同样的事情,具体代码如下: library(rvest) url0 <- 'http://cd.fang.lianjia.c...
R语言和Python绘制圣诞树
今天圣诞节,我分别用R语言和Python绘制了圣诞树,祝大家圣诞节快乐。 Python篇 @方法一 n = 50 from turtle import * speed("fastest") left(...
Spark下使用python写worldCount
安装spark就省略了,网上很多方法。 test-data.txt文件 a b c aaa bbb ccc a b c c b a vi wordcount.py #!/usr/bin/env pyt...
机器学习的“万能模板”
2016年7月,一名德国籍的大牛Abhishek Thakur在他的Kaggle博客发布了一篇文章,题目叫做《Approaching (Almost) Any Machine Learning Pro...
Python双色球数据分析(3):用线性回归模型作预测
本次将进行下期双色球号码的预测,想想有些小激动啊。 代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。 发现之前有很多代码都是重复的工作,为了让代码看的更...
Python双色球数据分析(2):双色球中蓝红球分析统计
将上一篇收集的数据处理下,newdata.txt数据样子 ... 2005-08-21, 05,10,23,27,28,30,15 2005-08-18, 04,05,17,18,26,33,04 2...
Python双色球数据分析(1):数据爬取
每个人都有一颗中双色球大奖的心,对于技术人员来说,通过技术分析,可以增加中奖几率,现使用Python语言收集历史双色球中奖信息,之后进行预测分析。 说明:采用2016年5月15日获取的双色球数据为基础...