R语言有很多包可以做机器学习(Machine Learning)的任务。机器学习的任务主要有有监督的学习方式和无监督的学习方式。 有监督学习:在正确结果指导下的学习方式,若是正确结果是定性的,属于分类...
机器学习的“万能模板”
2016年7月,一名德国籍的大牛Abhishek Thakur在他的Kaggle博客发布了一篇文章,题目叫做《Approaching (Almost) Any Machine Learning Pro...
八步成为数据科学家,攻克 “21世纪最性感的工作”
在数据科学(Data Science)领域,除了“什么是数据科学”这个问题以外,大家最感兴趣的问题就是“如何学习数据科学?”其实这个问题除了新手会问,有时候领域内的老手也有些迷惑。 数据科学家被誉为“...
AI、大数据、和数据科学的十大类算法应用场景
算法正在取代我们的工作吗?是...是的...但算法是个好东西。 算法是一系列包含能够帮助人解决问题、完成目标任务的规则的步骤。用正确的方式把这些步骤和规则组织起来,能够自动化算法建立人工智能(AI)。...
机器学习初学者入门学习资料
这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源...
R语言数据分析实战:十大算法之SVM模型
一、SVM简介 在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。 SVM的主要思想可以概括为两点: ⑴...
数据科学中最常用的十种算法
最新一期的 KDnuggets 调查展示了一份数据科学家使用度最高的算法列表,这份列表中包含了很多惊喜,包括最学术的算法和面向产业化的算法。 哪些方法/算法是您在过去 12 个月中运用到一个实际的数据...
最流行的4个机器学习数据集
机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数据系列博文的开篇,列举了4个最流...
这里有7个理想,你最想实现那个?
回想二十年前,你会发现世界发生了天翻地覆的变化:从台式机、笔记本到iphone、ipad,从门户网站、论坛、博客到微博、微信……科技革命和产品创新改变了我们的生活方式。那么,未来二十年会有哪些科技,在...
一文读懂Hadoop、HBase、Hive、Spark分布式系统架构
机器学习、数据挖掘等各种大数据处理都离不开各种开源分布式系统,hadoop用户分布式存储和map-reduce计算,spark用于分布式机器学习,hive是分布式数据库,hbase是分布式kv系统,看...