数据行业新手、从业人员职业生涯提升计划

  • A+

市场对于数据科学家的迫切需求使得众多IT专业人士开始认真考量这一前景可观的全新发展方向。

数据行业新手、从业人员职业生涯提升计划

数据科学已经快速成为IT领域中一大炙手可热的职位选项。受到生产环境内结构化与非结构化数据以创纪录速度膨胀的积极推动,这一领域快速发展。不过,更为重要的是更为强大且成本低廉的数据科学工具的不断涌现,包括微软Excel到Python再到 Hadoop。这些足以帮助小型初创企业、大到谷歌及Amazon等网络巨头搞定自己面对的具体数据分析难题。

因此,数据科学已经成为专业人士不容忽视的一大全新发展机遇,并能够为其带来相当可观的薪酬水平。与其它早已成熟的传统技术不同(例如数据库管理),数据科学显然是一类全新领域。这意味着其具备更出色的开放性,而新晋专业人士亦乐于学习与之相关的各类新型技能。

岗位来自哪里——薪酬水平又是如何

粗略地浏览一遍领英上的相关信息,大家基本可以对数据科学拥有初步的市场需求感受。2016年1月,相关招聘帖数量高达 3500条,其职称范围从高级数据科学家到分析数据科学家乃至大数据工程师等等。相关雇主则包括网络领域的各大中坚力量,包括Amazon(70多个开放岗位)、博思艾伦(70个以上岗位)、彭博、甲骨文、美国商业银行以及Capital One等等。

对于那些能够在数据科学领域拿下一个职位的朋友们来说,亦有一份相当丰厚的薪酬等着他们。目前美国本土数据科学岗位的中位数薪酬为每年10万4千美元,O’Reilly Media公司在2015年数据科学薪酬调查报告当中指出。(PayScale亦表示加州地区拥有经验的数据科学家的年薪中位数在10万美元。)当然这只是开始,Robert Half Technology 2016薪酬指南报告称,2016年数据科学家的平均薪酬在10万9千美元到15万3750美元之间。旧金山湾区则是美国数据科学需求的核心地带,不过相关职位的需求亦可谓遍地开花。目前在纽约、波士顿以及华盛顿特区等城市亦出现了旺盛的数据科学人才需求。

六位数的可观薪酬再加上惊人的开放岗位数量,已经促使相当一部分企业将人才物色的目光投向了本地之外。除此之外,也有相当一部分大学及专业协会提供相对应的教育计划,旨在帮助具备数据分析能力的其他专业人士顺利进入这一领域。

雇主们有何需求

微软公司在业内一直以强大的产品盈利能力与可观的研发投入而著称。为了保障自身研发实力,微软方面正在积极吸纳数据科学家与机器学习专家。根据领英上的相关信息,微软公司目前拥有超过400位与数据科学相关之员工,其中一部分员工拥有博士学位。微软公司亦在努力通过校园招聘招徕经验丰富的数据科学专业人员。微软公司招聘人员Robin McMahon谈到了她眼中微软提供的数据科学从业者发展机遇:

“现在为微软公司招聘数据科学家确实相当令人兴奋,因为候选人往往有机会在面试中涉及多个不同部门,”McMahon解释道,她一直在专注于招聘数据科学与机器学习专家。微软公司的数据科学家们正着手构建多种不同产品,包括Azure、Xbox与Bing。

“我们对于各类技能以及数据科学教育及从业背景很感兴趣,”McMahon解释称。“发表过数据科学相关论文能够帮助大家在候选者当中脱颖而出,”她补充道。微软公司会定期向Strata大会派遣招聘人员,从而帮助这一领域补充新鲜血液。虽然拥有计算机科学学位能够更好,但不具备也没关系。McMahon甚至遇到过几位来自生物信息或者其它信息学领域的专业人员,最终他们都成功进入了微软公司。

即使是那些不具备数据科学或者信息学正规教育背景的候选者也能够拥有这样的全新职业生涯——只需要一点激情与耐性。

“自学与对数据科学的热情可以说是数据科学专业人士的关键性素质,”电子商务企业Instacart公司数据科学副总裁 Jeremy Stanley强调称——这是一家专门提供个性化购物与送货服务的企业。“我更倾向于提供现成的挑战供候选者们解决,而不是单纯着眼于其简历内容,”Stanley补充称。“我高度关注候选者们解决问题的能力及其代码编写质量。”

Instacart公司的招聘流程包含可带走的测试内容以及与团队协作解决的问题,Stanley告诉我们。

除了数学与计算机科学知识,Stanley认为数据科学专业人士还应当着眼于客户与产品对数据影响能力加以考量。“这种能够提出正确问题并不断进行针对性学习的能力能够切实帮助数据科学家们成功扮演现有角色并拿到潜在工作岗位,”Stanley解释道。

从酒店管理到数据科学:真人实例

Jade Bailey-Assam在几年之前决定涉足数据科学领域,并已经取得了一系列令人瞩目的成绩。通过辛勤的工作与学习,她已经储备起相当出色的数据科学技能。由于最初毕业于康奈尔大学的酒店管理专业,Bailey-Assam开始了自己在拉斯维加斯各大酒店与娱乐机构的职业生涯。Bailey-Assam在康奈尔大学中专注于信息研究,而这也给她打下了理解信息与企业业务间对接方式的良好基础。

“2009年,我曾经在Wynn公司探索并研究社交媒体对企业业务的作用。在该项目当中,我开始对自然语言处理以及情感分析产生深厚的兴趣。当时,进行情感分析还是一项相当具有挑战性的工作,”Bailey-Assam表示,并解释称这项实践主要用于市场营销领域,旨在评估并汇总公众对于某家企业的观点。

实现情感分析的一类主流方式在于分析大量社区媒体评论(例如Twitter消息)并将这些消息汇总成具体类别,例如积极与消极。已经有不少企业开发此类软件以支持相关工作,这些软件则需要依托于自然语言处理功能以实现分析需求。

Bailey-Assam还以旁听生的身份就读于哥伦比亚大学的数据科学研究院,旨在进一步提升自己的数据科学技能。在进入哥伦比亚大学进修之前,她还完成了本科水平的数学课程以强化自身对于数据的理解。“我最近参加了一项算法课程,其中对于这一议题的解读非常让人着迷。看到计算机科学方法解决实际问题真的对我帮助很大——即将一个完整的难题拆分成多个更为简单的部分,”她表示。

“我在哥伦比亚大学的学习经历帮助自己拥有了更出色的工作能力。在最近的项目当中,我的任务是帮助客户实现Adobe Analytics。而在遇到问题时,我能够利用结构化方法解决问题并顺利完成了项目,”Bailey-Assam指出,她目前供职于麦肯锡公司并频繁涉及各类分析项目。

“在现实生活中,数据质量往往参差不齐亦会带来各类问题,这些都需要由从业者加以处理。因此大家需要拓展自己的实践与技能,从而完成数据整理以切实完成任务,”Bailey-Assam解释称。举例来说,原始HTML数据通常需要利用VBA脚本进行整理,而后方能被微软 Excel或者其它工具用于分析工作。除了Excel以及Access之外,Bailey-Assam的工具包还包括Python、R以及一系列用于获取数据的API。

“如果大家对于数据科学感兴趣,那么千万不要只是因为不具备计算机科学或者数学学位而阻止了自己迈向定领域的步伐。最重要的一点在于认识到数据科学属于新兴学科,因此其仍然非常灵活。大家可以首先通过网络接受数据科学课程,并借此弄清自己对这个方向是否真的抱有兴趣,”Bailey-Assam表示。“接下来,大家可以在哥伦比亚大学接受完整的教学以进一步提升自身技能水平。”

实现数据科学成功的必要认证资质

认证资质一直是IT领域中实现职业生涯发展的重要途径,而数据科学当然也不例外。

“认证分析专家(简称CAP)资质能够向雇主证明候选者具备分析领域的专业知识与从业经验,”负责运作CAP项目的运筹与管理科学协会(简称INFORMS)分析认证委员会主席兼SAP公司高级经理Polly Mitchell-Guthrie解释称。自该项目于2013年启动以来,已经有300名专业人士获得了CAP资质。

INFORMS为当前及潜在数据科学从业人员提供丰富的学习资源,包括大量分析会议摘要、出版物以及继续教育项目。报名加入、认真阅读出版物并参与各项会议能够从另一个角度帮助大家提升专业水平并找到发展机遇。

“CAP项目同时适合数学博士学位持有者以及其他非技术类背景出身的朋友,这是因为其涵盖了完整的分析流程,”Mitchell-Guthrie表示。“虽然数学家们在建模方面拥有极大的优势,但在制定计划并确定问题方面却往往存在空白。”

CAP覆盖多个领域,包括业务问题解决、分析问题结构、模型构建以及生命周期管理等等。CAP的具体活动多种多样,但全部立足于真实世界中执行分析工作所必需的技能与能力。

CAP的厂商中立特性亦非常重要。“这意味着学员们能够接触并运用那些必要的特定应用程序及/或编程技能,而不单纯从数据分析角度出发,”Mitchell-Guthrie指出。“将各类软件技能与CAP方法加以结合将造就一位强大的分析专家。”

雇主的旺盛需求亦证明了CAP资质的市场价值。一般来讲,各大企业都在积极物色拥有CAP资质的专业人士。目前已知在工作职位与工作人员招聘时强调CAP资质的组织机构包括美国体育局、埃森哲以及联邦快递等等。“强大的分析能力预计将在市场上迎来可观的人气,因此我希望能有更多从业者获取CAP资质,”Mitchell-Guthrie补充称。

毕竟作为一条历史相对较短的职业发展道路,数据科学还需要经历漫长的发展时光。

译者:核子可乐,via:51CTO

误差分位数的默示有效估计与\ 自回归时间序列的预测区间
Excel数据可视化分析方法大全
R语言实战(中文完整版)
深入浅出数据分析(中文版)

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: