东方瑞通IT培训与服务中心拥有十多年IT培训经验,专注中国高端IT培训与服务,是中国高端IT培训第一品牌。东方瑞通IT培训与服务中心为企业及广大学员提供全面、细致、专业的线上、线下服务,致力于为客户提升良好的职业竞争力。 最近,人们在CrowdFlower上针对Linkedin的3490个数据科学职位做了分析,并对最常出现的21个技能进行了排序。有些结果并不那么令人惊讶—SQL排在最前,而其它的结果可能是数据科学领域不断发展的领先指标。 如上所述, SQL是最常见的技能,在Linkedin发布的所有数据科学工作中占比达到了57%。 Hadoop排在第二,占比49%。 在所有数据科学的招聘信息中,python是排在第三名的技能。在CrowdFlower去年关于数据科学家哪些技能是最重要的调查中,python排在R的后面。但在本次招聘信息的调查中,python作为数据科学的一项关键性技能占比达到了39%。相比之下,R是32%。 相比R来说,为什么现在越来越多的雇主正在寻找具备python技能的数据科学家? 设想一下,数据科学家80%的时间花费在数据清理和数据准备上,而只有20%的时间是用来做分析。这或许可以解释python突然出现的原因。
由于数据科学更多的是做数据清洗和准备,python正变得越来越重要。它无疑是将数据整理成适合做分析的数据格式最好的语言”。 事实上, Java排在第四位让人有点摸不着头脑。因为Java本身不是数据科学所要求的掌握一门语言,当你在java中写Hadoop的时候,它的高配就显得有道理了。其它跟Hadoop相关的工具都排在前10,包括Hive(31%),MapReduce(22%)和Pig(16%)。 对于这份CrowdFlower从Linkedin编辑过来的职位列表,多少有些遗漏。Apache Spark,在上面给出的数据科学技能要求中没有出现过。Scala也没有出现过,它是在Spark框架内处理数据的主要途径之一。 Spark和Scala可能是数据科学的未来。但不是每个数据科学项目或团队都需要走在技术的最前沿才能实现他们的大数据成果。 这份CrowdFlower列表中包含了许多知名的数据分析工具,包括SAS(占比16%),SPSS(10%),Matlab(10%)和Stata(占比3%)。 不是每个人都同意“数据科学”或“数据科学家”应该做什么以及应该掌握什么样技能的定义。事实上,一些人反对使用术语“科学”,而宁愿用诸如“应用统计”的短语。 想了解更多IT资讯吗?持续关注东方瑞通官方微博(东方瑞通IT培训与IT服务),小编为您分享更多精彩最热资讯。
|