登录  | 加入社区

黑狼游客您好!登录后享受更多精彩

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

查看: 429|回复: 0

2017 机器学习调查报告:Python 最火,R 极具潜力

[复制链接]

 成长值: 36205

8169

主题

7094

帖子

6831

现金

黑狼创办人

Rank: 12Rank: 12Rank: 12

积分
6831
发表于 2017-11-1 08:23:17 | 显示全部楼层 |阅读模式 来自 陕西咸阳
腾讯云十分钟定制你的第一个小程序>>>
数据平台 Kaggle近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle首次进行全行业调查。调查共收到超过 16000份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。
点此查阅完整报告
下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。
年龄

从全球范围来看,本次调查对象的平均年龄在 30岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是 25岁。
w2WM525b8tw5m27A.jpg
全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达 70.9% 。
Db9hS9sBVjTTbaJv.jpg
Logistic回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。
C8zUD7tTd4ltkq4X.jpg
在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对 R语言的忠诚度很高。
tnUdu9KM9S9BahN0.jpg
关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。
vX1XJ5XQgSZRDc9N.jpg
Git是他们最常用的代码共享和托管方式。
XE0bxVtF9V3t9ZRp.jpg
Dirty Data (脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在困境。
qjS1sTSSKLFgslNd.jpg
有趣的是,只使用 Python或只使用 R的都觉得他们做出了正确的选择。但是,如果你去询问那些既使用 Python也使用 R的人,推荐使用 Python的可能会是 R的两倍。
d25gB7Rt7zIQRTqm.jpg
数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。Stack Overflow Q&A、Conferences和 Podcasts是已从业者经常使用的学习平台。
j0Q2IIk40qH46021.jpg




上一篇:云烁IT服务-外企办公室IT系统建设实例!
下一篇:22岁复旦学生拿下世界深度学习竞赛冠军:50层ResNet网络
您需要登录后才可以回帖 登录 | 加入社区

本版积分规则

 

QQ|申请友链|小黑屋|手机版|Hlshell Inc. ( 豫ICP备16002110号-5 )

GMT+8, 2024-6-2 12:31 , Processed in 0.116376 second(s), 47 queries .

HLShell有权修改版权声明内容,如有任何爭議,HLShell將保留最終決定權!

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表