查看原文
其他

大咖指路:机器学习人才这些方向最紧缺!

阿萨姆

资深数据科学家

在回答前,我还是忍不住吐槽一下那种简单回答“深度学习”,“大数据”,“NLP”,“机器视觉”的人。这每一个领域的小方向都多如牛毛,以自然语言处理(NLP)为例,细分有自然语言生成、自然语言理解,还有不同语言的语言模型。任何一个方向花几十年研究也不为过,只给出几个字的答案和买彩票有什么区别...


因此大部分机器学习实践者还是该脚踏实地。


盲目追逐热点很容易跌进陷阱,而巩固基础、寻找自己擅长的领域和机器学习交叉点可以帮助你在未来的就业市场变得炙手可热,成为工业界最紧缺的人才。


有了基本功只能说明你可以输出了,怎么才能使得你的基本功不是屠龙之术?必须要结合领域知识,这也是为什么我一直劝很多朋友不要盲目转机器学习从零做起。


而学生朋友们可以更多的关注自己感兴趣的领域,思考如何可以把机器学习运用于这个领域。


比如我自己对历史和哲学很感兴趣,常常在思考机器学习和其他文科领域之间的联系,也写过一些开脑洞的文章「 带你了解机器学习(一): 机器学习中的“哲学”」


而已经有了工作/研究经验的朋友,要试着将自己的工作经历利用起来。举例,不要做机器学习里面最擅长投资的人,而要做金融领域中最擅长机器学习的专家,这才是你的价值主张(value proposition)。


如果你有这些基本功和良好的领域结合能力,三年五年绝不是职业的瓶颈期,甚至十年都还太早。


科技时代虽然给了我们很大的变革压力,但也带给了我们无限的可能。技术总会过时,热点总会过去,但不会过去的是我们不断追求新科技的热情和对自己的挑战。


紫杉

Stanford University,Stanford AI组

这个问题本身是很赞的,学以致用才是最好的。

这个问题不是很好回答。前一半问题是“哪个方向”,似乎讲的是领域和研究方向,后一半问题“最紧缺人才”,又和就业有关。所以我的回答尽量把这两方面兼顾,先谈就业和工业界紧缺的人才,再说说学术界缺少的人才。


我最近被两个前辈抓到他们的创业公司做暑期实习,公司是什么最好就不说了,但除我之外还骗来了一个清华的本科生(从北京骗到了硅谷)。两位前辈一个是Sebastian Thrun(赛巴斯提安·特龙)的学生,一位是Stefano Ermon的学生,去年在AAAI拿了个最佳论文的奖。


我虽然对工业界一直都不太熟悉,但借这个机会算是好好看到了一番目前人工智能创业公司的有趣情景。虽然不一定能当做借鉴,但一些经验对目前在校或者刚离校的学生来讲也许会有帮助。


能灵活解决问题的人很缺。


在我被抓去之前,他们有另外一个名叫Daniel(丹尼尔)的研究生帮忙,丹尼尔也是一位人工智能方向的研究生。丹尼尔负责的模块是文本的聚类算法。我对聚类算法一窍不通,之前还把KNN和K-means搞混了。公司创始人Zayd(札德)告诉我,他们的文本簇群(cluster)总是有问题,丹尼尔调整聚类算法的参数已经6个月,但是根本没办法提升质量


我用了一周的时间读丹尼尔的代码(够慢了吧,完全赶不上很多国内的优秀学生),然后打开Jupyter Notebook开始一点点的做分析,最后发现丹尼尔把文本距离的算法做错了,任何从事自然语言处理的人都明白edit distance(编辑距离)的首选就是莱文斯坦距离(Levenshtein距离),就算不是做自然语言处理的,这个距离在计算机界也用的很多。但这个距离压根不存在于丹尼尔的任何代码中。然后我把这一行加入进去,代码跑了5小时,最后给札德说:我做完了,检查质量吧。


一周后,丹尼尔就被炒鱿鱼了……


然后公司的另一个创始人Russel(罗素)开始到处宣传我用了一周解决了别人六个月都解决不了的问题。(当然,丹尼尔最后找到了一份谷歌的工作,开开心心的做机器人去了)


举这个例子想说明一件事:(创业公司真是没有安全感?)要建立起在某个领域的直觉和精通。这个精通并不单单是掌握一两个(甚至是好几个)算法就可以了的。深度学习总爱鼓吹一个模型解决所有问题,但是等你真正进入公司后才发现这基本是不可能的。


基础是必须扎实的,这个基础最好是某一个领域将近20-30年的知识的积累。只会跑个LSTM是肯定不行的。


每个机器学习的领域,不论是自然语言处理、机器视觉、机器人其实都是这样的人才紧缺规律,找到自己最适合的缺口才是最重要的。这可以是能够将一个算法高度并行化,在上百块GPU上运行的工程人才,也可以是在高危领域(比如无人驾驶、医疗)保证安全第一的理论人才。这两块区域在未来的3-5年内都会急缺人才。


最后总结一下,并不是每一个人都适合这两条路,但与其是押宝于某个领域(机器人、自然语言、视觉)还不如想想在这个领域内自己要做到怎样的专精


让在这个和时间赛跑的世界里,能让算法跑得更快的永远是最稀缺的人才。


唐宇迪

复旦大学人工智能领域博士

从人才紧缺的角度来看,机器学习未来3-5年,在哪个方向容易落地,恰好这个方向又能很好的跟实际应用场景相结合,创造巨大的利润空间,那么这个市场和技术,就会导致人才的大量紧缺。


人工智能听着这么牛的一个词,到底该怎么学?这个圈子太大了,有些同学准备去做数据挖掘,计算机视觉,自然语言处理等各大领域,那是不是要学习的内容就会差别很大呢?其实不是的,我们一切都要从基础开始,其中最核心的就是机器学习了,你要做的一切都离不开它。


所以学习人工智能的第一个目标就是搞定机器学习各大算法,掌握其中各种应用案例。


再来简单介绍一下机器学习能做什么,举一个小例子,我之前特别喜欢玩梦幻西游手游(是不是勾起了一段回忆……),一顿氪金,弃坑之后它们客服经理给我打电话,说您能不能回来接着玩耍(充钱)呀,帮派的小伙伴都是十分想念……

这时候我就想为什么会给我打电话呢?每天用户流失的不下上万人吧,那肯定得挑重点客户来沟通了,其后台肯定有我们的各种数据,比如游戏时长,充值金额,战斗力等,通过这些指标就可以来建立一个模型,去预测哪些用户最有可能返回来接着充钱了!


机器学习能做的远不止这些,数据处理分析,图像识别,文本挖掘,自然语言处理,语音识别这些都是以其为基础的。现在各大公司也是越来越注重数据的价值,机器学习也就必不可缺了。


关于如何成为一个真正的机器学习工程师?


为大家总结了三位大咖的学习建议:

  • 结合自身能力和经验,用机器学习扩充自身能力和价值

  • 积累领域知识,提高灵活解决问题和协作的能力

  • 首先搞定机器学习各大算法,掌握多种案例


推荐课程,由唐宇迪老师主讲:


《10小时玩转机器学习》

原价:199元

早鸟价:2人拼团119元

(已超300人报名)


长按下方二维码报名


课程大纲



    推荐阅读:

    ▼点击阅读原文,立即学习~

      您可能也对以下帖子感兴趣

      文章有问题?点此查看未经处理的缓存