查看原文
其他

201907:月度总结与计划

机智的叉烧 CS的陋室 2022-08-08

网评《哪吒》好不错,这首主题曲感觉挺好的。

【月度总结】

每个月一篇,总结这个月,并且规划下个月。

往期回顾:

懒人目录

  • 公众号总结

  • 学习总结

  • 碎碎念

  • 次月计划

公众号总结

这个月一共有15篇文章,其中有9篇原创,自我感觉还是比较满意的哈哈,写一篇原创基本上都要2小时以上,真的不容易啊。我们来简单过一遍这几篇原创吧。

NLP.TM | Keras做基本的文本分类:这是一篇做文本分类的文章,与前一篇 NLP.TM | tensorflow做基础的文本分类 是姊妹篇,在用相似的文本分类方法下,用不同的框架实现,这篇是用keras,keras是一个经过包装之后的框架,内核在文章中用的tensorflow,keras的有点优点在文章中体现的非常明显。

NLP.TM | 命名实体识别基线 BiLSTM+CRF(上) 和 NLP.TM | 命名实体识别基线 BiLSTM+CRF(下):这两篇讲的是命名实体识别问题以及目前比较重要的基线模型BiLSTM-CRF,上篇简单介绍了原理并给与了资料,下篇则重点在于代码实现,代码量比较大,不过实现的效果初步看起来还行,最后有一些个人讨论,可供大家思考。

NLP.TM[15] | 短文本相似度-CNN_SIM:一篇讲文本相似度的文章,这里重点讲了自己初步了解这个领域下看到的一篇非常经典的内容,里面对问题的抽象非常值得借鉴,同时其建模方法中sim层也非常有意思。

NLP.TM[16] | SIGIR2019: 深度NLP在搜索系统中的应用:一份报告的笔记,讲述在搜索领域中nlp的使用,这块的使用虽然比较专精,但是也从侧面论证一个思路,NLP并非一个鸡肋的方向,其实有非常广阔的应用空间,NLP是怎么用的在这些领域的,其实这篇文章能给与一些思考,NLP本身虽然是一个科研的方向,但是在现实应用中其实同样有很大意义。这篇文章既是NLP.TM下的第16篇文章,也是R&S下的第17篇文章。

R&S | 手把手搞推荐[6]:回顾整体建模过程:手把手搞推荐到达这个阶段初步完成了一个基线模型的讨论,同时在之前协同过滤的系列文章基础上,已经能够建立一个简单的推荐系统,但是现实肯定不止如此,后续有更多方法敬请期待!

【秋招福利】带你找到秋招组织带你飞:我和其他博主一起开了一个秋招群,有需要可以加入,OPPO的提前批已经结束,但是正式批还在火热进行,大家把握机会啦。

我的半年总结:阅读量也不低,看来大家喜欢哈哈,这篇主要讲我2019年上半年做的事情,做了一个自己的总结吧,作为自己和大家的激励。

我从研究生生活中得到的经验:没想到这篇文章获得了我开号以来的最高阅读量,也是我首次阅读量破千,这篇文章我写的很认真,大家能获得收获也是一件很好的事情,但是在此提醒大家,经验看得爽是一方面,如果真的觉得有道理,那就自己要开始动手做,且坚持做下去。至于类似的经验文章,既然大家喜欢,后续有想法我就更新吧,大家还有什么需求可以和我沟通,我安排排期。

提出推荐和广告,另外还有两篇转发文,如果是转载文,我都会在文章前面加上我对文章的评论,也让大家能够理解我转发的理由,真的是好文章我才会推荐和转载哟。

学习总结

这个月估计是我近期最放松的一个月,没有毕业和就业压力,我的选择是学习+放松吧。我主要有这些方面的收获:

  • 由于后续工作需要,6月+7月份的上半月c++基础过了一遍,写的能力可能还不够,但是看感觉没什么大问题。

  • 《算法导论》到21章,到了图论之前,感觉前面几张难度好大,读起来不舒服,推进很慢,但是后面图论感觉自己能稍微轻松一点了。

  • 《特征工程入门与实践》看完,收获不小,这本书感觉指的买来看吧,特征工程的书不多,主要是技巧很零散缺失不好写,很多时候经验,但是这本书非常系统地把东西告诉你,基本的有,复杂高级的也有,我会挑着和大家分享。

  • 这个月的学习重点放在了NLP的进阶上,之前自己在文本分类上做过很多尝试也有了一些经验,但是命名实体识别、文本相似度、预训练模型等问题上还不太了解,这个月算是慢慢不回来了,算不上深入,但是基本的思路和基线方法已经有了初步了解。

  • 重点看了几个技术分享博客,主要是算法在搜索场景下的应用,包括美团的、Linkedin等,我慢慢和大家分享。

  • c++的makefile一块做了初步了解,后面可能在自动化构建打包方面可能还要学点,算法工程师,算法固然重要,但别忘了还要是工程师。

  • 公司安排入职前要看的几本书,《谈美》、《批判性思维工具》、《高效能人士的7个习惯》,完成。

  • 写论文,嗯…,又交给老师一稿,预计是投稿版本了,不过,还有一篇正在手里修改,预计过几天完成,毕了业还在写论文真不容易啊哈哈哈。

  • 游了一趟杭州,趁着还没降温,很舒服。杭州的小伙伴抱歉没有找你们哈,怕打扰你们影响你们工作生活学习了,所以我们悄悄的来悄悄地走。

碎碎念

说这么几点东西吧。

  1. 看到有2篇经验文的阅读量很高,分别是半年总结和研究生经验,想必很多人都看了,感谢大家的支持,能对大家有帮助当然就更好了。可是另一方面,我也在担心,经验文看完觉得热血沸腾,但是事后很多时候没做到,或者做到了但是没有坚持,其实这个相当于没用,大家共勉吧。

  2. 毕业之前和导师加上导师门下的同学一起吃了一顿饭,和大家聊天的时候,我想到一句话,也在这里和大家分享——"不要错把自己在平台的成功当成是自己的成功"。我们可能凭借自己实力上了一个比较好的平台,这个平台可能是学校,可能是某个导师的招牌,可能是一个比较大的公司,都有可能,在这个平台下自己有了更多的机会和成果,但大家一定不要轻易放松,这个平台不是你自己,你要时刻小心,哪天你没了这个平台,你是否还是你,你是否还能获得你目前拥有的一切。因此,一方面我们要对这个平台心存感恩和敬畏,另一方面我们也要努力成长到自己能成为自己的舞台,我是叉烧,不止是北科大的叉烧,不仅是之前去哪儿美团出来的叉烧,现在OPPO的叉烧,说实话我从去哪儿和美团出来,到进入OPPO之前,我感受到一些落差,所以此感觉非常明显。

次月计划

下个月开始,我要加入公司培训,虽然闭关但是还是有不少业余时间,因此计划是这样的,写在这里,大家监督!

公众号上,内容这么安排,可能要调调大家的胃口了:

  • NLP.TM:这是一块主流,一方面一些重要的NLP任务,另一方面一些比较前沿的东西,我会和大家分享。

  • R&S:这是一个非常应用的领域,所以我的思路是以论文为辅,以现实应用为主,和大家谈一些大厂的方案和经验,同时尝试性地写点代码和大家分享。

  • 经验文,看时间来写吧,经验有时候真的很难倒出来,而且倒出来也有限呃呃呃。不过,科研、学习、工作方面有什么问题都可以交流。

  • 新栏目即将发布,三足鼎立将成为本公众号的完全体,前两个栏目深度有余,广度不足,此处,新栏目会在广度上补足,大家可以猜猜是什么。(我绝对是宠粉的好吧,写的方向很多,说实话真的有点不容易哈哈哈)

  • 有一个很多关注者都期待的东西,我正在筹办,未来希望能更加高效地帮到大家。

学习上,这么安排:

  • c++在工程上自己要尝试提升,另外和python的联动要尝试去了解。

  • 有机会了解一些开发工具,例如压测之类的。

  • 尽快从科研的压力中释放出来。

  • 前半月NLP仍然是重点,但是到下半月,我得开始着手了解一些和LTR(learning to rank)有关的东西了,预计又要开始啃英文书了(悄悄感谢一位前辈),中文书目前国内没有找到太合适的(各位大佬可以也给些建议啊)

  • 《算法导论》,继续推进吧,希望能在国庆之前完成这一轮的阅读(我没指望这一次就全部彻底吸收,可能会看好几轮)。

就这样吧,大家共勉。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存