Loading...
Navigation
Table of Contents

阿里味儿Life

最后一周周报

11.05到11.11这一周,是我在阿里实习的最后一周,恰好也是备战双十一狂欢节的一周。回首整个实习期间,我所做的工作主要包含以下几块:

  • 了解和学习RNN,CNN,Attention,Session-based Recommendation等相关知识,研习相关paper;(7-8月)
  • 在Yoochoose公开数据集进行离线实验,测试RNN,RNN + Attention,RNN + CNN等多个模型的效果。记录实验结果并和线上手淘场景的结果对比,并进行汇报。在此期间,发现和修正了一些训练模型时候的小问题,如TF的Feature column的哈希碰撞问题,Sampled softmax在分布式情况下时的模式选择问题;(7-8月)
  • 熟悉PAI-TF,ODPS,OSS等工具的使用,根据平台的特点编写可以协同train和test的distributed run结构,方便进行离线实验;(8-9月)
  • 提出将用户临近k个Session融入当前Session推荐的想法,并在LastFM公开数据和手淘数据进行离线实验,不断优化网络模型和参数,大概完成一篇论文初稿的撰写。(9-10月)

主要收获

  • 从模型层面和代码层面对Self attention、Transformer、RNN和CNN等高级NN模型进行了入门和熟练掌握;
  • 对序列问题(包括序列推荐以及机器翻译)有了更为深刻的理解;
  • 对使用分布式TF训练/预测模型,集团的ODPS等工具有了更熟练的掌握;
  • 最后并同等重要的一点是,遇到了组里各位很nice的同事;周会上听到了很多有意思的分享,吃到了好多次水果;对西溪园区更加熟悉和习惯: 迈志豪烤鱼,乐融,8号楼小邮局,幸福大巴,双十一历史,搜索十周年大会这些都历历在目。

主要贡献

  • 协助deep match小组将线上的模型迁移到线下来,在公开数据集进行实验并分析,在这过程中发现了很多值得注意的点;
  • 针对Session-based Recommendation场景,受阿里妈妈的Diean模型启发,创新性地提出融合用户最临近的Session行为来帮助Session推荐,手淘数据的线下/线上实验初步结果证明了这种做法的有效性。

主要遗憾

  • 没有能想出更创新且有效的模型;
  • 7月和10月期间学校事情比较繁杂,来回折腾花了不少时间;
  • 没有能和马老师@马云(I0001)合影。

总的来说,对于应届生来说,能来到阿里,来到搜索事业部实习,我认为是一件非常荣幸和值得骄傲的事情。首先非常非常感谢福豆师兄对我在模型,论文,职业发展以及其他方面上的悉心指导;感谢deep match小组悟爷,夜话,梦雪,与你们共事非常happy;感谢推荐赋能小分队的干哥,二,轶星,阿町,智在技术上和生活上的各种指导和帮助;感谢铁总和芍总默默为大家提供资源,带领团队不断进步;感谢芍药team其它很多同学的帮助和支持,这里就不一一列举了;感谢大家的水果以及梦雪的牛板筋,给生活增添了很多色彩.

马老师说,阿里要做102年,因此公司里也有了百阿百技这样的活动。我没有参加过百阿百技,但我觉得一个公司要想做一百年,想要成为一家伟大的公司,其中最重要的一点就是公司要始终做正确的事,即除了赚钱以外,要懂得为人类谋福祉。大到电子商务和移动支付,小到手淘购物车推荐,都让我感受到了技术的应用价值,感受到这些场景实实在在地方便了人们的生活,感受到做这些事情充满意义。然而有些遗憾的是,由于一些原因没有能留在阿里。以后如果有机会的话,希望能再来这里工作,希望搜索和芍药team能一直走下去,越来越好!

再见,阿里味儿~


阿里味儿

放一些2018年双十一相关照片

距离双十一还剩2天2小时2分2秒 11月11日11点11分 双十一 冲印的一些照片 双十一当晚的西溪园区 CEO逍遥子(张勇)来给大家打气 备战双十一提供的零食 零食:单身狗粮 组内合影 组内合影 晚上12点后的夜宵

Last updated on Jul 07, 2020.