1. Neural Networks相关
准备大量阅读ML的基础文章,搞清楚RNN,CNN,GAN,DQN的概念,背后模型,python程序(TF,Teano)
找一个具体问题建模实践(已经找到一个肺癌图像识别比赛)
如何把网络问题用NN建模,表征,分类,预测?
目前已经着手调研的文献有:
[1]:http://www.wildml.com/ 的博文
[2]:The Unreasonable Effectiveness of Recurrent Neural Networks
[3]:A practical guide to training restricted Boltzmann machines
[4]A fast learning algorithm for deep belief nets
[5]Feature Learning in Deep Neural Networks Studies on Speech Recognition Tasks
[6]Gradient-Based Learning Applied to Document Recognition
[7]Dropout Training as Adaptive Regularization
2. 可视化相关:
- 熟悉D3.js,Vue.js相关库,做数据可视化
3.科学学相关
希望通过利用之前PlosOne的那篇国家发展潜力的文章做作者的发展潜力
看看不同作者在主题上的兴趣分布和成就分布
识别虚假引用(定义文章的相似性的方法,基于内容和引用,是不是两人合作越多,非必要引用也出现得越多?)和引用的创新性的识别
学术撤稿的影响,对个人发表文章,机构文章,领域内影响
后面两个可能在近期做一下,文献调研暂时没有做,不过应该做过的人不多