WorkPlan2017

1. Neural Networks相关

  • 准备大量阅读ML的基础文章,搞清楚RNN,CNN,GAN,DQN的概念,背后模型,python程序(TF,Teano)

  • 找一个具体问题建模实践(已经找到一个肺癌图像识别比赛)

  • 如何把网络问题用NN建模,表征,分类,预测?

    目前已经着手调研的文献有:

    [1]:http://www.wildml.com/ 的博文

    [2]:The Unreasonable Effectiveness of Recurrent Neural Networks

    [3]:A practical guide to training restricted Boltzmann machines

    [4]A fast learning algorithm for deep belief nets

    [5]Feature Learning in Deep Neural Networks Studies on Speech Recognition Tasks

    [6]Gradient-Based Learning Applied to Document Recognition

    [7]Dropout Training as Adaptive Regularization

    [8]:Visualizing and Understanding Recurrent Networks

2. 可视化相关:

  • 熟悉D3.js,Vue.js相关库,做数据可视化

3.科学学相关

  • 希望通过利用之前PlosOne的那篇国家发展潜力的文章做作者的发展潜力

  • 看看不同作者在主题上的兴趣分布和成就分布

  • 识别虚假引用(定义文章的相似性的方法,基于内容和引用,是不是两人合作越多,非必要引用也出现得越多?)和引用的创新性的识别

  • 学术撤稿的影响,对个人发表文章,机构文章,领域内影响

    后面两个可能在近期做一下,文献调研暂时没有做,不过应该做过的人不多

4. Github上的合作演化,决策与创新