DPLP数据集的处理工作

DPLP是一个是由德国University of Trier的Michael Ley教授负责维护的计算机文献数据集,每个月都会有更新,数据存放在一个xml格式的文件里

http://dblp.uni-trier.de/

http://dblp.uni-trier.de/xml/

另外,清华大学的唐杰也提供了一份对DBLP以及ACM数据集的数据,已经被很好的清洗过

https://cn.aminer.org/

https://cn.aminer.org/data

https://cn.aminer.org/citation