这是一个看论文看到想吐的夜晚(2022/03/29), 我再一次浏览着我Zotero中凌乱的目录树… 猛然想到, 我这几年到底看了多少文献了? 邮件导出…我自己都惊了… 561个文献条目, 419篇pdf下载论文… 真的… 如果我当年直博, 估计都不会看这么多论文.
于是我又只要不是工作都有点兴趣的… 简单捣鼓了一下我看的这些论文的信息.
捣鼓步骤
- 使用Zotero导出文献目录为
ris
文件 - 使用
rispy
解析ris文件为数据框, 保留文献类型, 作者, 入库年份, 摘要, 刊发杂志的信息. - 保留文献类型为杂志论文的条目
- 使用
wordcloud
对作者, 刊发杂志构建词云 - 将文献摘要做字符串合并后, 使用
wordcloud
自行分词并构建词云 - 对文献的入库年份做柱状图
大概结果见下:
作者词云
对图形上看得到比较显眼的几位作者进行下简单的回顾:
Griffith Malachi, Griffith Obi L.: 其中两位比较显眼的Griffith是双胞胎, 来自Griffith Lab, 该实验室是专门主攻生物信息技术在癌症各方面应用的. 他们开发了一系列与相关的软件/数据库.
Sette Alessandro: 来自Sette Lab, 是免疫学方面的专家. 其研究主攻的是病原体(尤其是病毒)的免疫研究. 自新冠爆发后, 参与发表的研究似乎基本都是新冠了…
Morten Nielsen: 来自丹麦技术大学(DTU)的研究者, 主攻方向应该是免疫识别相关的算法开发, 在图里显眼应该是我收录了多篇跟亲和力预测有关的研究吧, 学校的展示主页见此
Nir Hacohen: Broad Institute的研究者, 看介绍是主攻免疫方向的, 暂对该作者无特别印象
Bjoern Peters: 来自Peters Lab, 主攻方向是免疫领域的生信利用. 与前面的Sette Alessandro同属La Jolla Institute For Immunology
Eilon Barnea: 来自Meytal Landau’s Lab, 主攻似乎是免疫肽的计算和实验识别?
Arie Admon: 来自Arie Admon Lab, 主要研究领域是蛋白组学, 应该是我收录了一些质谱鉴定相关的文章吧…
Michal Bassani-Sternberg: 肿瘤生物和肿瘤免疫学的专家, 看介绍好像是以质谱为主要技术手段的?
Anthony Purcell: 看介绍, 研究方向是生信在肿瘤免疫, 自体免疫疾病上的应用
Anne Searls De Groot: EpiVax的联合创始人. 名字会这么大… 应该是当时查阅的他们公司的文献里都有他吧…
Ugur Sahin: BioNTech的CEO… emmm, 也是查阅公司文献时带进来的应该
Catherine J Wu: 主攻新生抗原领域的研究者, 最近被塞过好几篇他主导的研究结果文献… 另外这位也有协助Broad Institute进行抗肿瘤免疫相关的研究
刊发杂志词云
杂志上…果然还是以生信的为主, 然后因为应用方向的问题, 生物技术和免疫技术也有一大堆的样子…
摘要词云
摘要词里大大的肽, 新生抗原, T细胞… 已经很明确的说明近几年的工作方向了…
入库年份统计
至于入库年份的统计…很明显能看出我为很么最近觉得看文章看得想吐了…
以上~