抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

这是一个看论文看到想吐的夜晚(2022/03/29), 我再一次浏览着我Zotero中凌乱的目录树… 猛然想到, 我这几年到底看了多少文献了? 邮件导出…我自己都惊了… 561个文献条目, 419篇pdf下载论文… 真的… 如果我当年直博, 估计都不会看这么多论文.

于是我又只要不是工作都有点兴趣的… 简单捣鼓了一下我看的这些论文的信息.

捣鼓步骤

  1. 使用Zotero导出文献目录为ris文件
  2. 使用rispy解析ris文件为数据框, 保留文献类型, 作者, 入库年份, 摘要, 刊发杂志的信息.
  3. 保留文献类型为杂志论文的条目
  4. 使用wordcloud对作者, 刊发杂志构建词云
  5. 将文献摘要做字符串合并后, 使用wordcloud自行分词并构建词云
  6. 对文献的入库年份做柱状图

大概结果见下:

作者词云

作者词云

对图形上看得到比较显眼的几位作者进行下简单的回顾:

  • Griffith Malachi, Griffith Obi L.: 其中两位比较显眼的Griffith是双胞胎, 来自Griffith Lab, 该实验室是专门主攻生物信息技术在癌症各方面应用的. 他们开发了一系列与相关的软件/数据库.

  • Sette Alessandro: 来自Sette Lab, 是免疫学方面的专家. 其研究主攻的是病原体(尤其是病毒)的免疫研究. 自新冠爆发后, 参与发表的研究似乎基本都是新冠了…

  • Morten Nielsen: 来自丹麦技术大学(DTU)的研究者, 主攻方向应该是免疫识别相关的算法开发, 在图里显眼应该是我收录了多篇跟亲和力预测有关的研究吧, 学校的展示主页见此

  • Nir Hacohen: Broad Institute的研究者, 看介绍是主攻免疫方向的, 暂对该作者无特别印象

  • Bjoern Peters: 来自Peters Lab, 主攻方向是免疫领域的生信利用. 与前面的Sette Alessandro同属La Jolla Institute For Immunology

  • Eilon Barnea: 来自Meytal Landau’s Lab, 主攻似乎是免疫肽的计算和实验识别?

  • Arie Admon: 来自Arie Admon Lab, 主要研究领域是蛋白组学, 应该是我收录了一些质谱鉴定相关的文章吧…

  • Michal Bassani-Sternberg: 肿瘤生物和肿瘤免疫学的专家, 看介绍好像是以质谱为主要技术手段的?

  • Anthony Purcell: 看介绍, 研究方向是生信在肿瘤免疫, 自体免疫疾病上的应用

  • Anne Searls De Groot: EpiVax的联合创始人. 名字会这么大… 应该是当时查阅的他们公司的文献里都有他吧…

  • Ugur Sahin: BioNTech的CEO… emmm, 也是查阅公司文献时带进来的应该

  • Catherine J Wu: 主攻新生抗原领域的研究者, 最近被塞过好几篇他主导的研究结果文献… 另外这位也有协助Broad Institute进行抗肿瘤免疫相关的研究

刊发杂志词云

刊发杂志词云

杂志上…果然还是以生信的为主, 然后因为应用方向的问题, 生物技术和免疫技术也有一大堆的样子…

摘要词云

摘要词云

摘要词里大大的肽, 新生抗原, T细胞… 已经很明确的说明近几年的工作方向了…

入库年份统计

入库年份统计

至于入库年份的统计…很明显能看出我为很么最近觉得看文章看得想吐了…

以上~

评论

留下友善的评论吧~