某个宁静的下午, 我带着一个急需解决的问题或者困惑去 Google Scholar 上查阅文献, 但是我在阅读过程中不断点击正在阅读的论文的参考文献链接, 然后继续阅读这些文章的引用论文, 无休无止, 很快我发现我想了解的这个问题所在领域是一个深不可测的海洋, 需要用一生去研究才可能有所作为, 因此很快我变得不知所措, 对阅读论文这件事感到无比焦虑、惶恐, 那么你在做研究时是否碰到类似的问题, 又有什么办法应对这种感觉呢? 所以“如何高效阅读论文”对于刚入门的研究人员来说, 是一个永恒的问题 数学 数学是一篇文献的基本要素之一, 并且是有限的, 学会如何拆解他, 并理解和解释, 这些东西是不变的. 综述 阅读综述: 在40-60页的综述文章中, 你通常能够以一种优美、整洁、结构化、条理清晰的方式获取100-200篇论文中的重要信息。 当你阅读了2-3篇最近(过去5年内)的综述论文后, 你会发现三点: 总是被引用的论文; 其具体工作听起来很酷或很相关的作者; 你感兴趣的子领域中相对较新的进展, 以及关于这些主题的值得注意的论文。 一旦有了这三点, 那么你就很清楚接下来该读什么, 为什么读, 以及读的顺序了。 略读 最重要的是, 你要回答一个具体的问题。提出这样一个问题, 可以帮助你在一分钟内确定这篇论文是否包含答案。 至少以粗略的方式阅读各种论文是件好事, 因为即使你不了解如何实现这些论文, 你也会知道有这样的方法/想法存在 , 并且当有机会或当它与你的研究相关性很大时, 你可以回过头来深入阅读。将这些论文视为工具箱中的可能有用的工具就行。头脑里的关键字积累是很重要的. 如果你能在5分钟内意识到一篇论文可能不是你现在需要学习的东西, 漂亮!这样你只浪费了5分钟的时间就可以进行下一步操作了。 精读 随手列出问题清单, 一定要抵制立即查找你遇到的不理解内容的冲动! 并在获得答案时写下答案, 仅在读完论文之后, 才去查阅里面的知识点 再怎么强调都不为过的是: 一定要确保你在阅读的同时进行输出. 哪怕只是在白纸上写写画画。只要确保将相关的思想联系在一起, 并跟踪这些思想的准确引用即可。对关键概念做一点文献笔记很有必要, 当你为了找到一个准确的引用需要回顾1-3年前读过的论文时, 你会发现将两个关键思想联系在一起很有帮助。 慢慢地, 随着你的进步, 你将开始了解更多, 并且由于你已经积累了框架, 很多让你早期感觉困惑的知识点开始变得不言而喻。对于我来说, 很多时候我会浏览论文中的公式。因为人们的写作风格和某些单词背后的含义含糊不清, 但是公式是清晰的。

Continue reading

背景 pubchunks 的目的是从XML格式的学术文章中获取部分数据。我们不需要了解XML及其所有的格式原理。只需知道我们的文件或XML字符串在哪里以及我们想要每篇文章的哪些部分。然后用户可以组合这些部分并做我们希望下游的任何事情; 例如,分析文本结构 pubchunks中的函数 两个主要功能是: pub_chunks():获取XML部分 pub_tabularize():强制输出pub_chunks()到data.frame中 pub_guess_publisher():从XML文件或字符串猜测发布者 pub_sections():部分pubchunks知道如何处理 pub_providers():提供者(即发布者)pubchunks知道如何明确处理 支持的出版商 elife plos elsevier hindawi pensoft peerj copernicus frontiers f1000research 支持提取的部分有: Front - 发布者,期刊和文章元数据元素 Body - 文章的正文 Back - 文章的背面,致谢,作者贡献,参考文献 Title - 文章标题 Doi - 文章doi Categories - 发布商的类别,如果有的话 Author - 作者 Aff - 隶属关系(包括作者姓名) Keyword - 关键字 Abstract - 文章摘要 Executive_summary - 文章执行摘要 Refs - 参考文献 Refs_dois - 参考dois - 如果有的话 Publisher - 发布者名称 Journal_meta - 期刊元数据 Article_meta - 文章元数据 Acknowledgments - 致谢 Permissions - 文章权限 History - 日期,收到,出版,接受等 安装 #install.

Continue reading

Author's picture

Jixing Liu

Reading And Writing

Data Scientist

China