文献检索是科研工作的重器,甚至可能影响整个科研成果,在很多院校已经成为一门大学本科生的必修课。而检验是否全面掌握文献检索的考查方法,就是试着写一篇Meta分析。在研究项目开始之前,对相关文献进行综述,可以更好了解相关领域的研究热点、难点及发展前沿。
同样在工商业中,各类项目的批准都要首先准备书面提案,阐述此项目的相关背景和现状。这与文献综述有异曲同工之处,提案将直接影响项目进展和未来可期的收入。文献检索的重要性不言而喻,而科学的检索方法将帮助我们事半功倍。
适应新形势
获取信息的方式正在发生迅速转变,是为这种资源极大丰富而欢呼雀跃,还是迷失在这无尽的千头万绪中,取决于我们如何完成任务以及正确的认识有效资源。
就在不远的二、三十年前,大多数文献还是手工检索。计算机化的文献数据库搜索既昂贵又范围有限。受过专业训练的图书管理员负责大部分检索工作,研究人员可能逐条支付费用。互联网使得曾经需要半年到一年的文献搜索可以在不到一天时间内完成;全球有数千个专业数据库;软件越来越容易操作;高校或机构图书馆为各种索引购买站点许可,为在校或在职人员提供免费文献检索。
与此同时,发表的文章和期刊数量正在飞速增长,以至于研究人员会发现,即使是在相对专业的主题上,也很难跟上最新的信息。科学的文献检索不是只有百度、知网或在PubMed里敲入关键词。
文献挖掘
科学家利用文献的方式随之迅速改变,很大程度上归功于两个因素:其一是数字索引、检索和导航资源的增加;第二是本体论的出现——即语义相关术语的结构化词汇表,它以标准化的方式为知识领域建模,以方便计算任务。例如,PubMed文档检索系统中的医学主题词表(MeSH)形成了一个本体,用于索引和标注PubMed文档。它们被安排在一个层次结构中,一般的网格术语出现在顶部,更具体的术语出现在底部。此外,它们也包含关于一篇论文的核心信息,这不是仅仅从标题或摘要推断出来的。
认识到这两种趋势融合的价值,软件开发人员正努力通过自动化或半自动化的文本挖掘工具,开发出越来越有效的方法提取相关信息。它们的前景非常广阔,不仅可以定位和提取已经发表的内容,还可以帮助科学家以新的方式结合多篇论文的信息,从而产生新的假设。
如何进行有效的文献检索
通常,检索的基本步骤包括:1.分析课题、确定主题概念;2.选择检索方式和数据库;3.确定检索途径;4.编制检索策略;5.检索策略的反馈调整;6.检索结果的输出。
而常用的算符如布尔逻辑运算符是以一位生活在19世纪中期的数学家乔治·布尔命名的。大家一定非常熟悉“与”、“或”、“非”这三个逻辑符AND,OR,NOT,是计算机检索最常见的表达式。其他检索规则如字段限定、截词符、作者、期刊、日期等,通过各种规则的灵活运用可以编制出一个比较完善、符合检索要求的检索式。
检索策略通常按查全和查准两个原则进行。当检索结果太多且查准率较低时,检索式可做如下调整:(1)减少同义词或同类相关词(2)采用专指性强的主题词或自由词(3)增加限制概念,如用“AND”将它们连接(4)把检索词限定在题目、主题等主要字段(5)减少检索年限,限制文献类型、语种、出版国家等。当检索结果太少、查全率较低时,应扩大检索范围,检索式则做与之相反的调整:(1)增加同义词或同类相关词(2)降低专指度(3)减少限制概念(4)放宽字段限制(5)增加回溯年限等。
大家熟知的中文医学数据库如中国知识基础设施工程CNKI(China National Knowledge Infrastructure),万方数据库,中国生物医学文献数据库CBMdisc(China Biology Medicine disc)以及中文生物医学期刊文献数据库CMCC等均有相应的初级检索及高级检索功能,中文界面易于快速查阅掌握。
外文数据库除了我们最常用的PubMed外,还有Springer、Elsevier、EBSCO等电子全文数据库。最后,在检索过程中遇到任何问题,记得咨询图书馆的专业人士,科研人员离不开这样的优质资源。