目的: 双聚类算法和突发检测算法在探测学科前沿和知识基础方面都体现出了一定的可行性,本课题拟通过对两种算法得到的研究前沿和知识基础的比较,总结双聚类算法和突发检测算法的不同思路及优缺点,以便在今后的研究中扬长避短,更好的发挥各算法的作用,为以后学科前沿和知识基础的探测提供有益参考,并提出观测科学活动特征的新角度,将双聚类算法推广到各领域的学科发展评价中。 方法: 利用“h-index”为主题字段在Web of Science中检索2005-2013年间的数据,获得相关文献记录。将数据记录全部下载后,首先对h指数研究领域进行双聚类分析,即利用BICOMB软件对数据进行引文抽取,构建高被引-来源文献共现矩阵,并通过gCLUTO软件对数据进行双聚类分析,获取知识基础和学科前沿。再利用CiteSpace软件对h指数研究领域进行突发算法检测,探测h指数研究领域的研究前沿和知识基础。最后比较两种方法得到的结果并进行评价。 结果: 在探测h指数研究领域前沿方面,两种算法存在着一定的一致性,均发现“利用‘ISI Web of Knowledge’等引文数据库研究h指数”和“利用h指数评价科学出版物及科学产出”的研究前沿。在对聚类进行自动标注方面,双聚类算法提供的描述性特征与聚类内容更为相关,突发检测算法利用突发词标注聚类,由于存在着噪音文献,不能很好地与前沿和热点联系起来。在探测h指数研究领域知识基础方面,双聚类对高被引文献的聚类更为结构化和清晰。在识别h指数研究领域动态发展,突发检测算法表现出了优越性。 结论: 通过对两种算法得到的研究前沿和知识基础的比较,我们发现双聚类的聚类标签更具有相关性,突发检测算法在探测学科动态发展方面更有优势,两种算法有着各自的优势,并在一定程度上互补。在今后的研究中研究者可以扬长避短,根据研究目的不同,选择不同的算法以揭示学科前沿和知识基础,也可以结合两种算法对学科结构及发展做出更全面的诠释。本研究为以后学科前沿和知识基础的探测提供了有益参考,并提出观测科学活动特征的新角度,在未来的研究中,可以尝试将双聚类算法推广到各领域的学科发展评价中。
展开▼