Professional Documents
Culture Documents
【学术评论】
近 20 年我国学术诚信研究社会网络分析
秦飞飞, 曹 娟, 钱智勇
( 南通大学 图书馆,江苏 南通 226019)
摘 要: 我国学术诚信研究起始于 20 世纪 80 年代初,
21 世纪以后越来越受到广大研究学者的关注。为了全
面了解我国学术诚信、学术规范研究,为相关研究人员提供便利,本文基于 CNKI 文献检索,采用社会网络分析方
法,
对学术诚信研究文献题录中的多种指标关系数据进行计量分析,通过高频关键词共现网络、关键词中心节点网
络、关键词相似共现矩阵、作者逐年统计频率矩阵网络分析,构建不同维度的知识图谱,发现研究热点倾向。数据
统计分析表明,我国学术诚信研究将呈现内容多元化、机构多样化以及检测机制智能化发展趋势。
关键词: 学术诚信; 学术不端; 学术规范; 学术道德; 社会网络分析; 发展趋势
中图分类号: G252 文献标识码: A 文章编号: 1007-8444( 2017) 06-0627-09 收稿日期: 2017-08-22
基金项目: 2014 年度江苏高校哲学社 会科学基金资助项目“高校图书馆学术诚信教育职能及实现研究”
( 2014SJB622) 。
作者简介: 秦飞飞,副研究馆员,主要从事信息组织研究。
国内关于学 术诚信的研究,始于 20 世纪
[1] 一、数据来源与研究方法
80 年代。于侃《科研机构的特色与拳头》 以
及梁学章的《一个需要引起注意的问题———学 ( 一) 数据来源。
[2]
术道德问题》 这两篇文章明确指出,盲目、非 在 CNKI 中国知识网络文献数据出版总库
必要地复制别人的劳动成果必将导致学术界的 中,采用高级检索方式,以关键词为检索项,分
研究成果失去价值。“学术规范”一词最早出 别以“学术诚信”“学术不端”“学术规范”“学
现在 1997 年,“学术道德”一词最早在 1998 年 术道德”等为关键词, 进行逻辑“或”组合检索,
出现 3 次,“学术诚 信”一 词 最 早 出 现 在 2002 检索起讫时间为 1997 年 1 月 1 日至 2017 年 4
年,“学术不端”一词最早出现在 2003 年。祖 月 17 日,精确检索到相关文献共11 619 篇,分
明远通过研究 2001 年—2006 年教育部发布的 别按照 被 引 和 下 载 排 序,导 出6 000 篇。将 这
各类 文 章,得 出 2000—2002 年 关 于“学 术 腐 12 000篇题录以. net 格式导入 NoteExpress,先
败”和“学术道德”论文数有较大幅度增长,而 去除重复文献, 再进行过滤器筛选处理, 最终得
2004 年前后关于“学术诚信”“学术规范”的论 到关 于 学 术 诚 信 研 究 文 献 4 887 篇,其 中 有
文数量明显上升,其他 方面关注 度下降,但 在 4 664篇期刊文章、192 篇学位论文、28 篇报纸
2006 年,“学术腐败”和“学术道德”的论文数 文章以及 3 篇会议记录。笔者对上述文献发表
量又相应增长[3]。为了全面统计与分析近 20 的年代分布、期刊分布、主题、关键词等进行了
年我国学术诚信研究文献的主要内容和发展脉 基于社会网络分析的文献计量分析。
络,本文基于 CNKI 全文数据库检索,以学术诚 ( 二) 研究方法。
信、学术不端、学术道德、 学术规范等为关键词 社会网络分析法最初是在人类学家拉德克
进行检索,从11 619 篇检索记录中选取4 887 篇 里夫-布朗对结构的关注下产生的, 20 世纪 30
题录导出,并利用统计分析工具和可视化软件 到 70 年代,越来越受到社会学家的关注,近期
进行矩阵计算、聚类分析和多种关键词共现网 的关注度增长体现在人们逐渐关注和重视“网
[4]6
络知识图谱呈现,分析得出我国学术诚信研究 络化”的快速发展。 社会网络分析指对合著
的热点和发展趋势。 网络的整 体网络 特 性、中 心 性、核 心—边 缘 结
627
Journal of Huaiyin Teachers College Social Science Vol. 39 6,
2017
表2 关键词共现矩阵( 部分)
学术不端 学术道德 学术规范 研究生 学术诚信 科技期刊 检测系统 学术期刊 学术不端行为 学术腐败
学术不端 1 0. 0036 0. 0006 0. 0038 0. 0032 0. 1406 0. 2151 0. 0206 0 0. 0044
学术道德 0. 0036 1 0. 0071 0. 032 0. 0057 0. 0017 0. 0015 0. 0038 0. 0313 0. 0289
学术规范 0. 0006 0. 0071 1 0. 0051 0. 0004 0 0 0. 0055 0. 0004 0. 0014
研究生 0. 0038 0. 032 0. 0051 1 0. 0145 0 0 0 0. 003 0
学术诚信 0. 0032 0. 0057 0. 0004 0. 0145 1 0. 0009 0. 0003 0. 0077 0. 0345 0. 0027
科技期刊 0. 1406 0. 0017 0 0 0. 0009 1 0. 3857 0. 0016 0. 0012 0
检测系统 0. 2151 0. 0015 0 0 0. 0003 0. 3857 1 0. 003 0. 0001 0. 0001
学术期刊 0. 0206 0. 0038 0. 0055 0 0. 0077 0. 0016 0. 003 1 0. 0092 0. 0034
学术不端行为 0 0. 0313 0. 0004 0. 003 0. 0345 0. 0012 0. 0001 0. 0092 1 0. 0021
学术腐败 0. 0044 0. 0289 0. 0014 0 0. 0027 0 0. 0001 0. 0034 0. 0021 1
图1 1997—2017 年学术诚信研究高频关键词共现网络
从图 1 可以看出,关键词作为图中的方块 密集程度反映了关键词之间的联系密度,左边
点,
也可称为结点,结点的位置显示该词的核心 关键词之间的连线比右边更密集。一个图的密
程度,结 点 位 置 越 居 中 表 明 该 关 键 词 越“核 度定义为图中实际拥有的连线数于最多可能拥
心”。学术不端处于中国学术诚信研究高频关 有的线数之比[9],如式( 2) 所示:
键词共现网络的中心位置,是网络中的核心结 i
D = ( 2)
n( n - 1) /2
点。结点与结点之间的连线反映了关键词之间
的共现关联,其中“科技期刊”与“检测系统”之
其中 D 表示整个图的密度,l 表示图中实
间的连线最粗,说明两者的关联性最大。线的
际拥有的线数, n 表示整个图的结点个数,该数
629
Journal of Huaiyin Teachers College Social Science Vol. 39 6,
2017
值结果在区间[0,
1]之内。在 NetDraw 中,选择 值为 2,speed 的 结 果 为 498,quality 的 结 果 为
子群菜单,通过派系生成,最大的完全子图默认 - 0. 411,说明该图的密度为 0. 578。
图2 关键词 K-核分析网络图
测系统,
在学术出版编辑领域应用广泛。
图3 2014 年关键词共现网络图
于进一步加强学术著作出版规范的通知》出台
三、近 20 年学术诚信研究热点及演变
之后,论文数量大幅度增长。2014 年是该类研
文献的数量反映了该学科领域的研究水平 究论文数量最多的一年,达到高潮。2014 年之
和发展 程 度。对4 887 篇 文 章 进 行 统 计 后,将 后虽有一定程度的下降,但仍然保持在 600 篇
1997 年至 2017 年学术诚信研究论文发表的数 左右,可见近几年诚信建设仍受到重视。
绘制成折线图 5,该图形象地显示了研究的发
展变化趋势。本研究将这 20 年的学术诚信研
究分为 起步 期 ( 1997—2000 ) 、增 长 期 ( 2001—
2011) 、蓬 勃 发 展 期 ( 2012—2017 ) 三 个 阶 段。
2000 年以前,每年的数量均小于 30 篇。2000
年开始突破 30 篇,特别是 2002 年教育部发布
《关于加强学术道德建设的若干意见》及中国
科学院党组委会议审核通过《中国社会科学院
关于加强学风建设的决定》以后,论文数量开
始有大幅度的增长。2012 年《教育部关于进一
步规范高校科研行为意见》、 新闻出版总署《关 图5 研究文章篇数年变化图
631
Journal of Huaiyin Teachers College Social Science Vol. 39 6,
2017
表4 高频期刊以及机构表
期刊名称 发文量 机构名称 发文量
编辑学报 114 《中外医学研究》编辑部 13
中国科技期刊研究 93 哈尔滨职业技术学院 13
学位与研究生教育 70 中国石油大学( 北京) 11
中国高等教育 60 中国科学技术信息研究所 9
教育教学论坛 44 西南大学教育学院 8
教育与职业 32 吉林大学 8
学术界 31 长春工程学院学报编辑部 8
科技与出版 31 华中科技大学教育科学研究院 7
科技管理研究 31 武汉大学信息管理学院 7
中国高教研究 27 西南大学教育学部 7
社会科学论坛 27 吉林大学马克思主义学院 6
黑龙江高教研究 26 北京师范大学教育学部 6
江苏高教 26 宁波大学学报编辑部 6
学理论 24 《医学信息学杂志》编辑部 6
自然辩证法通讯 23 武警学院科研部 5
现代教育科学 22 陕西科技大学思想政治理论课教学科研部 5
中国电力教育 22 《张家口职业技术学院学报》编辑部 5
研究生教育研究 22 教育部 5
黑龙江教育 22 《医药导报》编辑部 5
教育探索 21 《福建分析测试》编辑部 5
思想教育研究 21 南京师范大学教育科学学院 5
图书与情报 20 《淮海医药》编辑部 5
TI 进行统计,
在形成的数据表中抽取作者字段,
得 在 SATI 矩阵一栏中选择逐年频次统计矩阵,
到3 656个作者发文量的统计数据,
如表 6 所示。 点击矩阵生成, 产生一个 100 行 100 列、
元素取值范
表6 作者发文量( 部分) 围在[0,
1]的作者逐年频率分布矩阵,
频率分布矩阵
作者 频次 作者 频次 中元素的值为该作者在某年出现的频次, 频率计算
本刊编辑部 105 本刊 6 服从如下式( 3) ,
为作者在某年的出现频次与当年
刘丽 11 戎华刚 5 所有作者出现频次总和的比值:
王浩 10 编辑部 5
F ij
本刊讯 9 刘芳 5 R ij = n
( 3)
张意忠 9 黄成华 5 k = 1 F kj
杨玉圣 7 蔡际洲 5 其中,R ij 为频率分布矩阵元素的值,F ij 为
江新华 6 王颖 5 第 i 个词条在第 j 年的频次,F kj 为第 k 个词条
许家林 6 罗志敏 5
在第 j 年的频次, 共有 n 个词条。
赵蔚 6 汤茂林 4
阮云志 6 韩芳 4
表7 作者逐年频次统计矩阵( 部分)
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
本刊编辑部 0 0 0 0 0 0 0 0 0 0 0
刘丽 0 0 0 0 0 0 0 0 0 0. 0127 0. 0049
王浩 0 0 0 0 0 0 0 0 0 0 0
本刊讯 0 0 0 0 0 0 0 0 0 0 0
张意忠 0 0 0 0 0 0 0 0 0. 0063 0. 0127 0. 0098
杨玉圣 0 0. 25 0 0 0 0. 026 0 0. 0104 0. 0063 0. 0127 0
江新华 0 0 0 0 0 0. 013 0. 024 0. 0208 0 0 0
许家林 0 0 0 0 0 0 0 0. 0104 0 0 0. 0147
赵蔚 0 0 0 0 0 0 0 0 0 0 0
阮云志 0 0 0 0 0 0 0 0 0 0 0
图6 作者逐年统计频次网络图
633
Journal of Huaiyin Teachers College Social Science Vol. 39 6,
2017
635
Journal of Huaiyin Teachers College Social Science Vol. 39 6,
2017