最近,我们看到学术稿件中降低语言相似度的需求日益增加。这主要是因为越来越多基于人工智能的软件平台被用于检测学生和研究人员提交的作品与既有发表文本之间的相似性。

这些工具如何运作?

两个最常用于检测稿件相似性的软体平台是 TurnitinCrossref/iThenticate

Turnitin 更常用于评估学生的课程作业和论文。该软件会将稿件与大型在线学术出版物数据库,例如文章、书籍、网站和论文进行交叉检查,并将识别出的任何相似内容标记为潜在的抄袭行为。

(来源:https://www.apu.apus.edu/area-of-study/education/resources/how-does-turnitin-work/

Crossref 更常被研究人员和学术出版商使用。其相似性检查服务基于 iThenticate 工具,该工具最初由 Turnitin 开发,运作方式类似,用于检测提交文件与大型在线出版物数据库中作品之间的潜在相似性。

(来源:https://www.crossref.org/services/similarity-check/

什么是相似度分数,如何计算?

有些人可能会认为,相似度分数表示论文中被抄袭内容的百分比。这个理解看似合理,但过于简化,也并不准确。根据 iThenticate 关于其界面生成的相似度报告的用户指南:

「相似度分数仅仅是提交文件中与其他来源匹配的文本百分比」

换句话说,一篇论文获得较高的相似度分数,并不必然意味着其中存在抄袭。

根据 iThenticate 的说法,「提交的文件与我们数据库中的某些内容匹配是完全正常的」。用户指南建议作者和出版商仅将报告作为审查期间的起点,并应运用合理判断来确定是否确实存在学术不端行为。

当提交文件进行相似性检查时,长篇文件可能仅因文本量较大,以及常用术语和表达结构不可避免地重复而获得较高分数。

此外,文内引用和参考文献列表如果直接从来源复制到文件中,在与文献数据库进行交叉检查时,也会被自动标记为「相似」。

(来源:https://guides.ithenticate.com/hc/en-us/sections/22768794980749-The-Similarity-Report

作者应该担心吗?

AsiaEdit 经常收到协助作者处理高相似度分数的请求,如下图所示。

我们发现,这些分数大多来自许多小的、零散的匹配项,也就是相似度分数为 1% 或更低的匹配项,而非真正值得关注的大段相似内容。

这些报告中标记的大部分实例是常见模型和理论的名称。例如,一份提交给我们审查的稿件中,「健康信念模式 the health belief model(HBM)」和「技术接受模式 the technology acceptance model(TAM)」被标记为与其他文献相似的内容。

许多其他实例涉及技术性描述。例如,「我们以 x 轴为基准」或「组织切片通过梯度乙醇系列脱水」这类表述几乎没有太多替代表达。

还有一些匹配项涉及常见措辞,例如「本研究通过提供……为文献作出贡献」,这类表达被标记为与其他已发表作品中的语言高度相似,甚至包括不可避免的短语,如「和」或「由于」。

在我们审查的一份此类报告中,23% 的总分来自近 400 个离散「相似」单位的累计结果,其中没有任何一个超过 1%,大多数远低于 1%,通常可视为可忽略的匹配。

AsiaEdit 如何提供协助?

我们会审查相似度报告及相关文件,并提供摘要报告提交给审稿人或出版商,在适当情况下协助反驳抄袭指控。

我们也可以提供保证或证明,说明您的文件已经过检查。

如果您想讨论本文中的任何问题,或有文件希望我们检查,请通过 cs@asiaedit.com 与我们联系。

关于我们 > 最新消息及活动 > 为什么我的论文被标记为抄袭?!深入探讨相似度降低
为什么我的论文被标记为抄袭?!深入探讨相似度降低
2026-06-09

最近,我们看到学术稿件中降低语言相似度的需求日益增加。这主要是因为越来越多基于人工智能的软件平台被用于检测学生和研究人员提交的作品与既有发表文本之间的相似性。

这些工具如何运作?

两个最常用于检测稿件相似性的软体平台是 TurnitinCrossref/iThenticate

Turnitin 更常用于评估学生的课程作业和论文。该软件会将稿件与大型在线学术出版物数据库,例如文章、书籍、网站和论文进行交叉检查,并将识别出的任何相似内容标记为潜在的抄袭行为。

(来源:https://www.apu.apus.edu/area-of-study/education/resources/how-does-turnitin-work/

Crossref 更常被研究人员和学术出版商使用。其相似性检查服务基于 iThenticate 工具,该工具最初由 Turnitin 开发,运作方式类似,用于检测提交文件与大型在线出版物数据库中作品之间的潜在相似性。

(来源:https://www.crossref.org/services/similarity-check/

什么是相似度分数,如何计算?

有些人可能会认为,相似度分数表示论文中被抄袭内容的百分比。这个理解看似合理,但过于简化,也并不准确。根据 iThenticate 关于其界面生成的相似度报告的用户指南:

「相似度分数仅仅是提交文件中与其他来源匹配的文本百分比」

换句话说,一篇论文获得较高的相似度分数,并不必然意味着其中存在抄袭。

根据 iThenticate 的说法,「提交的文件与我们数据库中的某些内容匹配是完全正常的」。用户指南建议作者和出版商仅将报告作为审查期间的起点,并应运用合理判断来确定是否确实存在学术不端行为。

当提交文件进行相似性检查时,长篇文件可能仅因文本量较大,以及常用术语和表达结构不可避免地重复而获得较高分数。

此外,文内引用和参考文献列表如果直接从来源复制到文件中,在与文献数据库进行交叉检查时,也会被自动标记为「相似」。

(来源:https://guides.ithenticate.com/hc/en-us/sections/22768794980749-The-Similarity-Report

作者应该担心吗?

AsiaEdit 经常收到协助作者处理高相似度分数的请求,如下图所示。

我们发现,这些分数大多来自许多小的、零散的匹配项,也就是相似度分数为 1% 或更低的匹配项,而非真正值得关注的大段相似内容。

这些报告中标记的大部分实例是常见模型和理论的名称。例如,一份提交给我们审查的稿件中,「健康信念模式 the health belief model(HBM)」和「技术接受模式 the technology acceptance model(TAM)」被标记为与其他文献相似的内容。

许多其他实例涉及技术性描述。例如,「我们以 x 轴为基准」或「组织切片通过梯度乙醇系列脱水」这类表述几乎没有太多替代表达。

还有一些匹配项涉及常见措辞,例如「本研究通过提供……为文献作出贡献」,这类表达被标记为与其他已发表作品中的语言高度相似,甚至包括不可避免的短语,如「和」或「由于」。

在我们审查的一份此类报告中,23% 的总分来自近 400 个离散「相似」单位的累计结果,其中没有任何一个超过 1%,大多数远低于 1%,通常可视为可忽略的匹配。

AsiaEdit 如何提供协助?

我们会审查相似度报告及相关文件,并提供摘要报告提交给审稿人或出版商,在适当情况下协助反驳抄袭指控。

我们也可以提供保证或证明,说明您的文件已经过检查。

如果您想讨论本文中的任何问题,或有文件希望我们检查,请通过 cs@asiaedit.com 与我们联系。

分享:

发布您的评论

*

*

*

*

您的日程,我们最关切

免费获取各种不同处理时间价格的报价。