目前,大家在使用问答大模型如DeepSeek、Chatgpt等来写论文时,会发现插入的参考文献打不开或根本不存在的情况;另外DeepSeek、Chatgpt扩写的内容如一些流行病学数据无法给出准确的“出处”,这对于严谨的科研写作来说显然是不够的。
那么,对于这种情况,我们该如何应对呢?
01痛点观察
大语言模型的固有缺陷主要体现在以下几个方面:
(1)对于未接入专业文献数据库的模型而言,其文献生成过程存在显著的不确定性,类似于"随机抽选"的结果,难以保证内容的准确性和可靠性。
(2)在学术研究领域,模型输出存在三个关键性风险:
◆ 作者与期刊信息匹配错误,出现张冠李戴的情况
◆ 论文标题与关键词对应关系错乱,语义逻辑失当
◆ DOI等学术标识符生成缺乏依据,存在虚构编造现象
02解决方案
指令约束法:设置三重验证机制
为确保学术研究的严谨性,在使用AI工具进行文献检索时,可以通过以下流程:
"请您以「XX领域」资深研究者的身份,协助检索近五年(2018-2023年)收录于「XX数据库」、被引量超过「XX次」的「XX主题」相关文献。
检索结果需完整包含:
◆ 文献标题
◆ 作者信息(含通讯作者标识)
◆ 发表年份
◆ 来源期刊/出版社全称
◆ DOI编号(如适用)
若不确定文献是否存在,请标注▲符号并注明不确定的具体原因;无法确认真实性的文献将自动跳过,以确保最终输出的所有文献均经过真实性验证。"
工具辅助法:双引擎交叉验证
需要注意的是,指令约束法的有效性在很大程度上取决于模型对学术规范的理解程度。尽管通过设置时间范围、被引量等参数可以在一定程度上降低虚假文献的产生概率,但任何未接入权威文献数据库的AI模型(包括ChatGPT在内),在文献生成过程中都存在虚构内容的潜在风险。
基于此,我们建议采取以下措施来有效防范AI模型编造文献:
◆ 明确限定检索条件
◆ 要求提供完整的文献元数据
◆ 建立二次验证机制
◆ 设置不确定性标识
◆ 建立人工审核流程
通过「探索GPT」→ Consensus,进一步减少虚假文献的生成:
推荐提示词
“你是「XX领域」的资深教授,请检索2020-2024年《XX期刊》发表的「XX主题」相关文献。
要求:
1.中英双语对照
2.摘要包含研究方法关键词
3.排除第一作者重复发文
4.附Scopus被引统计”
通过「探索GPT」→ SciSpace进行验证,要求给出真实文献,并确保文献中包含DOI号。
人工质检法:最后一道防线
尽管通过以上方法可以有效减少AI模型虚构文献的情况,但仍然建议在生成文献后进行人工审核,避免出现"查无此文"的情况。
主营项目
1. 动物实验
动物饲养、疾病造模、行为学检测、心功能、无创血压、血常规、全自动生化检测等
2. 细胞实验
CCK8/MTT、原代细胞分离、流式细胞实验、细胞划痕、侵袭、迁移、EDU染色、转染、稳定株
3. 分子生物学
PCR检测、荧光定量PCR、绝对定量PCR、端粒酶长度、pull down、双荧光素酶、SSR、SNP检测等
蛋白实验
WB、Co-IP、酵母双杂
5. 病理实验
HE染色、免疫组学、电镜
6. 生理生化实验
肝肾功能、抗氧化、免疫反应等生理免疫指标;动植物营养指标、微量元素、重金属、酶活等。
7. 多组学实验
基因组、转录调控、蛋白组、代谢组、微生物多样性、宏基因组、生信分析
8. 整体课题实验
方案设计、整体实验交付、标书写作、论文润色、协助投稿
康旭禾生物提供包括动物实验、细胞实验、分子实验、病理实验、流式检测实验及论文翻译、润色、投稿辅助等相关的各项服务。
联系方式:15579126092
公司官网:http://consurebio.com/
公司地址:江西省南昌市南昌县小蓝VR产业基地D座2楼