切换为使用验证码登录
近年来,公共数据库挖掘研究持续受到学界关注,而NHANES(美国国家健康与营养调查)作为一个具有重要影响力的公共数据库,近日却引发了风波。
据Science报道,PLOS和Frontiers两大出版商已开始自动拒收绝大多数基于公共健康数据集的论文。

激增的低质量论文推动期刊拒绝数据库文章
《Science》在线新闻专栏Science Insider曾报道,令人震惊的是,在过去三年中,利用NHANES等公开数据库发表的低质量论文数量激增。其中,超过92%的论文作者来自中国。这一现象被认为与“论文工厂”和人工智能(AI)技术滥用有着密切的关联。

《Science》和《Nature》相继披露,论文工厂利用UK Biobank、FAERS、GBD、FinnGen等公共健康数据集,批量生产低质量甚至毫无科学价值的“论文”。为了遏制这一问题,Frontiers率先实施政策,要求编辑自动拒绝未经外部验证的公共健康数据集论文。自2025年5月起,该政策已导致Frontiers拒绝了1382篇基于NHANES数据集的研究。
随后,PLOS也宣布更新其评估标准,明确表示未经过额外验证的公共健康与社会科学数据库论文将自动被拒收。PLOS ONE主编艾米丽·切内特(Emily Chenette)表示,在新政策实施后的第一个月,此类论文的拒绝率从40%激增至94%。
严格的期刊审稿政策
与此同时,一些期刊采取了更为严格的措施。例如,《Expert Opinion on Drug Policy》已全面拒绝基于FAERS数据集的研究,除非为编辑邀稿。而《Scientific Reports》则采取了较为温和的策略,提醒编辑注意NHANES数据集的潜在问题,并提供具体的拒稿建议。
NHANES公共数据库概况
NHANES由美国疾病控制与预防中心(CDC)主导,是一项大型健康与营养调查项目。通过综合收集访谈问卷、体格检查和实验室检测数据,NHANES为评估美国公民的健康和营养状况提供了全方位的数据支持。这些数据涵盖人口统计学、人体测量、血液生化指标、尿液检测、生活方式、饮食、环境污染物等多个方面。由于其权威性、综合性和公开免费,NHANES数据广泛应用于探究环境、营养、行为与疾病之间的复杂关系。

NHANES发文影响因子
2025年基于NHANES数据库发表的论文影响因子主要集中在3-5分之间。

NHANES发文量
2025年1月至今,NHANES数据库挖掘论文发表总量已超3400篇,平均每月新增近380篇,相当于每日产出超过12.5篇。近年来,NHANES数据库挖掘发文量呈上升趋势。

NHANES发文期刊
2025年发文量最多的期刊为Frontiers in Nutrition,其次是Scientific Reports。

综上所述,学点小编认为NHANES作为一个开放、全面、权威的公共数据库,本应是科学研究的宝贵资源。然而,近年来低质量论文的泛滥和“论文工厂”的滥用,正在削弱其科学价值与公信力。PLOS与Frontiers等期刊的集体拒收行动,标志着学术界对这一乱象的及时纠偏,也向研究者传递了一个明确的信号:科学研究应注重深度、严谨与创新,而非数据的简单堆砌与重复挖掘。未来,公共数据库的研究若想持续发挥其价值,必须回归科学本质,强化数据验证,注重问题导向,在质量与数量之间寻求平衡。唯有如此,公开数据才能真正成为推动人类认知边界的有力工具,而不是学术功利化的牺牲品。
