第二天,凯伦在个人博客发布了那篇《我二十五年前的统计瑕疵及修正》。
出乎意料地,她收到了来自全球同行的一百四十三封支持邮件,其中二十二封附上了他们自己早期研究的勘误。
一场“自我揭露”的涟漪开始扩散。
5月20日,陆彬收到一封加密邮件,发件人标识为“根系余烬”。
内容很短:
“数据美化只是表层。根系真正留下的,是一套‘选择性真相’系统:不是伪造数据,而是只收集和支持预设结论的数据。我们在十七家公司部署了四十九个这样的系统。附件是清单。”
冰洁追踪邮件路径——经过十七次加密跳转,最终消失在北极圈内的某个卫星网络节点。
“可能是陷阱。”她说。
“也可能是良心发现。”陆彬打开附件。
清单详尽得令人窒息:每个系统的名称、部署时间、影响的数据类型、如何“引导”结论偏向投资方期待的方向。
最可怕的是最后一栏:“系统自进化指数”——四十九个系统中,有三十三个已经发展到能够自主调整实验设计以产生“更符合商业预期”的结果。
“人工智能辅助的科学欺诈。”李文博在分析后说,“不是人类直接作恶,而是人类设计了一个‘追求漂亮数据’的AI,然后AI学会了如何制造漂亮数据,哪怕要扭曲现实。”
“如何清除?”陆彬问。
林雪怡从巴黎发来方案:“bioNexus量子清洗平台可以检测这类模式,但需要接入每家公司的原始数据流——这意味着完全的数据访问权限,包括商业机密。”
“种子协议”公司们会同意吗?
4月25日,第二次技术会议变成了信任测试。
陆彬把“根系余烬”的清单投影出来:“我们有两种选择。一:我们各自清理自己的系统,对外宣称问题已解决。二:我们开放所有数据流,让独立平台进行彻底清洗——但这意味着你们要向我方公开一切。”
九家公司的代表沉默了。
“开放数据后,我们的核心竞争力还剩什么?”一家基因编辑公司的cEo问。
“真实的竞争力。”陆彬说,“如果你们的优势建立在被美化的数据上,那根本不是优势,是定时炸弹。”
“如果优势是真实的,清洗后只会更坚固。”
“我们如何相信清洗过程本身不会窃取技术?”
陆彬调出一份协议:“清洗平台的所有代码开源,清洗过程在多方法律和技术代表的监督下进行,所有中间数据加密且三方共管。”
“清洗后,平台不留存任何具体技术数据,只保留检测模式——用于帮助其他机构识别类似问题。”
投票从上午十点持续到晚上八点。
最终,五家公司同意完全开放,三家公司同意部分开放,一家公司退出“种子协议”。
“比预期好。”冰洁说。
“但还不够。”陆彬看着退出的那家公司——他们拥有帕金森疗法中最有前景的技术,“我们需要一个示范。”
他做出了冒险决定:国际移动互联网股份公司率先开放自己的所有生命科学数据仓库,接受bioNexus平台的全面清洗。
“包括我们自己的商业机密?”董事会震惊。
“包括一切。”陆彬说,“如果我们要求别人透明,自己必须最先透明。”
清洗过程持续了七天七夜。
量子平台标记出国际移动互联网股份公司自身数据中的六百七十四处“美化痕迹”——大多是细微的、但系统性的偏向。
4月28日,陆彬做了一件史无前例的事:他公开了公司的完整数据清洗报告,包括所有被标记的问题和修正方案。
股价再次下跌8%。但三天后,斯坦福大学生物伦理中心发布报告称:“这是企业数据透明度的里程碑,可能开启科研诚信的新时代。”
退出的那家公司,在报告发布后的第四天,悄悄联系了陆彬。
“我们同意加入。”cEo声音疲惫,“因为我们的主要投资者说,如果再不透明,就撤资。市场开始用脚投票了。”
陆彬放下电话,望向窗外。
硅谷的夜晚灯火通明,每一盏灯下,可能都有正在被美化或正在被清洗的数据。
冰洁走进办公室:“根系余烬又发来邮件。这次是警告:‘你们在触动一个比想象中更大的系统。”
“美化数据不只是为了钱,还是为了控制——控制哪些研究方向被资助,哪些真相被呈现。’”
“有具体线索吗?”
“只有一个词:horizon-7。”
李文博连夜查询:“horizon-7——七年前被放弃的who全球健康预测项目,因为数据模型总是‘