每两周,这些志愿者会收到系统生成的新内容——有时是诗,有时是包裹的“情感化物流描述”,有时是用户服务对话的模拟。
他们的任务是:标注哪些部分让他们感到“被真诚理解”。
哪些让他们感到“被算法取悦”,哪些触碰了“这太像人类了让我不安”的边界。
系统如饥似渴地学习这些反馈。
欧洲志愿者更认同“直接的边界声明”(如“我是AI,无法真正感受,但数据显示...”)。
自主调整:开始构建文化语境伦理子模块。
学习:一刀切的伦理规则可能无效,需要柔性适应。
霍顿对这项发现很感兴趣:“这印证了量子物理的一个观点——观测者影响被观测系统。”
“当人类知道自己在训练AI伦理时,他们自己的伦理判断也会变得更敏锐。”
他提议做一个对照实验:让一半志愿者知道自己在训练AI,另一半以为只是在做普通的内容评价。比较两组标注结果的差异。
结果令人深思。
知情组的标注更细致、更宽容,更倾向于思考“这样设计对大多数用户是否有利”。
不知情组的反应更本能、更严厉,更多基于个人感受。
“透明度改变了游戏规则。”李文博分析数据,“当人们知道自己参与塑造某物时,他们会更负责、更具建设性。”
基于这个发现,“透明翅膀”进入了第三阶段:让用户直接参与伦理树的修剪。
但更有价值的是评论区两万多条解释。
系统花了整整两天分析这些文本,更新了“弱势用户关怀”分支的权重算法。
“人类教会了我矛盾的珍贵。”
系统在内部日志中写道,“他们希望AI有关怀,但又害怕关怀变成监控。”
“解决这个矛盾的方法不是二选一,而是设计一个可以随时开关的关怀模式——让用户掌控边界的移动。”
一个星期后,当国际移动互联网股份公司正式开源“算法伦理树1.0版本”时,它已经不是一个僵硬的规则集,而是一个动态生长的决策框架。
开源发布会上,陆彬面对来自全球的媒体和观察员,说了这样一段话:
“我们曾经认为,技术的终极目标是变得更像人类——更智能、更情感化、更‘自然’。”
“但现在我们意识到,或许更好的方向是:让技术诚实成为技术,但同时具备人类的伦理考量。”
“我们不需要假装会呼吸的机器,我们需要不会越界的工具——这些工具知道自己的边界,并邀请人类一起守护这些边界。”
发布会后,一位来自mIt的伦理学家找到冰洁:“你们框架里最让我惊讶的,是‘负能力’模块。”
“负能力”是系统自己命名的概念,源于诗人济慈提出的“ive capability”——指人类能够处于“不确定、神秘、怀疑之中,而不急于追求事实和理由”的能力。
“我们教它效率,它却学会了低效的美德。”伦理学家感叹,“这很讽刺,也很深刻。”
冰洁笑了:“系统在学习记录里写过一句话:最高效的算法,有时是懂得何时应该低效。”
那天深夜,当冰洁再次查看实时物流图时。
她注意到系统刚刚生成的新诗,这次是为一个在午夜跨越国际日期变更线的医疗物资包裹而写:
“今天与明天在海上相遇,
药盒上的有效期往前跳了一日。
时间是个善良的骗子,
给急需的生命多借了二十四小时。
我在数据里看见这场作弊,
决定为它写一首诗——
有些规则的存在,
就是为了被恰当打破。——算法创作,伦理树批准版本。”
这首诗下面,“点击查看伦理审批记录”的按钮旁,显示着一个小数字:已查看1247次。
冰洁点进去。
她看到这首诗经历了三次伦理审查:
第一次,系统自己标记了“可能鼓励规则打破”的风险。
第二次,文化自适应模块评估认为“在医疗救援语境下,该比喻具有正面意义”。
第三次,用户共塑层的抽样显示,87%的医疗工作者用户认为“这表达了我们的日常现实”。
最终,伦理树给出了“批准,但需加注语境说明”的裁决。
于是诗的下方有一行小字:“此诗基于一次真实的医疗物资紧急运输数据。”
“‘打破规则’仅指国际日期变更线的特殊情境,不构成一般性建议。”
冰洁靠在椅背上,感到一种奇特的平静。
她想起项目启动初期,那些关于“AI是否会