人工智能法官如何扩大预测市场：将法学硕士锁定在区块链中以解决最困难的合同的案例

本文解读a16z对于扩展预测市场的核心见解：传统的仲裁机制往往难以做到抗操纵、透明和中立，这阻碍了市场的扩张。作者建议将大型语言模型（LLM）的特定版本锁定在区块链合约中，以充当数字仲裁员，从而提高可信度和透明度。这种方法旨在为预测市场的爆炸性增长建立可靠的基础层。

去年，委内瑞拉总统选举结果的预测市场合约交易量超过 600 万美元。但当计票结束时，市场面临着一个不可能的局面：政府宣布尼古拉斯·马杜罗获胜；反对派和国际观察员指控存在欺诈行为。预测市场合同决议应该遵循“官方信息”（马杜罗获胜）还是“可信报告的共识”（反对派获胜）？

就委内瑞拉选举而言，观察家们指控一切，从无视规则和参与者“他们的钱被盗”，到将旨在解决有争议合同的协议描述为“法官、陪审团和刽子手”，再到“” rel="nofollow noopener noreferrer">严重被操纵“”

这不是一个孤立的问题。我认为这是预测市场规模扩大时面临的最大瓶颈之一的症状：合约解析。

这里的风险很高。如果解决得当，人们就会信任你的市场，愿意在其中进行交易，价格就会成为对社会有意义的信号。如果决策错误，交易就会令人沮丧且不可预测。参与者可能会离开，流动性风险枯竭，价格不再反映稳定目标的准确预测。相反，价格开始反映结果的实际概率和交易者对扭曲的解决机制将如何决定规则的信念的模糊组合。

委内瑞拉争端相对引人注目，但跨平台经常发生微妙的失败：

乌克兰地图操纵展示了对手如何直接利用解决机制。一份关于领土控制的合同规定，它将根据特定的在线地图来解决。据称有人编辑了地图以影响合同的结果。当你的真相来源可以被操纵时，你的市场就可以被操纵。
政府关闭合同表明决议来源如何导致不准确或至少不可预测的结果。决议规则规定，市场将根据人事管理局网站显示关闭结束的时间进行支付。特朗普总统于 11 月 12 日签署了资助法案，但 OPM 的网站直到 11 月 13 日才更新，原因尚不清楚。正确预测关闭将于 12 日结束的交易者因网站管理员的拖延而输掉了赌注。
泽连斯基诉讼市场引发了对利益冲突的担忧。合同询问乌克兰总统泽连斯基是否会在特定活动中穿西装——这个看似微不足道的问题却吸引了超过 2 亿美元的赌注。当泽连斯基穿着 BBC、《纽约邮报》和其他媒体描述的西装出席北约峰会时，市场最初给出了“是”的答案。但 UMA 代币持有者对结果提出异议，决议转向“否”。

在这篇文章中，我探讨了法学硕士和加密货币如何巧妙地结合起来，帮助我们创造方法来解决大规模预测市场的问题，这些市场很难操纵，而且准确、完全透明且可信中立。

这不仅仅是一个预测市场问题

类似的问题也困扰着金融市场。国际掉期和衍生品协会 (ISDA) 多年来一直在努力解决信用违约掉期市场的解决挑战，即当公司或国家拖欠债务时支付的合同，其2024 年审查对这些困难非常坦诚。他们的决策委员会由主要市场参与者组成，对信用事件是否发生进行投票。但与 UMA 流程一样，该流程因不透明、潜在利益冲突和结果不一致而受到批评。

根本问题是一样的：当大量资金依赖于确定模糊情况下发生的事情时，每一种解决机制都会成为被利用的目标，而每一次模糊都会成为潜在的爆发点。

那么一个好的解决机制应该是什么样的？

良好解决方案的属性

任何可行的解决方案都需要同时实现许多关键属性

对操纵的抵抗力。如果对手可以通过编辑维基百科、散布假新闻、贿赂神谕或利用程序漏洞来影响解决方案，那么市场就变成了一场谁能最好地操纵而不是谁能最好地预测的游戏。

合理的准确性。该机制必须在大多数情况下都能做出正确的决策。在一个真正模糊的世界里，完美的准确性是不可能的，但系统性错误或明显的错误会破坏可信度。

事前透明度。交易者在下注之前需要准确了解决议将如何发挥作用。中途改变规则违反了平台和参与者之间的基本契约。

可信的中立性。参与者需要相信该机制不会有利于任何特定的交易者或结果。这就是为什么大型 UMA 持有者解决他们所押注的合同会出现如此大的问题：即使他们行事公平，冲突的出现也会破坏信任。

人类委员会可以满足其中一些特性，但它们与其他特性相矛盾——特别是大规模的操纵阻力和可信的中立性。像 UMA 这样基于代币的投票系统在鲸鱼主导地位和利益冲突方面也存在有据可查的问题。

这就是人工智能发挥作用的地方。

LLM 法官的案例

这是一个在预测市场圈中获得关注的提案：使用大型语言模型作为决议法官，在创建合约时将特定模型和提示锁定到区块链中。

基本架构将像这样工作。在合同创建时，做市商不仅指定自然语言的解决标准，还指定确切的 LLM（由带时间戳的模型版本标识）以及将用于确定结果的确切提示。

该规范以加密方式提交给区块链。当交易开始时，参与者可以检查完整的解决机制——他们确切地知道哪个人工智能模型将判断结果，它将收到什么提示，以及它将能够访问哪些信息源。

如果他们不喜欢这种设置，他们就不会进行交易。

在解决时，提交的 LLM 将按照提交的提示运行，访问指定的任何信息源，并生成判断。输出决定了谁获得报酬。

这种方法同时解决了几个关键限制：

强烈抵制操纵（尽管不是绝对）。与维基百科页面或小型新闻网站不同，您无法轻松编辑主要法学硕士的输出。模型的权重在承诺时是固定的。为了操纵分辨率，对手需要要么破坏模型所依赖的信息源，要么提前以某种方式毒害模型的训练数据——与贿赂预言机或编辑地图相比，这两种攻击都是代价高昂且不确定的。

提供准确性。随着推理模型的迅速改进并能够解决一系列令人惊讶的智力问题，特别是当他们可以浏览网络并寻找新信息时，法学硕士法官应该能够准确地解决许多市场问题，并且正在进行实验以了解其准确性。

烘焙透明度。在任何人下注之前，整个解决机制都是可见且可审计的。规则不会在飞行途中改变，不会随意做出判断，也不会进行幕后谈判。您清楚地知道自己注册的目的。

显着提高可信的中立性。法学硕士对结果没有任何经济利益。它不能被贿赂。它不拥有 UMA 代币。它的偏差，无论是什么，都是模型本身的属性，而不是利益相关方做出临时决策的属性。

当然，法学硕士法官会受到限制，我将在下面概述和解决这些限制。

模型会犯错误。法学硕士可能会误读新闻文章、产生幻觉或不一致地应用解决标准。但只要交易者知道他们押注于哪种模型，他们就可以将其缺点定价。如果某个特定模型具有以特定方式解决不明确情况的已知倾向，那么经验丰富的交易者就会对此做出解释。该模型不必是完美的；它必须是可预测的。

操纵并非不可能，只是更难。如果提示指定特定的新闻来源，对手可能会尝试在这些来源中植入故事。这种攻击对于主要的渠道来说代价高昂，但对于较小的渠道来说可能是可行的——另一种形式的地图编辑问题。及时设计在这里非常重要：依赖于多样化、冗余源的解决机制比依赖于单点故障的解决机制更加稳健。

中毒攻击理论上是可能的。拥有足够资源的对手可能会试图影响法学硕士的训练数据，以使其未来的判断产生偏差。但这需要远远提前于合同采取行动，收益不确定且成本高昂——这比贿赂委员会成员的门槛要高得多。

法学硕士法官的激增造成了协调问题。如果不同的市场创建者以不同的提示致力于不同的法学硕士，流动性碎片。交易者无法轻松比较不同市场的合约或汇总信息。标准化很有价值，但让市场发现哪种 LLM 提示组合最有效也很有价值。正确的答案可能是某种组合：让实验发生，但为社区创建机制，随着时间的推移，逐渐收敛到经过充分测试的默认值。

构建者如何采用这些策略？

总结：基于人工智能的解决方案基本上将一组问题（人类偏见、利益冲突、不透明）换成了另一组可能更容易处理的不同问题（模型限制、即时工程挑战、信息源漏洞）。那么我们如何继续前进呢？平台应该：

通过测试低风险合同的 LLM 解析来进行实验，以建立跟踪记录。哪些型号表现最好？哪些提示结构最稳健？实践中会出现哪些故障模式？

标准化。随着最佳实践的出现，社区应该努力实现可以作为默认值的标准化 LLM 提示组合。这并不妨碍创新，但它有助于流动性集中在易于理解的市场。

构建界面等透明度工具，使交易者可以在交易前轻松检查完整的解决机制（模型、提示、信息源）。决议不应被隐藏在细则中。

进行持续治理。即使有人工智能法官，人类也需要做出元级决策：信任哪些模型，如何处理模型给出明显错误答案的情况，何时更新默认值。目标不是将人类完全从循环中移除，而是将他们从临时的个案判断转向系统的规则制定。

预测市场具有巨大的潜力，可以帮助我们了解喧闹、复杂的世界。但这种潜力取决于信任，而信任取决于公平的合同解决方案。我们已经看到当解决机制失败时会发生什么：困惑、愤怒和交易者走开。我见过人们在感觉被欺骗后完全退出预测市场，因为这个结果似乎与他们的赌注精神相矛盾——发誓放弃他们以前喜欢的平台。这是一个释放预测市场的好处和更广泛应用的机会。

LLM 评委并不完美。但当它们与加密技术结合时，它们是透明的、中立的，并且能够抵抗困扰人类系统的各种操纵。在预测市场扩展速度快于我们治理机制的世界中，这可能正是我们所需要的。

币界网提醒，请广大读者理性看待区块链，切实提高风险意识，登载此文并不意味着赞同其观点或证实其描述，文章内容仅供参考。警惕各类虚拟代币发行与炒作，站内所有内容仅系市场信息或相关方观点，不构成任何形式投资建议，风险自担。【来源：“Gate”】