开心情色站 Trump当选概率有多大？UC伯克利CAIS联手打造AI预言家 - twitter 裸舞

栏目分类

热点资讯

妹妹中文娱乐网

你的位置：twitter 裸舞 > 妹妹中文娱乐网 >

开心情色站 Trump当选概率有多大？UC伯克利CAIS联手打造AI预言家

发布日期：2024-09-12 00:56 点击次数：205

开心情色站 Trump当选概率有多大？UC伯克利CAIS联手打造AI预言家

裁剪：乔杨 Frey开心情色站

AI的能力终于癫成了和这个寰球匹配的花样——来自UCB等机构的相干者们用GPT-4o，竖立出了一个「AI预言家」。

LLM的神奇职能，又多了一个。

用更形象的话说，即是中国的「算命签」、欧洲的「水晶球」，不错用「超东说念主」的能力预料翌日。

客岁12月，Nature就刊登了一篇相干，不错用LLM预料一个东说念主生存中行将发生的事件，就像预料句子中的next token一样。

实验成果标明，这个模子致使能预料一个东说念主翌日4年内死亡的可能性，准确率高达78.8%。

最近，AI安全中心总监Dan Hendrycks勾通加州大学伯克利分校的相干东说念主员，竖立了一个更渊博的系统FiveThirtyNine，预料更宏不雅的社会事件，比如「Trump能否赢得2024年大选」。

这个AI预料机器东说念主基于GPT-4o构建，用户输入念念查询的事件，FiveThirtyNine就能预料起程生的概率，就像天气预告中给出的下雨概率一样。

那么预料的准确度和信得过度怎样？

驰名作者、人心探问师Nate Silver最近在一档节目上暗意，AI不会很快取代东说念主类预料分析师的能力。念念看到超东说念主的预料能力，起码要等15年。

Nate Silver最新预料：Trump有64%的到手几率

但这个项主义作者暗意顽抗，他们暗意，539的弘扬好过训戒丰富的东说念主类预告员单打独斗，梗概和一群预告员合营的弘扬至极，致使更好。

因此，分析预料商场很快就能通过AI达成自动化！

从名目Demo中也能发现，539能够预料的事件界限也很鄙俚，比如好意思国大选是政坛事件，其他界限包括生物安全、AI本事、环境健康、网罗安全等也齐能预料。

原文地址：https://www.safe.ai/blog/forecasting

Demo地址：https://forecast.safe.ai/

除了放出博客著述和Demo，研发团队还缱绻出一篇详备的本事说明，诚然还没脱稿，但坑位依然占上了，感趣味的一又友不错期待下。

原文地址：https://drive.google.com/file/d/1Tc_xY1NM-US4mZ4OpzxrpTudyo1W4KsE/view

为什么给这个机器东说念主取名叫FiveThirtyNine？

原作者成心发推解说，原本是念念请安有名的人心预料员Nate Silver，但又要暗意AI的能力比他强，因此本来缱绻取名为Nate Gold。

但没得到本东说念主快乐，只好借用他twitter名的后缀538，再+1暗意「迭代」一版，就得到了539。

FiveThirtyNine责任旨趣

这里，粗拙转头下FiveThirtyNine的责任旨趣。

举个例子，要是向FiveThirtyNine相干「Trump会赢得2024年好意思国总统大选吗？」。

采纳了这一Prompt的FiveThirtyNine，就如团结个AI预言家一样，会借助搜索引擎检索有关的新闻和著述，整合信息并作念出预料。

基于GPT-4o的FiveThirtyNine的预料示例

Prompt的内容亦然很遑急的开心情色站，可能是为了复现粗拙，作者给出了实验中使用的prompt模板。

在弥散的先验学问的基础上，FiveThirtyNine源流会依据事实转头归纳。

对一件事的Yes/No两方面，539会离别给出撑持或反对的意义，再依据遑急性分派相应的权重，可解说性拉满了。

比如，预料Trump当选的论据包括：票仓建壮、撑持率广泛被低估、刚得到的法律豁免权、他主意的经济复苏方法等等。

反面的论据也有5个，一样现实且有劲，包括Harris人心探问越过、筹款上风和要津东说念主群的撑持，以及Trump本东说念主的极化倾向和法律挑战。

转头这些论据后，FiveThirtyNine还会「酌情措置」绝望新闻、合手马事件和稠浊视听的偏见，整合多遑急素，给出一个初步的概率。

终末，它还需要对这个概率值进行感性分析，结合推理进一步优化，并给出校准后的概率——在本例中为52%。

AI预言家优于商场预料

为了测试AI预言家的弘扬，作者们借助Metaculus平台的问题对其进行了评估。

为了比较的公平性，AI预言家与东说念主工预言家使用换取的信息。

值得肃穆的是，GPT-4o的数据仅囊括2023年10月之前的，因此相干者将新闻和著述齐收尾在该日历前，条款539和东说念主类离别诡计Metaculus中177个事件发生的概率。

针对这177个事件，Metaculus本人模子的预料准确率为87.0%，而FiveThirtyNine将其栽植至87.7%±1.4。

相关于商场预料，AI预言居品有多种其无法比较的上风。如，它能在几秒内快速生成预料，速率比现时商场预料高了几个数目级。

不仅速率更快，还不需要迥殊的奖励机制去优化预料，在精度至极的情况下，昭彰AI预言家更具性价比。

局限性

诚然作者放话暗意，AI预言家依然优于东说念主类预料员，但这个机器东说念主依旧存在不少工程和性能上的局限性。

比如，539依旧会对无效查询作念出回报，因为作者还没给它加上拒却功能。

及时更新学问库这方面，也有权贵的症结，毕竟它还没能接上推特的API。

5G冲浪的网友不错飞速知说念推特上的热点事件，但要是触及到预测验所用的学问库盲区，539就一无所知。

比如，刚刚完成预测验的539还不知说念Joe Biden依然退选，要是不再行过一遍学问库，依旧会傻傻地预料Biden当选的概率。

尤其是关于那些一衣带水、行将见分晓的事件，这种鸠拙的反馈是完全比不上东说念主类的。

更遑急的是，现时的「AI预言家」莫得过程微调，还未达到最优精度，只是是依据工程化的Prompt检索并撰写转头说明。

可通过单击forecast.safe.ai中的齿轮图标找到它的prompt

此外，「自动化偏见」（automation bias）亦然一个遑急的问题，推特评述区也有网友问到。

「自动化偏见」是社会心思学界限的发现，即东说念主类倾向于过度依赖自动化系统的提倡，而忽略而忽略非自动化方式产生的矛盾信息，即使这些信息是正确的。

作者暗意，这个问题粗略不错通过优化界面来改良或幸免。

尽管机器东说念主在广度、速率和准确性方面广泛弘扬优异，但在某些特定方面，它依旧比不上东说念主类。

比如在相等依赖专科学问的金融界限，539对商场的预料能力还莫得被考据。

它的预料还可能暴虐尾部风险，变成「自证预言」。要是改良这一症结，AI预言家的预料精度可能会得到极大的栽植。

相干者称，领先将其称为超东说念主，并不是指它在各个方面齐见缝就钻，只是念念抒发AI预言家的预料能力并不比东说念主类忘形。

就像何恺明大神也会声称PReLU网罗在ImageNet上有「超东说念主性能」一样，诚然也会犯东说念主类不行能犯的诞妄，但不贻误AI在某些方面匹配致使卓著东说念主类弘扬。

「AI预言家」颖异什么

要是说，以维基百科为代表的领悟本事，股东了东说念主类参与知情有计划、保管现实共鸣，以及构建共同的寰球不雅，那么翌日AI的用途，可能会走得更远。

行为中立的智能第三方，「AI预言家」粗略不错改良方案和全球讲话，有助于放肆顶点、态度南北极分化的事件。

完善聊天机器东说念主功能

将AI预料功能集成到AI聊天机器东说念主或个东说念主AI助手中，不错赞成方案、藏匿风险。

举例，不错为战术制定者们提供值得信托、公平的概率评估，还不错匡助量化大师藏匿风险。

补充新闻报说念

AI预言家还可用来补充新闻报说念，比如匡助预料加州AI安全法案SB 1047收效签署的可能性。

好意思国有名天体裁家Carl Sagan曾说过，「要是单纯积聚力量而不增长聪惠，东说念主类必定会走向自我废弃的说念路」。

不行否定，翌日AI本事将束缚变强，而其所具备的预料能力也有望为咱们提供预警式和启发式的提倡。

网友评述

「AI预言家」这个名目不错说是看点实足，很能诱骗眼球，但推特上的网友大多持负面评述。

有东说念主合计这只是给GPT-4o套了个壳、作念了点领导工程，本色上是一个「新闻阅读器」的诈骗。

还有东说念主责怪作者「路走歪了」，除了炒作，这类名目完全看不到价值或试验功用。

此外，也有本事方面的质疑。

因为作者提到，在评估时允许机器东说念主接入互联网，在有日历截断的前提下，退避它得知县件成果。

但「日历截断」这个功能完全不行靠，反例一合手一大把，因此评估成果亦然靠不住的。

其中的本事含量究竟有若干？所谓「卓著东说念主类弘扬」的评估成果到底能告诉咱们什么？

看来惟有等本事说明发布后才能得知了开心情色站。

上一篇：开心情色站托育机构如何选
下一篇：开心情色站罗马诺：尽管与转会土超球队有关在沿途，但埃莫森意外离开西汉姆

相关资讯