妹妹中文娱乐网
你的位置:twitter 裸舞 > 妹妹中文娱乐网 >裁剪:乔杨 Frey开心情色站
AI的能力终于癫成了和这个寰球匹配的花样——来自UCB等机构的相干者们用GPT-4o,竖立出了一个「AI预言家」。
LLM的神奇职能,又多了一个。
用更形象的话说,即是中国的「算命签」、欧洲的「水晶球」,不错用「超东说念主」的能力预料翌日。
客岁12月,Nature就刊登了一篇相干,不错用LLM预料一个东说念主生存中行将发生的事件,就像预料句子中的next token一样。
实验成果标明,这个模子致使能预料一个东说念主翌日4年内死亡的可能性,准确率高达78.8%。
最近,AI安全中心总监Dan Hendrycks勾通加州大学伯克利分校的相干东说念主员,竖立了一个更渊博的系统FiveThirtyNine,预料更宏不雅的社会事件,比如「Trump能否赢得2024年大选」。
这个AI预料机器东说念主基于GPT-4o构建,用户输入念念查询的事件,FiveThirtyNine就能预料起程生的概率,就像天气预告中给出的下雨概率一样。
那么预料的准确度和信得过度怎样?
驰名作者、人心探问师Nate Silver最近在一档节目上暗意,AI不会很快取代东说念主类预料分析师的能力。念念看到超东说念主的预料能力,起码要等15年。
Nate Silver最新预料:Trump有64%的到手几率
但这个项主义作者暗意顽抗,他们暗意,539的弘扬好过训戒丰富的东说念主类预告员单打独斗,梗概和一群预告员合营的弘扬至极,致使更好。
因此,分析预料商场很快就能通过AI达成自动化!
从名目Demo中也能发现,539能够预料的事件界限也很鄙俚,比如好意思国大选是政坛事件,其他界限包括生物安全、AI本事、环境健康、网罗安全等也齐能预料。
原文地址:https://www.safe.ai/blog/forecasting
Demo地址:https://forecast.safe.ai/
除了放出博客著述和Demo,研发团队还缱绻出一篇详备的本事说明,诚然还没脱稿,但坑位依然占上了,感趣味的一又友不错期待下。
原文地址:https://drive.google.com/file/d/1Tc_xY1NM-US4mZ4OpzxrpTudyo1W4KsE/view
为什么给这个机器东说念主取名叫FiveThirtyNine?
原作者成心发推解说,原本是念念请安有名的人心预料员Nate Silver,但又要暗意AI的能力比他强,因此本来缱绻取名为Nate Gold。
AV天堂但没得到本东说念主快乐,只好借用他twitter名的后缀538,再+1暗意「迭代」一版,就得到了539。
FiveThirtyNine责任旨趣
这里,粗拙转头下FiveThirtyNine的责任旨趣。
举个例子,要是向FiveThirtyNine相干「Trump会赢得2024年好意思国总统大选吗?」。
采纳了这一Prompt的FiveThirtyNine,就如团结个AI预言家一样,会借助搜索引擎检索有关的新闻和著述,整合信息并作念出预料。
基于GPT-4o的FiveThirtyNine的预料示例
Prompt的内容亦然很遑急的开心情色站,可能是为了复现粗拙,作者给出了实验中使用的prompt模板。
在弥散的先验学问的基础上,FiveThirtyNine源流会依据事实转头归纳。
对一件事的Yes/No两方面,539会离别给出撑持或反对的意义,再依据遑急性分派相应的权重,可解说性拉满了。
比如,预料Trump当选的论据包括:票仓建壮、撑持率广泛被低估、刚得到的法律豁免权、他主意的经济复苏方法等等。
反面的论据也有5个,一样现实且有劲,包括Harris人心探问越过、筹款上风和要津东说念主群的撑持,以及Trump本东说念主的极化倾向和法律挑战。
转头这些论据后,FiveThirtyNine还会「酌情措置」绝望新闻、合手马事件和稠浊视听的偏见,整合多遑急素,给出一个初步的概率。
终末,它还需要对这个概率值进行感性分析,结合推理进一步优化,并给出校准后的概率——在本例中为52%。
AI预言家优于商场预料
为了测试AI预言家的弘扬,作者们借助Metaculus平台的问题对其进行了评估。
为了比较的公平性,AI预言家与东说念主工预言家使用换取的信息。
值得肃穆的是,GPT-4o的数据仅囊括2023年10月之前的,因此相干者将新闻和著述齐收尾在该日历前,条款539和东说念主类离别诡计Metaculus中177个事件发生的概率。
针对这177个事件,Metaculus本人模子的预料准确率为87.0%,而FiveThirtyNine将其栽植至87.7%±1.4。
相关于商场预料,AI预言居品有多种其无法比较的上风。如,它能在几秒内快速生成预料,速率比现时商场预料高了几个数目级。
不仅速率更快,还不需要迥殊的奖励机制去优化预料,在精度至极的情况下,昭彰AI预言家更具性价比。
局限性
诚然作者放话暗意,AI预言家依然优于东说念主类预料员,但这个机器东说念主依旧存在不少工程和性能上的局限性。
比如,539依旧会对无效查询作念出回报,因为作者还没给它加上拒却功能。
及时更新学问库这方面,也有权贵的症结,毕竟它还没能接上推特的API。
5G冲浪的网友不错飞速知说念推特上的热点事件,但要是触及到预测验所用的学问库盲区,539就一无所知。
比如,刚刚完成预测验的539还不知说念Joe Biden依然退选,要是不再行过一遍学问库,依旧会傻傻地预料Biden当选的概率。
尤其是关于那些一衣带水、行将见分晓的事件,这种鸠拙的反馈是完全比不上东说念主类的。
更遑急的是,现时的「AI预言家」莫得过程微调,还未达到最优精度,只是是依据工程化的Prompt检索并撰写转头说明。
可通过单击forecast.safe.ai中的齿轮图标找到它的prompt
此外,「自动化偏见」(automation bias)亦然一个遑急的问题,推特评述区也有网友问到。
「自动化偏见」是社会心思学界限的发现,即东说念主类倾向于过度依赖自动化系统的提倡,而忽略而忽略非自动化方式产生的矛盾信息,即使这些信息是正确的。
作者暗意,这个问题粗略不错通过优化界面来改良或幸免。
尽管机器东说念主在广度、速率和准确性方面广泛弘扬优异,但在某些特定方面,它依旧比不上东说念主类。
比如在相等依赖专科学问的金融界限,539对商场的预料能力还莫得被考据。
它的预料还可能暴虐尾部风险,变成「自证预言」。要是改良这一症结,AI预言家的预料精度可能会得到极大的栽植。
相干者称,领先将其称为超东说念主,并不是指它在各个方面齐见缝就钻,只是念念抒发AI预言家的预料能力并不比东说念主类忘形。
就像何恺明大神也会声称PReLU网罗在ImageNet上有「超东说念主性能」一样,诚然也会犯东说念主类不行能犯的诞妄,但不贻误AI在某些方面匹配致使卓著东说念主类弘扬。
「AI预言家」颖异什么
要是说,以维基百科为代表的领悟本事,股东了东说念主类参与知情有计划、保管现实共鸣,以及构建共同的寰球不雅,那么翌日AI的用途,可能会走得更远。
行为中立的智能第三方,「AI预言家」粗略不错改良方案和全球讲话,有助于放肆顶点、态度南北极分化的事件。
完善聊天机器东说念主功能
将AI预料功能集成到AI聊天机器东说念主或个东说念主AI助手中,不错赞成方案、藏匿风险。
举例,不错为战术制定者们提供值得信托、公平的概率评估,还不错匡助量化大师藏匿风险。
补充新闻报说念
AI预言家还可用来补充新闻报说念,比如匡助预料加州AI安全法案SB 1047收效签署的可能性。
好意思国有名天体裁家Carl Sagan曾说过,「要是单纯积聚力量而不增长聪惠,东说念主类必定会走向自我废弃的说念路」。
不行否定,翌日AI本事将束缚变强,而其所具备的预料能力也有望为咱们提供预警式和启发式的提倡。
网友评述
「AI预言家」这个名目不错说是看点实足,很能诱骗眼球,但推特上的网友大多持负面评述。
有东说念主合计这只是给GPT-4o套了个壳、作念了点领导工程,本色上是一个「新闻阅读器」的诈骗。
还有东说念主责怪作者「路走歪了」,除了炒作,这类名目完全看不到价值或试验功用。
此外,也有本事方面的质疑。
因为作者提到,在评估时允许机器东说念主接入互联网,在有日历截断的前提下,退避它得知县件成果。
但「日历截断」这个功能完全不行靠,反例一合手一大把,因此评估成果亦然靠不住的。
其中的本事含量究竟有若干?所谓「卓著东说念主类弘扬」的评估成果到底能告诉咱们什么?
看来惟有等本事说明发布后才能得知了开心情色站。
- 2024/11/0991 丝袜 引申发展作事就业保障 助力安全坐蓐时间服务机构作念大作念强——安全坐蓐时间服务机构就业保
- 2024/11/08开心情色站 枭雄攻克波士顿花坛,约基奇让雷霆首败
- 2024/11/08开心情色站 高能之作《气御九天》,惟有胆子大,莫得不行能!
- 2024/11/08开心情色站 驰念它一身还拆家?超三成宠物主以为携宠出行贫穷成痛点,“宠物经济”催生糜掷新场景
- 2024/11/07日本萝莉 porn 【财报不雅察】信贷需求疲弱,银行撑得住进一步降息压力吗?