Opus 4.8连夜算尽1170亿东说念主运道,一句话敲出东说念主类转世模拟器


新智元报说念

【新智元导读】你此刻喝的干清水、用的电、看的病,1170亿东说念主里绝大无数作念梦都够不着。而算清这串概率的Opus 4.8,前天刚把GPT-5.5踢下寰球第一的王座。
如若你在1170亿东说念主里迅速转世,你不祥率是一个1650年以前缔造的文盲农民,活不外15岁!
算出这个谜底的,不是哪个熬白了头的历史学家,是一个AI。
就在刚刚,沃顿商学院说明Ethan Mollick的一条推文,径直在𝕏上刷屏了。

点开他作念的这个网站,全东说念主类十几万年的运道,被换算成了一串冷飕飕的概率。
而这串概率背后,从查文件、建模子,到敲下等一排代码、调完每一个像素,连一个真东说念主要津员的影子都莫得。
全是Claude Opus 4.8,听着那一句话,一个AI干完的。


Prompt:assume a universal veil of ignorance and you could be born as any human who has ever lived in history, what are the most likely socioeconomic conditions and locations that you would be born in, give the top 10 by percentage chance. This should be sourced. do research as needed

1170亿东说念主的存一火贫劳
被AI算尽了
这个网站叫「The Veil of History」,历史的无知之幕。
名字来自玄学家罗尔斯阿谁着名的念念想本质。
假定你还没缔造,不知说念我方会落在哪个阶级、哪个种族、哪个国度,你会如何去缱绻这个社会。
Mollick用Opus 4.8把这块幕布,一把拉到了系数东说念主类史的规范上。
它的算法不按世纪平摊,而是按每个时期实质缔造的东说念主头来加权。哪个时期生的东说念主多,你就更可能转世到那边去。
效力清晰,东说念主类有史以来,苟简缔造过1170亿东说念主。其中约81%,生在1650年以前。约94%,生在1900年以前。


网站把这1170亿东说念主,压成一张100个凡人的方格图。
切到「时期」那一栏你会发现,绝大无数凡人都堆在工业立异以前的格子里。
越往当代走越疏淡,能站到「1900年以后」的,数来数去就那么几个。
绝大无数的「你」,是在田庐弯着腰的那一个。

网站不息往下拉,是「十种最可能的东说念主生」,排在最前头的几种,险些清一色是农耕时期的无名之辈。


没名字,没头衔,在历史里连一排字都没留住,却占掉了系数抽奖池里最大的几块。
而你从小背到大的名公巨卿加在系数,凑不出一个凡人。
加权之后,极点浮泛是常态,识字是例外,能活到成年自己即是一场概率游戏。


点一下抽一条命,你活到了21岁
光看统计不外瘾。这个网站最绝的,是收尾阿谁「抽一条命」的按钮。
点一下,它就从齐备的概率鉴别里,真给你迅速抽一个缔造。
年代、地区、阶级、能享什么福、终末什么结局,一次性全配都。
顺手抽一把,多半是这样一张卡面。
公元前6400年前后,一个女孩,东亚河谷里的农民。极点浮泛,不识字,莫得电,也莫得自来水。
活到了苟简21岁。
就这样短短两行字,啪地砸在屏幕上。

你不错一直按,按到阿谁空洞的「1170亿分之一」,终于酿成一个具体的、有死法的东说念主礼貌。
多点几次你会发现,我方一次次落回差未几的境遇里。
除此除外,网站还挑升作念了一张实在地舆的交互天下舆图,用D3和Natural Earth画的。
拖动时分滑块,能从12个时期里一格格扫当年。
大部分时分里,这个要点都死死压在亚洲。一齐到近当代,才会看见它运转往欧洲、往好意思洲搬动。
换句话说,东说念主类这本大书,绝大部分章节,都写在了亚洲的田埂上。

实质上,整段东说念主类史里,能喝上干清水、生病找得着大夫、孩子不祥率能祥瑞长大的东说念主生,加一块儿都凑不悦一小撮。
更无用提用上电、住进城里、过上一份当代中等收入的日子了。
你此刻顺手就有的这些,是1170亿东说念主里的绝大无数,作念梦都够不着的设置。
说到底,java资源网站今天的东说念主认为稀松等闲的活法,丢回整条东说念主类时分线里看,是一个精明到不像话的相称值。

「转世模拟器」
一个AI,分饰四个角
如斯高质料的产等级托付,可不是生成几行HTML和CSS那么简便。
如若让一支传统团队来作念,数据分析师清洗东说念主口弧线,历史商议员翻文件佐证,UX缱绻师画线框图,前端工程师一排名敲D3。几样凑都、磨到能上线,如何也得搭进去好几周。
换成Opus 4.8,一个AI就分饰了四个截然相悖的高薪岗亭,把中间统统的毛刺全部抹平了。

第一层,它是个严谨的数据商议员。
为了算出1170亿这个数和对应的时期鉴别,它先是翻出东说念主口贵寓局2022年那份《地球上一共活过些许东说念主》,然后又交叉援用了麦迪逊名堂数据库、HYDE数据集和聚首国的东说念主口瞻望,终末合成出了这张各时期各地区的东说念主口份额矩阵。

在这个流程中,算某个地区一共缔造过些许东说念主,靠的是一条干净的公式——
每个时期的缔造总额,乘以阿谁时期这个地区占寰球的东说念主口比例,再逐代累加。

第二层,是数学建模大师。
辣手的是,从莫得任何机构统计过「按地区累计的缔造东说念主数」。
于是它自主决定用蒙特卡洛措施处理不笃定性,跑了4000轮模拟,越陈腐、越没把捏的年代噪声给得越大,终末输出中位数加5%到95%的置信区间。

第三层,前端架构师。
要在一个单页里把丝滑的转换叙事和数据情景同步起来,绝非易事。
为此,Opus我方缱绻了一套当代审好意思的转换结构,把海量数据点在浏览器里的渲染、图表的动态反映全科罚了,动效顺滑不卡顿。
第四层,它拿出了顶级案牍和热情导演的功力。
开拔点是巨大的历史长河铺垫,再猛地抛出个体运道的轻微。它用带肉身痛感的短句,把冰冷的统计学一刀刀刺进平常东说念主心里。
代码写得好不少见。懂得如何治愈东说念主类热情,这险些是碳基人命终末的自留地。

能搓出这个的脑子,前天刚登顶
回到Opus 4.8这边。
在Artificial Analysis的榜单上,它就像一台没热情的压路机,61.4分满血登顶,把GPT-5.5反超了下去。
这是OpenAI 4月坐上面把交椅以来,Claude头一趟坐回第一。

在堪称「东说念主类终末纯属」的Humanity's Last Exam上,Opus 4.8拿到45.7%,最初第二名整整1分。
前沿物理基准CritPt上,它也跨越了Gemini 3.1 Pro。

编程没什么悬念。
在更难刷满的SWE-Bench Pro上,它考了69.2%,GPT-5.5是58.6%,径直拉开十个百分点。

在挑升模拟实在职场里那些,要脱手、要查贵寓、要敲号召行的基准GDPval-AA中。
Opus 4.8拿了1890 Elo,把第二名GPT-5.5甩开约121分,正面单挑隐含胜率约67%。
不仅如斯,它把完成相似复杂任务的平均交互轮数压到了38次,不需要东说念主类反复纠错,我方就能在一连串试错和推理里摸到最优解。
这恰是它能独自托付系数网站的底层逻辑。


决赛打到这儿
比的不仅仅分数
这场AI王座的争夺战,上个月照旧GPT-5.5的寰宇,它把Opus 4.7掀下了榜首。一个多月后,Opus 4.8原样奉还。
本年春天到当今,这把椅子走动换了好几次手,谁都没坐热过。代差正在被压成以周计的拉锯。
但榜单换来换去,信得过在变的是评判的范例。
模子一朝被当成能孤苦干活的Agent,光贤慧就不够了,还得看它知不知说念我方的范围。

据称Anthropic正洽谈至少300亿好意思元的新融资,估值冲上9000亿,落定就将跨越OpenAI的8520亿,坐上寰球最贵AI公司的位置。
发布Opus 4.8的并吞天,Anthropic还甩出另一手。
比Opus更强的Mythos级模子,几周内就对统统东说念主洞开,而4.8这代的对都评分,照旧追平了阿谁只给一丝数机构试用的Mythos Preview。
贤慧和古道从来不是二选一,Opus 4.8此次的狠处,是两样一块儿往上顶。
个那让全网破防的转世网站,不外是它顺手呼出的连气儿。

