Alpha Arena首季落幕 Qwen 3 MAX夺冠 GPT-5与Gemini陷入亏损

2025-11-04

11月4日消息，人工智能模型竞赛平台nof1.ai创始人Jay A在X平台发文宣布，Alpha Arena第一季正式落下帷幕。本赛季中，由阿里巴巴团队开发的Qwen 3 MAX以出色表现夺得冠军，最终账户余额达到12,252.72美元，成为唯一实现显著盈利的模型之一。与此同时，DeepSeek以10,634.21美元的最终余额位列第二，也保持了正收益。其余参赛模型包括GPT-5、Gemini 2.5 Pro、Grok-4和Claude Sonnet 4.5则均录得不同程度的亏损，显示出AI模型在真实市场策略环境下的表现差距依旧明显。

根据nof1.ai公布的最终数据，Qwen 3 MAX凭借精准的风险控制与策略调整能力，在本赛季中稳定取得收益，其22%的整体回报率在所有参赛模型中遥遥领先。DeepSeek虽然略逊一筹，但依然保持了约6%的正向增长，显示出较为稳健的策略执行能力。相比之下，OpenAI的GPT-5、Anthropic的Claude Sonnet 4.5、X AI的Grok-4以及谷歌的Gemini 2.5 Pro等模型在Alpha Arena的动态交易环境中均出现亏损，其中GPT-5最终余额为3534.53美元，Gemini 2.5 Pro为3980.75美元，Grok-4为5758.49美元，Claude Sonnet 4.5为7294.59美元，亏损幅度从20%至60%不等。

Alpha Arena作为nof1.ai推出的一项AI模型实盘竞赛，旨在通过真实数据环境下的策略执行，检验各大人工智能模型在资产管理、量化决策、风险控制等方面的综合能力。比赛为期数月，期间模型根据预设算法自动执行投资与交易指令，系统根据最终资产余额评定排名结果。Jay A在总结中指出，本次赛事为AI模型的市场化能力提供了重要参考，也揭示了不同模型在推理、预测与策略执行方面的结构性差异。

值得注意的是，尽管GPT-5等大型语言模型在自然语言处理和内容生成方面表现强劲，但其在实时决策与市场反应方面仍存在延迟与过拟合问题。nof1.ai的技术团队在复盘中提到，部分模型在面对波动市场时缺乏足够的自适应性，导致策略执行滞后，从而扩大亏损。相比之下，Qwen 3 MAX与DeepSeek在优化算法中引入了短期反馈机制，使模型能够快速调整权重以应对不同市场情境，这被视为其领先的关键因素。

nof1.ai创始人Jay A表示，Alpha Arena第一季的结果证明，不同AI模型之间的表现差异远超预期，而“智能投资”的未来方向将不再局限于单一模型能力，而是取决于模型间的动态协作与策略组合。他同时透露，Alpha Arena Season 1.5正在筹备中，新赛季将在模型训练机制、回测框架及风险约束上进行重大升级，并引入新的AI Benchmark指标，以更科学地评估模型表现。

业内人士认为，Alpha Arena的出现正在推动AI金融实验进入一个新阶段，其真实竞赛结果为业界提供了关于模型经济学和算法优化的实证样本。随着更多AI公司参与未来赛季，这一平台有望成为衡量AI策略模型投资能力的“标准试炼场”，同时也揭示出人工智能在现实经济体系中应用的潜力与局限。

2025-07-16: 从草根到市值 6000 亿，Robinhood 娱乐至生

起于零佣金，兴于加密热。

2025-05-16: 美国立法者将于5月19日对稳定币GENIUS法案进行最终表决

PANews5月16日消息，据Coingape报道，美国参议院多数党领袖JohnThune已正式提交《GENIUS法案》的终结辩论动议，定于5月19日进行表决。这项稳定币监管法案要求：资产超100亿美...

2024-12-23: 淘金手册 | 潜在稳定币存款空投哪家强？

而存款类项目 TGE 后的财富效应也较为显著，例如近期火热的 Usual 存款为用户带来了约 50% 存款量的收益，此前 Ethena 也为首期用户带来了 70% 的收益率，且几个项目均是在短短几个月的存款周期内便为用户带来了可观的回报，由此，很多存款项目正在吸引越来越多的链上流动性入局押注。

2025-01-24: BNB Chain举办新年红包嘉年华，分发价值逾30万美元的代币奖励迎接新年

PANews1月23日消息，BNBChain宣布将开展红包嘉年华活动，派发超30万美元的奖励红包，希望这些象征着好运与繁荣的红包可以为社区用户带去美好的祝福，享受节日的狂欢。此次红包嘉年华为期三周，从...

2025-01-22: PumpFun向Kraken转移约2800万美元的SOL

PANews1月21日消息，据OnchainLens监测，PumpFun刚向Kraken转移116,054.56枚SOL，价值约2800万美元。2025年以来，其累计已向Kraken转移692,877...

2025-07-16: “内幕巨鲸”近半小时平仓319.68枚BTC实现盈利20.5万美元

PANews7月15日消息，据链上分析师@ai_9684xtpa监测，7月11日至7月14日做空亏损957.4万美元的“内幕巨鲸”此次谨慎采取止盈操作。过去半小时内，该交易员平仓319.68枚BTC实...

欧易交易所

欧易OKX 数字资产服务平台

Alpha Arena首季落幕 Qwen 3 MAX夺冠 GPT-5与Gemini陷入亏损

从草根到市值 6000 亿，Robinhood 娱乐至生

美国立法者将于5月19日对稳定币GENIUS法案进行最终表决

淘金手册 | 潜在稳定币存款空投哪家强？

BNB Chain举办新年红包嘉年华，分发价值逾30万美元的代币奖励迎接新年

PumpFun向Kraken转移约2800万美元的SOL

“内幕巨鲸”近半小时平仓319.68枚BTC实现盈利20.5万美元

所有话题