OpenAI's GPT-5.5, launched April 23, 2026, scored 41.4% on Humanity's Last Exam—a 2,500-question benchmark testing frontier large language model reasoning across math, science, and humanities—edging past GPT-5.4's 39.8% without tools, with Pro variants hitting 43.1%. This keeps OpenAI competitive, though behind Anthropic's Claude Opus 4.7 (46.9%) and Google's Gemini 3.1 Pro Preview (44.7% on leaderboards). The May 5 debut of GPT-5.5 Instant as ChatGPT's default model offers no disclosed HLE results, likely due to its lighter design. Six weeks from June 30, potential GPT-5.6 previews or independent evals could shift dynamics in this fast-evolving AI capability race.
สรุปจาก AI ทดลองที่อ้างอิงข้อมูลจาก Polymarket ไม่ใช่คำแนะนำในการเทรดและไม่มีผลต่อการตัดสินตลาดนี้ · อัปเดตแล้ว$23,124 ปริมาณ
50%+
29%
$23,124 ปริมาณ
50%+
29%
The resolution source will be the official Humanity’s Last Exam leaderboard https://scale.com/leaderboard/humanitys_last_exam.
ตลาดเปิดเมื่อ: Jan 30, 2026, 12:00 AM ET
Resolver
0x65070BE91...The resolution source will be the official Humanity’s Last Exam leaderboard https://scale.com/leaderboard/humanitys_last_exam.
Resolver
0x65070BE91...OpenAI's GPT-5.5, launched April 23, 2026, scored 41.4% on Humanity's Last Exam—a 2,500-question benchmark testing frontier large language model reasoning across math, science, and humanities—edging past GPT-5.4's 39.8% without tools, with Pro variants hitting 43.1%. This keeps OpenAI competitive, though behind Anthropic's Claude Opus 4.7 (46.9%) and Google's Gemini 3.1 Pro Preview (44.7% on leaderboards). The May 5 debut of GPT-5.5 Instant as ChatGPT's default model offers no disclosed HLE results, likely due to its lighter design. Six weeks from June 30, potential GPT-5.6 previews or independent evals could shift dynamics in this fast-evolving AI capability race.
สรุปจาก AI ทดลองที่อ้างอิงข้อมูลจาก Polymarket ไม่ใช่คำแนะนำในการเทรดและไม่มีผลต่อการตัดสินตลาดนี้ · อัปเดตแล้ว
ระวังลิงก์ภายนอก
ระวังลิงก์ภายนอก
คำถามที่พบบ่อย