Skip to main content
icon for ¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?

¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?

icon for ¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?

¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?

$61,907 Vol.

28 feb 2026
Polymarket

$61,907 Vol.

Polymarket

50%+

$14,873 Vol.

55%

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.OpenAI's GPT-5.5 Pro recently claimed the FrontierMath lead at 52.4% as of May 13, 2026, outpacing Anthropic's Claude Opus 4.7 Adaptive at 43.8% on this benchmark of 350 expert-vetted math problems spanning undergraduate to research-level challenges, evaluated with Python tool access. Claude's score reflects solid progress from prior versions but trails amid OpenAI's rapid math reasoning advances, highlighting Anthropic's relative emphasis on agentic coding strengths like 77.8% on SWE-Bench Pro over pure mathematical scaling. With six weeks until June 30 resolution, traders eye potential Claude 5 previews or Opus updates, bolstered by Anthropic's $1.8 billion Akamai compute deal, though Epoch AI's recent flagging of benchmark errors adds evaluation uncertainty.

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No".

This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered.

The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
Volumen
$61,907
Fecha de finalización
30 jun 2026
Mercado abierto
Jan 30, 2026, 12:00 AM ET
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.OpenAI's GPT-5.5 Pro recently claimed the FrontierMath lead at 52.4% as of May 13, 2026, outpacing Anthropic's Claude Opus 4.7 Adaptive at 43.8% on this benchmark of 350 expert-vetted math problems spanning undergraduate to research-level challenges, evaluated with Python tool access. Claude's score reflects solid progress from prior versions but trails amid OpenAI's rapid math reasoning advances, highlighting Anthropic's relative emphasis on agentic coding strengths like 77.8% on SWE-Bench Pro over pure mathematical scaling. With six weeks until June 30 resolution, traders eye potential Claude 5 previews or Opus updates, bolstered by Anthropic's $1.8 billion Akamai compute deal, though Epoch AI's recent flagging of benchmark errors adds evaluation uncertainty.

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No".

This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered.

The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
Volumen
$61,907
Fecha de finalización
30 jun 2026
Mercado abierto
Jan 30, 2026, 12:00 AM ET
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.

Cuidado con los enlaces externos.

Preguntas frecuentes

"¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?" es un mercado de predicción en Polymarket con 4 resultados posibles donde los operadores compran y venden acciones según lo que creen que sucederá. El resultado líder actual es "25%+" con 100%, seguido de "30%+" con 100%. Los precios reflejan probabilidades en tiempo real de la comunidad. Por ejemplo, una acción cotizada a 100¢ implica que el mercado colectivamente asigna una probabilidad de 100% a ese resultado. Estas probabilidades cambian continuamente a medida que los operadores reaccionan a nuevos desarrollos. Las acciones del resultado correcto son canjeables por $1 cada una tras la resolución del mercado.

A día de hoy, "¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?" ha generado $61.9K en volumen total de trading desde que el mercado se lanzó el Jan 30, 2026. Este nivel de actividad refleja un fuerte compromiso de la comunidad de Polymarket y ayuda a garantizar que las probabilidades actuales estén respaldadas por un amplio grupo de participantes del mercado. Puedes seguir los movimientos de precios en vivo y operar en cualquier resultado directamente en esta página.

Para operar en "¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?", explora los 4 resultados disponibles en esta página. Cada resultado muestra un precio actual que representa la probabilidad implícita del mercado. Para tomar una posición, selecciona el resultado que consideres más probable, elige "Sí" para operar a favor o "No" para operar en contra, introduce tu cantidad y haz clic en "Operar". Si tu resultado elegido es correcto cuando el mercado se resuelve, tus acciones de "Sí" pagan $1 cada una. Si es incorrecto, pagan $0. También puedes vender tus acciones en cualquier momento antes de la resolución.

El favorito actual para "¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?" es "25%+" con 100%, lo que significa que el mercado asigna una probabilidad de 100% a ese resultado. El siguiente resultado más cercano es "30%+" con 100%. Estas probabilidades se actualizan en tiempo real a medida que los operadores compran y venden acciones. Vuelve con frecuencia o guarda esta página en marcadores.

Las reglas de resolución para "¿Puntuación antrópica de Claude en FrontierMath Benchmark antes del 30 de junio?" definen exactamente qué debe ocurrir para que cada resultado sea declarado ganador, incluyendo las fuentes de datos oficiales utilizadas para determinar el resultado. Puedes revisar los criterios de resolución completos en la sección "Reglas" en esta página sobre los comentarios. Recomendamos leer las reglas cuidadosamente antes de operar, ya que especifican las condiciones exactas, casos especiales y fuentes.