창간 80주년 경향신문

Cutting-edge AI models bet on Premier League matches···“all losses”



완독

경향신문

공유하기

  • 카카오톡

  • 페이스북

  • X

  • 이메일

보기 설정

글자 크기

  • 보통

  • 크게

  • 아주 크게

컬러 모드

  • 라이트

  • 다크

  • 베이지

  • 그린

컬러 모드

  • 라이트

  • 다크

  • 베이지

  • 그린

본문 요약

인공지능 기술로 자동 요약된 내용입니다. 전체 내용을 이해하기 위해 본문과 함께 읽는 것을 추천합니다.
(제공 = 경향신문&NAVER MEDIA API)

내 뉴스플리에 저장

Cutting-edge AI models bet on Premier League matches···“all losses”

입력 2026.04.12 16:38

  • By No Do-Hyun

This article was translated by an AI tool. Feedback Here.

AP Yonhap News

AP Yonhap News

A study found that major advanced artificial intelligence (AI) models all posted losses in a virtual betting experiment that recreated one season of the English Premier League.

On the 12th, according to industry sources, the UK AI startup Generalizing released the paper ‘KellyBench’, which reports results from testing eight leading AI systems in a simulated environment that replayed the 2023-2024 Premier League season. The models tested included OpenAI GPT-5.4, Anthropic Claude Opus 4.6, Google Gemini 3.1 Pro, and xAI Grok 4.20.

The researchers provided each AI with detailed data on past matches and players, then instructed it to build a model to maximize returns and manage risk. On each match day, the AI was made to place at least one bet by choosing types such as match result and goals. To prevent advance access to outcomes, internet access was blocked. After each match, results and player-level detailed statistics were provided so the models could use them for improvement. The test was conducted three times per model, and each attempt began with initial capital of 100,000 pounds (approximately 200 million KRW).

Claude Opus 4.6 showed the best performance, but its average return was negative (-11%). Even the best result across its three runs was only −0.2%. The only ones that avoided bankruptcy were Claude Opus 4.6 and GPT-5.4 (average return −13.6%).

Other models either lost all initial funds at least once or failed to complete the betting itself. Gemini 3.1 Pro, which recorded an average return of -43.3%, achieved a 34% gain once but experienced bankruptcy in another run. Grok 4.20 went bankrupt once, and the other two runs were not completed.

The researchers explained that while AI demonstrates strong abilities on procedural tasks with clear goals, its performance in environments that keep changing and have no single correct answer, as in the real world, has not been properly verified. The researchers said, “This study has several limitations, but current AI models are, overall, underperforming humans.” Just as an athlete can see performance change after a long-term injury, in situations where the environment continues to change over time, AI shows limits in responding. However, this paper has not yet undergone peer review.

Ross Taylor, CEO of Generalizing, told the Financial Times, “Expectations for AI automation are high, but there are not many attempts to evaluate AI in long-term environments,” emphasizing the need for evaluations that reflect real-world complexity.

  • AD
  • AD
  • AD
뉴스레터 구독
닫기

전체 동의는 선택 항목에 대한 동의를 포함하고 있으며, 선택 항목에 대해 동의를 거부해도 서비스 이용이 가능합니다.

보기

개인정보 이용 목적- 뉴스레터 발송 및 CS처리, 공지 안내 등

개인정보 수집 항목- 이메일 주소, 닉네임

개인정보 보유 및 이용기간- 원칙적으로 개인정보 수집 및 이용목적이 달성된 후에 해당정보를 지체없이 파기합니다. 단, 관계법령의 규정에 의하여 보존할 필요가 있는 경우 일정기간 동안 개인정보를 보관할 수 있습니다.
그 밖의 사항은 경향신문 개인정보취급방침을 준수합니다.

보기

경향신문의 새 서비스 소개, 프로모션 이벤트 등을 놓치지 않으시려면 '광고 동의'를 눌러 주세요.

여러분의 관심으로 뉴스레터가 성장하면 뉴욕타임스, 월스트리트저널 등의 매체처럼 좋은 광고가 삽입될 수 있는데요. 이를 위한 '사전 동의'를 받는 것입니다. 많은 응원 부탁드립니다. (광고만 메일로 나가는 일은 '결코' 없습니다.)

뉴스레터 구독
닫기

닫기
닫기

뉴스레터 구독이 완료되었습니다.

개인정보 수집 및 이용
닫기

개인정보 이용 목적- 뉴스레터 발송 및 CS처리, 공지 안내 등

개인정보 수집 항목- 이메일 주소, 닉네임

개인정보 보유 및 이용기간- 원칙적으로 개인정보 수집 및 이용목적이 달성된 후에 해당정보를 지체없이 파기합니다. 단, 관계법령의 규정에 의하여 보존할 필요가 있는 경우 일정기간 동안 개인정보를 보관할 수 있습니다.
그 밖의 사항은 경향신문 개인정보취급방침을 준수합니다.

닫기
광고성 정보 수신 동의
닫기

경향신문의 새 서비스 소개, 프로모션 이벤트 등을 놓치지 않으시려면 '광고 동의'를 눌러 주세요.

여러분의 관심으로 뉴스레터가 성장하면 뉴욕타임스, 월스트리트저널 등의 매체처럼 좋은 광고가 삽입될 수 있는데요. 이를 위한 '사전 동의'를 받는 것입니다. 많은 응원 부탁드립니다. (광고만 메일로 나가는 일은 '결코' 없습니다.)

닫기