AI · 글로벌

Google Research Gemini-SQL2, 텍스트-투-SQL 벤치마크에서

사진: HaeB · CC BY-SA 4.0 (Wikimedia Commons)

Google Research의 Gemini-SQL2가 텍스트를 실행 가능한 SQL 쿼리로 변환하는 성능에서 BIRD 벤치마크에서 80.04%의 정확도를 기록했다. 이는 OpenAI와 Anthropic보다 월등히 높은 수치로, Gemini 3.1 Pro 기반으로 개발되었다. 또한 Anthropic의 Claude Fable 5는 FrontierMath의 가장 어려운 문제에서 88%의 정확도를 달성하며 OpenAI의 GPT-5.5를 13포인트 차이로 앞섰다.

출처 1해외단일 출처단일 출처
출처 1곳 자세히 보기
  • Google Research의 Gemini-SQL2와 Anthropic의 Claude Fable 5의 성과를 강조함

주장

단일 출처가 제기한, 교차 확인 전 주장

Gemini-SQL2는 자연어를 실행 가능한 SQL 쿼리로 변환함The Decoder

Claude Fable 5는 Opus 4.5에서 10% 미만의 정확도에서 큰 도약을 이룸The Decoder

OpenAI의 GPT-5.5는 약 75%의 정확도를 기록함The Decoder

Google Research의 Gemini-SQL2, BIRD 벤치마크에서 80.04% 정확도 기록The Decoder

Anthropic의 Claude Fable 5, FrontierMath에서 88% 정확도 달성The Decoder

빠진 관점

아직 확인되지 않았거나 보도에서 빠진 관점

AI 모델 성능 향상에 대한 전문가 의견 미반영

각 모델의 실제 활용 사례에 대한 정보 미제공

출처 원문

The Decoder

여러 공개 출처를 교차검증해 종합·정리한 이슈 카드입니다. 자세한 내용은 원문을, 정정·삭제 요청은 권리침해 신고로 보내주세요.

이런 정리를 매일 아침 8시 메일로

댓글

    회원 없이도 댓글 작성 가능 · 작성자 책임 · 권리침해 시 즉시 임시조치