AI · 글로벌

Google Research Gemini-SQL2, 텍스트-투-SQL 벤치마크에서

2026년 6월 13일 오후 10:02출처 1개 종합전개중

Google Research의 Gemini-SQL2가 텍스트를 실행 가능한 SQL 쿼리로 변환하는 성능에서 BIRD 벤치마크에서 80.04%의 정확도를 기록했다. 이는 OpenAI와 Anthropic보다 월등히 높은 수치로, Gemini 3.1 Pro 기반으로 개발되었다. 또한 Anthropic의 Claude Fable 5는 FrontierMath의 가장 어려운 문제에서 88%의 정확도를 달성하며 OpenAI의 GPT-5.5를 13포인트 차이로 앞섰다.

출처 1개해외단일 출처단일 출처

출처 1곳 자세히 보기

해외The Decoder
Google Research의 Gemini-SQL2와 Anthropic의 Claude Fable 5의 성과를 강조함

주장

단일 출처가 제기한, 교차 확인 전 주장

Gemini-SQL2는 자연어를 실행 가능한 SQL 쿼리로 변환함 — The Decoder

Claude Fable 5는 Opus 4.5에서 10% 미만의 정확도에서 큰 도약을 이룸 — The Decoder

OpenAI의 GPT-5.5는 약 75%의 정확도를 기록함 — The Decoder

Google Research의 Gemini-SQL2, BIRD 벤치마크에서 80.04% 정확도 기록 — The Decoder

Anthropic의 Claude Fable 5, FrontierMath에서 88% 정확도 달성 — The Decoder

빠진 관점

아직 확인되지 않았거나 보도에서 빠진 관점

AI 모델 성능 향상에 대한 전문가 의견 미반영

각 모델의 실제 활용 사례에 대한 정보 미제공

출처 원문

The Decoder ↗

여러 공개 출처를 교차검증해 종합·정리한 이슈 카드입니다. 자세한 내용은 원문을, 정정·삭제 요청은 권리침해 신고로 보내주세요.

회원 없이도 댓글 작성 가능 · 작성자 책임 · 권리침해 시 즉시 임시조치

Google Research Gemini-SQL2, 텍스트-투-SQL 벤치마크에서

주장

빠진 관점

출처 원문

AI관련 이슈

댓글