AI · 글로벌
Google Research Gemini-SQL2, 텍스트-투-SQL 벤치마크에서

Google Research의 Gemini-SQL2가 텍스트를 실행 가능한 SQL 쿼리로 변환하는 성능에서 BIRD 벤치마크에서 80.04%의 정확도를 기록했다. 이는 OpenAI와 Anthropic보다 월등히 높은 수치로, Gemini 3.1 Pro 기반으로 개발되었다. 또한 Anthropic의 Claude Fable 5는 FrontierMath의 가장 어려운 문제에서 88%의 정확도를 달성하며 OpenAI의 GPT-5.5를 13포인트 차이로 앞섰다.
출처 1개해외단일 출처단일 출처
출처 1곳 자세히 보기
Google Research의 Gemini-SQL2와 Anthropic의 Claude Fable 5의 성과를 강조함
주장
단일 출처가 제기한, 교차 확인 전 주장
Gemini-SQL2는 자연어를 실행 가능한 SQL 쿼리로 변환함 — The Decoder
Claude Fable 5는 Opus 4.5에서 10% 미만의 정확도에서 큰 도약을 이룸 — The Decoder
OpenAI의 GPT-5.5는 약 75%의 정확도를 기록함 — The Decoder
Google Research의 Gemini-SQL2, BIRD 벤치마크에서 80.04% 정확도 기록 — The Decoder
Anthropic의 Claude Fable 5, FrontierMath에서 88% 정확도 달성 — The Decoder
빠진 관점
아직 확인되지 않았거나 보도에서 빠진 관점
AI 모델 성능 향상에 대한 전문가 의견 미반영
각 모델의 실제 활용 사례에 대한 정보 미제공
이런 정리를 매일 아침 8시 메일로
댓글
회원 없이도 댓글 작성 가능 · 작성자 책임 · 권리침해 시 즉시 임시조치