최근 AI 시장이 그야말로 뜨겁습니다. OpenAI, Google DeepMind, Anthropic 같은 빅테크들이 앞다퉈 AI 모델을 선보이고 있는데요. 이번엔 일론 머스크의 AI 스타트업 ‘xAI’가 그 대열에 합류했습니다.
머스크가 직접 이끄는 xAI가 새롭게 공개한 ‘그록3(Grok 3)’, 과연 어느 정도의 실력을 갖췄을까요? 기존 강자인 GPT-4o(OpenAI), Gemini-2 Pro(Google), Claude 3.5 Sonnet(Anthropic) 등을 뛰어넘을 수 있을지, 함께 살펴보겠습니다.
🧠 그록3, 얼마나 똑똑할까?
머스크는 지난 17일, 실시간 방송을 통해 그록3를 공개하며 “지구에서 가장 똑똑한 AI” 라고 소개했습니다. 단순한 허세일까요, 아니면 진짜일까요?
일단, 객관적인 성능 평가를 보면 꽤나 인상적입니다. AI 성능 평가 사이트 Chatbot Arena에서 상위권 점수를 기록하며 기존 모델들을 압도했다고 하는데요. 특히 수학, 과학, 코딩 같은 실전 문제 해결 능력에서 강한 모습을 보였습니다.
📊 벤치마크 성적 비교
테스트 | 그록3 | GPT-4o | Claude 3.5 | Gemini-2 Pro |
수학 (AIME 2024) | 52점 | 40점 | 39점 | - |
과학 (GPQA) | 75점 | 65점 | 50점 | 65점 |
코딩 (LCB Oct-Feb) | 57점 | 41점 | - | 40점 |
🔎 위 데이터를 보면 확실히 그록3가 수학, 과학, 코딩 분야에서 뛰어난 성과를 냈다는 걸 알 수 있습니다.
🎯 그록3의 특별한 점은?
그록3는 기존 AI 모델과 차별화된 몇 가지 강력한 기능을 갖추고 있습니다.
1️⃣ 하나의 모델이 아니다?
그록3는 단순한 단일 모델이 아니라, 용도에 따라 최적화된 세 가지 모델로 구성되어 있습니다.
- 기본 모델: 일상적인 질문과 문제 해결에 최적화
- 작은 모델: 경량화되어 빠르게 응답 가능
- 추론 특화 모델: 논리적으로 깊이 있는 답변 제공
이 방식은 AI 성능을 보다 효율적으로 활용할 수 있게 해준다고 하네요.
2️⃣ ‘딥서치(Deep Search)’ 기능 추가
기존 AI 모델들이 단순한 검색 결과를 나열하는 방식이었다면, 그록3는 ‘딥서치’라는 고급 검색 기능을 제공합니다.
✅ 어떻게 다를까?
- AI가 질문의 의도를 파악
- 방대한 인터넷 데이터를 분석
- 종합적으로 정리된 답변을 제공
이 기능은 OpenAI가 준비 중인 ‘딥리서치(Deep Research)’ 기능과 유사한데요. xAI가 AI 검색 시장에서도 본격적으로 영향력을 확대하려는 의도로 보입니다.
3️⃣ 미친 학습 인프라
그록3의 학습을 위해 무려 20만 개 이상의 NVIDIA AI 칩이 사용되었다고 합니다. 😳
이 때문에 미국 테네시주 멤피스에 새로운 데이터센터를 확장했으며, 앞으로 더 많은 모델을 학습시킬 계획이라고 하네요.
⚔️ AI 전쟁, 이제 시작이다
사실 머스크가 AI 시장에 뛰어든 게 이번이 처음은 아닙니다.
2015년 OpenAI를 공동 창립했지만, 이후 방향성 차이로 2018년에 회사를 떠났죠.
그러다 2023년 xAI를 설립하면서 본격적으로 OpenAI와 경쟁하는 AI 모델을 내놓기 시작했습니다.
그록1, 그록2는 GPT-4 기반 모델들보다 다소 부족하다는 평가를 받았지만, 이번 그록3는 완전히 달라졌습니다.
벤치마크 결과를 보면, 오히려 경쟁 모델을 뛰어넘을 가능성이 보이기도 합니다.
🔮 앞으로 어떻게 될까?
머스크는 그록3를 X(구 트위터)의 유료 구독자들에게 우선 제공하며, 향후 더 많은 기능을 추가할 예정이라고 밝혔습니다.
🎤 곧 추가될 기능
✅ 음성 모드: 음성으로 대화하는 기능 지원 예정
✅ 그록2 오픈소스 공개: 몇 달 내로 오픈소스화 계획
AI 시장은 정말 빠르게 변하고 있습니다.
그록3가 이 흐름 속에서 얼마나 성장할지, 그리고 진짜 “지구에서 가장 똑똑한 AI” 타이틀을 거머쥘 수 있을지, 앞으로의 행보가 기대되네요! 🚀
💬 여러분의 생각은?
그록3가 기존 AI 모델들을 넘어설 수 있을까요?
AI 시장의 경쟁이 점점 더 흥미로워지는 것 같습니다.
여러분의 의견도 댓글로 남겨주세요! 😊