Google은 새로운 '추론' AI 모델이라고 부르는 것을 출시했지만 아직 실험 단계에 있으며, 간단한 테스트 결과 개선의 여지가 있는 것으로 나타났습니다.
이 새로운 모델은 쌍둥이자리 2.0 플래시 사고 실험(이름은 약간 입이 떡 벌어집니다)은 AI 스튜디오 Google의 AI 프로토타이핑 플랫폼에서 사용됩니다. 모델 카드에는 "복합적인 이해, 추론, 코딩에 가장 적합"하며 "프로그래밍, 수학, 물리학 등의 분야에서 가장 복잡한 문제를 해결할 수 있다"고 설명되어 있습니다.
AI 스튜디오 제품을 담당하는 로건 킬패트릭은 X에 올린 게시물에서 Gemini 2.0 플래시 사고 실험을 구글의 '추론 여정의 첫걸음'이라고 불렀습니다. 구글 딥마인드의 수석 과학자인 제프 딘은 자신의 게시물에서 제미니 2.0 플래시 사고 실험이 추론을 향상시키기 위해 사고를 사용하도록 훈련되었다고 말했습니다.
딘은 모델이 질문에 답하는 데 필요한 계산량을 언급하며 "추론 시간에 대한 계산량을 늘렸을 때 고무적인 결과를 확인했습니다."라고 말했습니다.

Gemini 2.0 플래시 사고 실험은 최근 출시된 Google의 Gemini 2.0 플래시 모델을 기반으로 하며, OpenAI의 o1 및 기타 소위 추론 모델과 설계가 유사해 보입니다. 대부분의 AI와 달리 이 추론 모델은 효과적으로 스스로를 점검하여 일반적으로 AI 모델을 잘못 만들 수 있는 몇 가지 함정을 피합니다.
그러나 추론 모델의 단점은 일반적으로 솔루션에 도달하는 데 몇 초에서 몇 분까지 시간이 오래 걸린다는 점입니다.
어떤 프롬프트에 직면하면 Gemini 2.0 플래시 사고 실험은 응답하기 전에 잠시 멈추고 여러 관련 프롬프트를 고려한 후 그 과정에서 추론을 '설명'합니다. 나중에 모델은 가장 정확한 답변이라고 생각되는 것을 요약합니다.
이론적으로는 그래야 합니다. Gemini 2.0 플래시 사고 실험에 "딸기"라는 단어에 몇 개의 R이 있는지 물었더니 "두 개"라고 대답했습니다.

Google의 새로운 추론 모델은 단어의 글자를 계산할 때 성능이 저하되고 때때로 실수를 범합니다. 이미지 크레딧: Google
실제 결과는 사람마다 다를 수 있습니다.
o1 출시 이후, 구글뿐만 아니라 경쟁 AI 연구소의 추론 모델이 폭발적으로 증가했습니다. 퀀트 트레이더가 자금을 지원하는 AI 연구 회사 DeepSeek 는 11월 초에 첫 번째 추론 모델인 DeepSeek-R1을 미리 선보였고, 같은 달에 알리바바의 Qwen 팀은 오픈 챌린지 o1의 첫 번째 추론 모델이라고 주장한 것을 발표했습니다.
10월에는 구글에 추론 모델을 연구하는 여러 팀이 있다는 보도가 있었습니다. 그 후 11월 보고서에서 더 인포메이션은 구글에 최소 200명의 연구원이 이 기술에 집중하고 있다고 밝혔습니다.
추론 모델링의 붐을 일으킨 이유는 무엇일까요? 한 가지 이유는 생성형 AI를 개선할 수 있는 새로운 방법을 찾기 위해서입니다. 제 동료 Max Zeff가 최근 보고한 바와 같이, 모델 확장을 위한 '무차별 대입' 기법은 더 이상 예전만큼의 개선 효과를 제공하지 못합니다.
모든 사람이 추론 모델이 최선의 방법이라고 확신하는 것은 아닙니다. 우선, 추론 모델은 모델을 실행하는 데 필요한 연산 능력 때문에 비용이 많이 드는 경향이 있습니다. 또한 벤치마크에서는 좋은 성능을 보이지만 추론 모델이 이러한 발전 속도를 유지할 수 있는지는 확실하지 않습니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...