OpenAI는 어려운 문제를 해결하기 위해 구축된 새로운 추론 모델 시리즈를 소개합니다. 9월 12일부터 공식 출시될 예정입니다.
저희는 답을 내리기 전에 더 많은 시간을 들여 생각하는 다양한 새로운 AI 모델을 개발했습니다. 과학, 프로그래밍, 수학 등의 분야에서 이전 모델보다 복잡한 작업을 처리하고 더 까다로운 문제를 해결할 수 있습니다.
오늘, 우리는 ChatGPT 이 시리즈의 첫 번째 모델을 출시했습니다. 이것은 프리뷰 버전이며 정기적으로 업데이트 및 개선할 계획입니다. 그 동안 저희는다음 업데이트된 평가 결과이 업데이트는 현재 개발 중입니다.
작동 원리
저희는 이 모델들이 인간처럼 질문에 답하기 전에 더 깊이 생각하도록 훈련시킵니다. 훈련을 통해 사고 과정을 다듬고 다양한 전략을 시도하며 실수를 인식하는 방법을 배웁니다.
테스트 결과, 바로 실행 가능한 모델 업데이트는 물리학, 화학, 생물학 분야의 까다로운 벤치마크 작업에서 박사급 성능을 발휘했습니다. 또한 수학과 프로그래밍에서도 뛰어난 성능을 보였습니다. 국제 수학 올림피아드(IMO) 예선 시험에서 GPT-4o는 131개의 문제만 정답을 맞힌 반면, 새로운 추론 모델은 831개의 문제를 정답으로 맞혔습니다. 프로그래밍 능력 측면에서는 코드포스 대회에서 이전 89% 수준의 성능을 달성했습니다. 자세한 내용은기술 연구 기사.
초기 모델로서 현재 웹 브라우징 및 파일 이미지 업로드와 같은 ChatGPT의 유용한 기능이 많이 부족합니다. 단기적으로는 많은 일반적인 시나리오에서 GPT-4o가 더 실용적일 수 있습니다.
그러나 복잡한 추론 작업의 경우 이는 중요한 돌파구이며 새로운 수준의 AI 기능을 나타냅니다. 이를 바탕으로 카운터를 1로 재설정하고 시리즈 이름을 OpenAI o Security로 명명했습니다.
이러한 새로운 모델을 개발하면서, 우리는 추론 능력을 최대한 활용하여 안전 및 정렬 지침을 더 잘 준수할 수 있도록 하는 안전 교육에 대한 새로운 접근 방식을 제안합니다. 특정 상황에서 안전 규칙을 추론할 수 있게 됨으로써 이러한 규칙을 보다 효과적으로 적용할 수 있습니다.
보안을 측정하는 한 가지 방법은 사용자가 보안 규칙을 우회하려는 시도(일반적으로 '탈옥'이라고 함)에 직면했을 때 모델이 보안 규칙을 계속 준수하는 능력을 테스트하는 것입니다. 가장 까다로운 탈옥 테스트에서 GPT-4o는 100점 만점에 22점을 받은 반면, o1-preview 모델은 무려 84점을 받았습니다. 자세한 내용은 다음에서 확인할 수 있습니다.시스템 설명그리고 우리의연구 기사.
이러한 모델의 새로운 기능에 맞춰 보안 노력, 내부 거버넌스, 연방 정부와의 협업을 강화했습니다. 여기에는준비 프레임워크엄격한 테스트 및 평가, 최고 수준의 레드팀 테스트, 안전 및 보안 위원회의 참여를 포함한 이사회 차원의 검토 프로세스를 수행합니다.
AI 보안에 대한 노력을 더욱 강화하기 위해 최근 미국과 영국의 AI 보안 기관과 공식 협약을 체결했습니다. 이들 기관에 연구용 버전의 모델에 대한 조기 액세스 권한을 부여하는 것을 포함하여 이러한 계약을 이행하기 시작했습니다. 이는 공개 출시 전후에 향후 모델을 연구, 평가 및 테스트하는 프로세스를 구축하기 위한 파트너십의 중요한 첫 단계입니다.
해당 인구
이러한 향상된 추론 기능은 과학, 프로그래밍, 수학 및 기타 분야의 복잡한 문제를 해결하는 사람들에게 특히 적합합니다. 예를 들어, 의학 연구자는 o1을 사용하여 세포 시퀀싱 데이터에 주석을 달고, 물리학자는 양자 광학에 필요한 복잡한 수학 공식을 생성하며, 다양한 분야의 개발자는 다단계 워크플로우를 구축하고 실행하는 데 사용할 수 있습니다.
OpenAI o1-mini
o1 모델 제품군은 복잡한 코드를 생성하고 디버깅하는 데 탁월한 성능을 발휘합니다. 개발자에게 더욱 효율적인 솔루션을 제공하기 위해 유니티는 OpenAI o1-mini. 더 빠르고 경제적인 추론 모델로, 특히 프로그래밍 작업에 적합합니다. 더 작은 규모의 모델인 o1-mini는 추론 능력이 필요하지만 광범위한 세계 지식이 필요하지 않은 애플리케이션에 강력하고 경제적으로 이상적인 선택입니다.
OpenAI o1 사용 방법
오늘부터 시작됩니다.ChatGPT 플러스 및 팀 사용자o1 모델은 ChatGPT에서 사용할 수 있습니다. 사용자는 모델 선택기에서 o1-preview 및 o1-mini를 수동으로 선택할 수 있습니다. 초기 릴리스에서는 o1-preview는 주당 30개, o1-mini는 주당 50개 메시지로 제한됩니다. 이러한 제한을 늘리고 각 프롬프트에 가장 적합한 모델을 자동으로 선택할 수 있는 기능을 개발하기 위해 노력하고 있습니다.

ChatGPT 엔터프라이즈 및 에듀 사용자는 다음 주부터 두 모델 모두에 액세스할 수 있습니다. 준수 사항 API 사용 수준 5(새 창에서 열기) (명목식 형태로 사용됨)개발자지금 API에서 두 모델 모두로 프로토타입 제작을 시작할 수 있으며, 현재 분당 요청 수는 20건으로 제한되어 있습니다. 이러한 제한을 늘리기 위해 추가 테스트를 진행하고 있습니다. 현재 이러한 모델의 API에는 함수 호출, 스트리밍 및 시스템 메시지 지원과 같은 기능이 포함되어 있지 않습니다. 시작하려면 API 문서(새 창에서 열기).
또한 모든 ChatGPT 무료 사용자둘 다 o1-mini를 사용할 수 있습니다.
향후 전망
이것은 ChatGPT와 API에서 이러한 추론 모델의 초기 미리보기일 뿐입니다. 모델을 지속적으로 업데이트하는 것 외에도 웹 브라우징, 파일 및 이미지 업로드, 기타 기능을 추가하여 유용성을 높이고 있습니다.
새로운 OpenAI o1 제품군 외에도 GPT 모델군을 지속적으로 개발하여 출시할 예정입니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...