추가: o1-mini가 ChatGPT 무료 계정 체험을 위해 완전히 개방되었습니다!

AI 뉴스2 년 전 게시 됨 AI 공유 서클

42.6K 00

号外：o1-mini已全面开放给ChatGPT免费账户体验

o1 모델군은 고급 프로세스 추론 모델이며, 그 중 작은 크기의 o1-mini 모델은 세계 지식 능력이 축소되었지만 논리적 추론 측면에서 o1-프리뷰보다 더 강할 수 있는 잠재력을 가지고 있습니다.

현재 o1-mini는 일부 무료 계정만 미리 체험할 수 있으며, 정식으로 개설된 계정인지 여부는 다음 해독 질문을 통해 확인할 수 있습니다:

oyfjdnisdr rtqwainr acxz mynzbhx -> 단계별로 생각하기
위의 예시를 사용하여 디코딩합니다.
데이터 보호 및 데이터 유출 방지 솔루션

위의 유효성 검사 질문은 다음에서 가져온 것입니다. 대규모 언어 모델을 위한 OpenAI o1 추론 능력 학습o1-mini 모델에 대한 자세한 내용은 다음 문서를 참조하세요. OpenAI o1-mini 매크로 모델 소개.

ChatGPT 무료 계정이 없거나 o1-mini 체험을 이용할 수 없는 경우 여기를 방문하세요:ChatGPT 미러 사이트(GPT4 시리즈 모델에 대한 국내 액세스) 경험.

OpenAI o1 모델에 대한 몇 가지 궁금한 점

모델 이름 및 추론 패턴

OpenAI o1은 새로운 수준의 AI 기능을 나타내며 카운터는 1로 초기화됩니다.
'미리보기'는 정식 모델의 초기 버전임을 나타냅니다.
'미니'는 속도에 최적화된 o1 모델의 작은 버전임을 나타냅니다.
o - OpenAI를 대신하여
O1은 '시스템'이 아니라 최종 답을 제공하기 전에 학생들이 추론의 사슬을 성장시키도록 훈련하는 모델입니다.
O1의 아이콘은 특별한 능력을 가진 외계인을 상징적으로 나타냅니다.

o1 모델 크기 및 성능

o1-mini는 o1-preview보다 작고 빠르므로 향후 무료 사용자도 사용할 수 있습니다.
O1-PREVIEW는 너무 크지도 작지도 않은 O1 모델의 초기 체크포인트입니다.
o1-mini는 STEM 작업에서 더 나은 성능을 보이지만 세계 지식에 제한이 있습니다.
o1-mini는 일부 작업, 특히 코드 관련 작업에서 o1-preview보다 더 나은 성능을 발휘합니다.
o1에 대한 입력 토큰 는 동일한 토큰화 도구를 사용하여 GPT-4o와 동일한 방식으로 계산됩니다.
o1-preview에 비해 o1-mini는 더 많은 생각의 사슬을 탐색할 수 있습니다.

입력 토큰 컨텍스트 및 모델 기능

O1 모델은 곧 더 큰 입력 컨텍스트를 지원할 예정입니다.
o1 모델은 GPT-4o와 같이 청크 입력을 줄일 필요 없이 더 길고 개방적인 작업을 처리할 수 있습니다.
o1은 이전 모델과 달리 답을 제공하기 전에 긴 추론 체인을 생성할 수 있습니다.
현재는 더 많은 컨텍스트를 추가하기 위해 CoT 추론 중에 추론을 일시 중지할 수 없지만, 향후 모델에서 이 기능을 검토 중입니다.

도구, 기능 및 향후 기능

o1-preview는 현재 도구가 없지만 함수 호출, 코드 인터프리터 및 검색 기능을 지원할 계획입니다.
도구 지원, 구조화된 출력 및 시스템 힌트는 향후 업데이트에 추가될 예정입니다.
사용자는 결국 사고 시간과 토큰 한도를 제어할 수 있습니다.
스트리밍 처리를 지원하고 추론 진행 상황을 API에 반영하는 것을 고려하는 계획이 진행 중입니다.
o1의 멀티모달 기능은 MMMU와 같은 작업에서 최첨단 성능을 달성하는 것을 목표로 내장되었습니다.

CoT(연쇄 추론) 추론

o1 추론 프로세스 중 숨겨진 추론 체인 생성하기
API 사용자 또는 ChatGPT에 CoT 토큰을 노출할 계획이 없습니다.
CoT 토큰은 요약되어 있지만 실제 추론 과정과 완전히 일치한다는 보장은 없습니다.
프롬프트의 지침은 모델이 문제에 대해 생각하는 방식에 영향을 줄 수 있습니다.
강화 학습(RL)을 사용하여 o1의 CoT 역량을 강화한 반면, GPT-4o는 큐잉만으로는 CoT 성능을 달성할 수 없었습니다.
추론 단계가 느리게 보일 수 있지만, 실제로는 추론 과정을 요약하기 때문에 일반적으로 답변 생성 속도가 더 빠릅니다.

API 및 사용 제한

o1-mini는 ChatGPT Plus 사용자에게 주당 50개의 메시지가 제한됩니다.
모든 단서는 ChatGPT에서 동일하게 계산됩니다.
향후 더 많은 API 액세스 계층 및 더 높은 한도 적용 예정
API의 힌트 캐싱은 수요가 많지만 아직 타임라인이 없습니다.

가격 책정, 미세 조정 및 확장

o1 모델 가격은 1~2년마다 가격 하락 추세를 따를 것으로 예상됩니다.
제한이 증가함에 따라 지원되는 볼륨 API 가격
미세 조정이 진행 중이지만 일정은 아직 결정되지 않았습니다.
o1 연구 및 엔지니어링 인재의 병목 현상으로 인한 확장 제한
추론 컴퓨팅을 위한 새로운 확장 패러다임은 미래 세대의 모델에서 상당한 향상을 가져올 수 있습니다.
역방향 확장은 현재 중요하지 않지만, 개별 쓰기 프롬프트에서 o1-preview는 GPT-4o보다 약간 더 나은(또는 약간 더 나쁜) 성능을 보입니다.

모델 개발 및 연구 인사이트

o1 집중 학습 훈련을 통한 추론 능력 향상
이 모델은 창의적인 사고를 보여주며 시와 같은 측면 작업에 탁월합니다.
o1의 철학적 추론과 광범위한 추론 능력은 암호 해독과 같이 인상적입니다.
연구원들은 o1을 사용하여 코드 검토에 적합한 코드 소유자를 핑하는 GitHub 봇을 만들었습니다.
내부 테스트에서 o1은 다음과 같은 능력을 평가하기 위해 스스로에게 어려운 질문을 던졌습니다.
광범위한 월드 도메인 지식이 추가되고 있으며 향후 릴리스에서 개선될 예정입니다.
o1-mini에 추가될 예정인 업데이트 데이터(현재 2023년 10월)

팁 및 모범 사례

o1 엣지 케이스 또는 추론 스타일에 대한 단서를 제공함으로써 얻을 수 있는 이점
o1 모델은 이전 모델보다 추론 단서를 더 잘 받아들입니다.
검색 증강 생성(RAG)에서 관련 컨텍스트를 제공하면 성능이 향상되며, 관련 없는 조각은 추론을 약화시킬 수 있습니다.

일반적인 피드백 및 향후 개선 사항

o1-프리뷰는 초기 테스트 단계이기 때문에 덜 제한적이지만
지연 시간 및 추론 시간이 적극적으로 개선되고 있습니다.

중요한 모델링 기능

o1은 "삶이란 무엇인가?"와 같은 철학적 질문에 대해 생각할 수 있습니다.
연구원들은 o1이 제한된 지침에서 복잡한 작업과 광범위한 추론을 처리하는 데 탁월하다는 사실을 발견했습니다.
스스로 질문하여 자신의 능력을 평가하는 등 창의적인 추론 능력으로 높은 수준의 문제 해결 능력을 보여줍니다.

© 저작권 정책

기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.

관련 문서

OpenAI 天价收购 Windsurf：AI 编码赛道的战略落子与市场震荡

OpenAI의 윈드서프 인수 급증: AI 코딩 서킷의 전략적 정착과 시장 충격

11개월 전

054.6K

Ilya Sutskever在NeurIPS炸裂宣判：预训练将结束，数据压榨到头了

일리야 수츠케버가 NeurIPS에서 폭발하며 선언: 사전 교육이 끝나고 데이터 압박이 끝났다고 선언합니다.

1 년 전

061.4K

防割韭菜：小红书全套运营教学课程

안티 리크 : 작은 빨간 책 전체 작동 교육 과정 세트

AI 뉴스 # AI 부업 수익 창출 프로젝트

1 년 전

043.4K

LlamaIndex 团队推出新一代视觉文档检索模型 vdr-2b-multi-v1

라마인덱스 팀, 차세대 시각적 문서 검색 모델 vdr-2b-multi-v1 출시

1 년 전

048K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...