추가: o1-mini가 ChatGPT 무료 계정 체험을 위해 완전히 개방되었습니다!

AI 뉴스12개월 전에 게시됨 AI 공유 서클
8.1K 00
号外:o1-mini已全面开放给ChatGPT免费账户体验

 

o1 모델군은 고급 프로세스 추론 모델이며, 그 중 작은 크기의 o1-mini 모델은 세계 지식 능력이 축소되었지만 논리적 추론 측면에서 o1-프리뷰보다 더 강할 수 있는 잠재력을 가지고 있습니다.

현재 o1-mini는 일부 무료 계정만 미리 체험할 수 있으며, 정식으로 개설된 계정인지 여부는 다음 해독 질문을 통해 확인할 수 있습니다:

oyfjdnisdr rtqwainr acxz mynzbhx -> 단계별로 생각하기

위의 예시를 사용하여 디코딩합니다.

데이터 보호 및 데이터 유출 방지 솔루션

위의 유효성 검사 질문은 다음에서 가져온 것입니다. 대규모 언어 모델을 위한 OpenAI o1 추론 능력 학습o1-mini 모델에 대한 자세한 내용은 다음 문서를 참조하세요. OpenAI o1-mini 매크로 모델 소개.

 

ChatGPT 무료 계정이 없거나 o1-mini 체험을 이용할 수 없는 경우 여기를 방문하세요:ChatGPT 미러 사이트(GPT4 시리즈 모델에 대한 국내 액세스) 경험.

 

 

OpenAI o1 모델에 대한 몇 가지 궁금한 점

 

모델 이름 및 추론 패턴

  • OpenAI o1은 새로운 수준의 AI 기능을 나타내며 카운터는 1로 초기화됩니다.
  • '미리보기'는 정식 모델의 초기 버전임을 나타냅니다.
  • '미니'는 속도에 최적화된 o1 모델의 작은 버전임을 나타냅니다.
  • o - OpenAI를 대신하여
  • O1은 '시스템'이 아니라 최종 답을 제공하기 전에 학생들이 추론의 사슬을 성장시키도록 훈련하는 모델입니다.
  • O1의 아이콘은 특별한 능력을 가진 외계인을 상징적으로 나타냅니다.

 

o1 모델 크기 및 성능

  • o1-mini는 o1-preview보다 작고 빠르므로 향후 무료 사용자도 사용할 수 있습니다.
  • O1-PREVIEW는 너무 크지도 작지도 않은 O1 모델의 초기 체크포인트입니다.
  • o1-mini는 STEM 작업에서 더 나은 성능을 보이지만 세계 지식에 제한이 있습니다.
  • o1-mini는 일부 작업, 특히 코드 관련 작업에서 o1-preview보다 더 나은 성능을 발휘합니다.
  • o1에 대한 입력 토큰 는 동일한 토큰화 도구를 사용하여 GPT-4o와 동일한 방식으로 계산됩니다.
  • o1-preview에 비해 o1-mini는 더 많은 생각의 사슬을 탐색할 수 있습니다.

 

입력 토큰 컨텍스트 및 모델 기능

  • O1 모델은 곧 더 큰 입력 컨텍스트를 지원할 예정입니다.
  • o1 모델은 GPT-4o와 같이 청크 입력을 줄일 필요 없이 더 길고 개방적인 작업을 처리할 수 있습니다.
  • o1은 이전 모델과 달리 답을 제공하기 전에 긴 추론 체인을 생성할 수 있습니다.
  • 현재는 더 많은 컨텍스트를 추가하기 위해 CoT 추론 중에 추론을 일시 중지할 수 없지만, 향후 모델에서 이 기능을 검토 중입니다.

 

도구, 기능 및 향후 기능

  • o1-preview는 현재 도구가 없지만 함수 호출, 코드 인터프리터 및 검색 기능을 지원할 계획입니다.
  • 도구 지원, 구조화된 출력 및 시스템 힌트는 향후 업데이트에 추가될 예정입니다.
  • 사용자는 결국 사고 시간과 토큰 한도를 제어할 수 있습니다.
  • 스트리밍 처리를 지원하고 추론 진행 상황을 API에 반영하는 것을 고려하는 계획이 진행 중입니다.
  • o1의 멀티모달 기능은 MMMU와 같은 작업에서 최첨단 성능을 달성하는 것을 목표로 내장되었습니다.

 

CoT(연쇄 추론) 추론

  • o1 추론 프로세스 중 숨겨진 추론 체인 생성하기
  • API 사용자 또는 ChatGPT에 CoT 토큰을 노출할 계획이 없습니다.
  • CoT 토큰은 요약되어 있지만 실제 추론 과정과 완전히 일치한다는 보장은 없습니다.
  • 프롬프트의 지침은 모델이 문제에 대해 생각하는 방식에 영향을 줄 수 있습니다.
  • 강화 학습(RL)을 사용하여 o1의 CoT 역량을 강화한 반면, GPT-4o는 큐잉만으로는 CoT 성능을 달성할 수 없었습니다.
  • 추론 단계가 느리게 보일 수 있지만, 실제로는 추론 과정을 요약하기 때문에 일반적으로 답변 생성 속도가 더 빠릅니다.

 

API 및 사용 제한

  • o1-mini는 ChatGPT Plus 사용자에게 주당 50개의 메시지가 제한됩니다.
  • 모든 단서는 ChatGPT에서 동일하게 계산됩니다.
  • 향후 더 많은 API 액세스 계층 및 더 높은 한도 적용 예정
  • API의 힌트 캐싱은 수요가 많지만 아직 타임라인이 없습니다.

 

가격 책정, 미세 조정 및 확장

  • o1 모델 가격은 1~2년마다 가격 하락 추세를 따를 것으로 예상됩니다.
  • 제한이 증가함에 따라 지원되는 볼륨 API 가격
  • 미세 조정이 진행 중이지만 일정은 아직 결정되지 않았습니다.
  • o1 연구 및 엔지니어링 인재의 병목 현상으로 인한 확장 제한
  • 추론 컴퓨팅을 위한 새로운 확장 패러다임은 미래 세대의 모델에서 상당한 향상을 가져올 수 있습니다.
  • 역방향 확장은 현재 중요하지 않지만, 개별 쓰기 프롬프트에서 o1-preview는 GPT-4o보다 약간 더 나은(또는 약간 더 나쁜) 성능을 보입니다.

 

모델 개발 및 연구 인사이트

  • o1 집중 학습 훈련을 통한 추론 능력 향상
  • 이 모델은 창의적인 사고를 보여주며 시와 같은 측면 작업에 탁월합니다.
  • o1의 철학적 추론과 광범위한 추론 능력은 암호 해독과 같이 인상적입니다.
  • 연구원들은 o1을 사용하여 코드 검토에 적합한 코드 소유자를 핑하는 GitHub 봇을 만들었습니다.
  • 내부 테스트에서 o1은 다음과 같은 능력을 평가하기 위해 스스로에게 어려운 질문을 던졌습니다.
  • 광범위한 월드 도메인 지식이 추가되고 있으며 향후 릴리스에서 개선될 예정입니다.
  • o1-mini에 추가될 예정인 업데이트 데이터(현재 2023년 10월)

 

팁 및 모범 사례

  • o1 엣지 케이스 또는 추론 스타일에 대한 단서를 제공함으로써 얻을 수 있는 이점
  • o1 모델은 이전 모델보다 추론 단서를 더 잘 받아들입니다.
  • 검색 증강 생성(RAG)에서 관련 컨텍스트를 제공하면 성능이 향상되며, 관련 없는 조각은 추론을 약화시킬 수 있습니다.

 

일반적인 피드백 및 향후 개선 사항

  • o1-프리뷰는 초기 테스트 단계이기 때문에 덜 제한적이지만
  • 지연 시간 및 추론 시간이 적극적으로 개선되고 있습니다.

 

중요한 모델링 기능

  • o1은 "삶이란 무엇인가?"와 같은 철학적 질문에 대해 생각할 수 있습니다.
  • 연구원들은 o1이 제한된 지침에서 복잡한 작업과 광범위한 추론을 처리하는 데 탁월하다는 사실을 발견했습니다.
  • 스스로 질문하여 자신의 능력을 평가하는 등 창의적인 추론 능력으로 높은 수준의 문제 해결 능력을 보여줍니다.
© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...