OpenAI, o3 모델을 사용한 심층 연구용 인텔리전스 '딥리서치' 출시

59.3K 00

방대한 양의 정보를 검색하는 데 지쳤지만 여전히 필요한 답을 찾는 데 어려움을 겪고 계신가요? 전문 애널리스트처럼 심층적인 조사를 해줄 수 있는 지능형 비서를 원하시나요? 가장 혁신적인 최신 소프트웨어인 OpenAI의 출시를 발표하게 되어 자랑스럽게 생각합니다. ChatGPT 의 새로운 기능 - -심층 연구! 정보를 얻는 방식이 완전히 바뀌어 몇 시간이 걸리는 복잡한 연구 작업을 단 몇 분 만에 완료할 수 있게 될 것입니다. 이 글에서는 심층 연구의 강력한 기능, 적용 시나리오, 작동 원리, 향후 개발 방향에 대해 심도 있게 알아보고, AI가 어떻게 지식 작업을 강화하고 지능형 연구의 새로운 시대를 여는지 함께 살펴볼 것입니다!

이는 추론을 사용하여 대량의 온라인 정보를 종합하고 사용자를 위해 여러 단계의 연구 작업을 완료하는 인텔리전스로, 다음과 유사합니다. 당혹감 노래로 응답 쌍둥이자리 새로 출시된 OpenAI의 '딥 리서치'는 강력한 o3 모델을 사용해 웹 검색을 통해 방대한 양의 정보를 수집 및 분석하고, 궁극적으로 인용이 포함된 상세한 전문 보고서를 생성합니다. 이 기능은 출시 이후 '초강력' AI 어시스턴트라는 찬사를 받으며 AI 지원 연구의 새로운 시대가 도래했음을 알리며 큰 주목을 받고 있습니다.

이 기능은 현재 Pro 사용자에게 제공되며, 다음 버전에서는 Plus 및 Team 사용자에게 제공될 예정입니다.

간단히 말해서'딥 리서치'는 다단계 네트워크 조사를 자율적으로 수행하여 일반적으로 사람이 몇 시간이 걸리는 복잡한 연구 작업을 5~30분 만에 완료하고 그 결과를 사용자에게 고품질 보고서로 제시합니다.

참고 읽기:Google, 딥 리서치 출시및오픈 딥 리서치: 웹 검색 콘텐츠에 기반한 AI 연구 생성및STORM: 토픽을 기반으로 웹 데이터를 검색하고, 인용이 포함된 논문, 긴 논문 보고서를 생성하세요.

"심층 연구"는 얼마나 좋은가요? 알아볼까요?

강력하고 놀랍도록 효율적입니다: 밤새워 정보를 검색하는 일은 이제 그만! '심층 연구'는 기존에는 몇 시간이 걸리던 복잡한 연구를 5~30분 만에 완료하고, 전문가 수준의 분석을 제공하기 위해 필요한 만큼 깊이 파고들 수 있는 기능을 통해 연구의 효율성을 완전히 새로운 차원으로 끌어올립니다.
결과는 신뢰할 수 있고 잘 문서화되어 있습니다: 정보의 출처에 대해 더 이상 걱정할 필요가 없습니다! 모든 결론에는 원본 웹 페이지 또는 PDF의 관련 단락까지 상세한 인용이 함께 제공되므로 사용자가 정보의 정확성을 쉽게 추적하고 확인할 수 있으며, 연구의 설득력을 높일 수 있습니다.
유연하고 사용하기 쉬운 광범위한 애플리케이션: 경쟁 분석, 시장 조사, 제품 쇼핑, 학술 연구 등 어떤 조사를 수행해야 하든 "심층 조사"는 여러분의 오른팔이 되어줄 수 있습니다. ChatGPT 인터페이스에서 "심층 조사"를 선택하고 검색어를 입력하기만 하면 조사를 시작할 수 있습니다. 보다 구체적인 맥락을 제공하기 위해 파일(예: PDF) 업로드를 지원하며, 사이드바에서 연구 진행 상황과 인용된 출처를 실시간으로 볼 수 있습니다.
기술적으로 진보된 우수한 성능: 딥 리서치는 엔드투엔드 강화 학습을 기반으로 다단계 탐색 및 추론 작업을 수행할 수 있습니다. 웹사이트 콘텐츠 읽기, 데이터 처리, 차트 생성, 주장을 뒷받침하기 위한 소스 텍스트 인용을 지원합니다. "인류의 마지막 시험"(HLE)이라는 어려운 벤치마크 테스트에서 딥 리서치는 26.6%의 점수를 획득하여 이전 버전의 점수를 훨씬 뛰어넘는 점수를 기록했습니다. o3-mini (13%)와 o1(9%)은 강력한 정보 검색 및 통합 능력과 인간에 가까운 연구 행동을 보여주었습니다.
점진적인 자유화와 유망한 미래: 현재 프로 사용자(월 100회 검색)가 사용할 수 있으며, 한 달 안에 플러스 사용자(월 10회 검색)로 확대될 예정이며, 팀 및 엔터프라이즈 에디션도 곧 출시될 예정입니다. 향후에는 모바일/데스크톱 앱도 지원될 예정이며, 더 많은 데이터 소스(구독 및 내부)에 연결하여 더욱 강력한 개인화 기능을 제공할 계획입니다.

이러한 세부 사항도 마찬가지로 주목할 만합니다:

더 많은 도구를 호출할수록 더 정확한 결과를 얻을 수 있습니다: 그래프는 도구 호출 횟수(최대 도구 호출)가 증가할수록 HLE 테스트에서 딥 리서치의 합격률이 증가하는 것을 보여 주며, 이는 지능과 도구 활용 능력 간에 양의 상관관계가 있음을 나타냅니다.
환각 문제는 여전히 개선이 필요합니다: 딥 리서치의 인상적인 성능에도 불구하고 여전히 착각과 잘못된 추론의 가능성이 존재하며, 이는 OpenAI의 후속 최적화의 핵심 초점입니다.
오퍼레이터와 결합하면 잠재력은 무한합니다: OpenAI의 향후 계획은 심층적인 온라인 연구와 실제 운영을 결합하는 것입니다(연산자)가 결합되어 더욱 강력한 지능형 신체 기능을 구현할 것으로 기대됩니다!

공식 DeepResearch 리뷰 전문

오늘, 복잡한 작업을 위해 인터넷에서 다단계 조사를 할 수 있는 새로운 에이전트 기능인 ChatGPT의 딥 리서치를 출시합니다. 사람이 몇 시간이 걸리는 작업을 수십 분 만에 완료할 수 있습니다.

딥 리서치는 스스로 작동할 수 있는 OpenAI의 차세대 인텔리전스로, 사용자가 명령만 내리면 ChatGPT가 수백 개의 온라인 소스를 찾아 분석 및 종합하여 리서치 분석가 수준의 종합 보고서를 생성합니다. 이 기능은 웹 브라우징 및 데이터 분석에 최적화된 곧 출시될 OpenAI o3 모델에 의해 구동되며, 추론을 통해 인터넷의 방대한 양의 텍스트, 이미지 및 PDF를 검색, 해석 및 분석하여 발견된 정보를 기반으로 필요한 조정을 수행합니다.

지식을 종합하는 능력은 새로운 지식을 창출하기 위한 전제 조건입니다. 이러한 이유로 딥 리서치는 새로운 과학 연구를 창출하기 위해 오랫동안 구상해 온 AGI 개발이라는 광범위한 목표를 향한 중요한 발걸음입니다.

심층 연구를 구축하는 이유

심층 연구는 금융, 과학, 정책, 엔지니어링 등의 분야에서 지식 집약적인 업무를 수행하며 철저하고 정확하며 신뢰할 수 있는 조사가 필요한 사람들을 위해 만들어졌습니다. 또한 자동차, 가전제품, 가구 등 일반적으로 신중한 조사가 필요한 구매에 대해 지극히 개인화된 조언을 원하는 현명한 쇼핑객에게도 유용합니다. 각 결과물은 명확한 인용문과 요약으로 완벽하게 문서화되어 있어 정보를 쉽게 참조하고 검증할 수 있습니다. 특히 많은 사이트를 검색해야 하는 직관적이지 않은 틈새 정보를 찾는 데 효과적입니다. 심층 연구를 사용하면 복잡하고 시간이 많이 걸리는 웹 조사를 한 번의 쿼리로 처리하고 속도를 높일 수 있어 귀중한 시간을 확보할 수 있습니다.

딥 리서치는 웹 전반에서 인사이트를 독립적으로 발견하고, 추론하고, 통합합니다. 이를 위해 브라우저와 Python 도구를 사용해야 하는 실제 작업에 대해 학습된 OpenAI o1(첫 번째 추론 모델)과 동일한 강화 학습 접근 방식을 사용합니다. o1은 코딩, 수학 및 기타 기술 영역에서 인상적인 능력을 보여주지만, 많은 실제 과제에는 다양한 온라인 소스에서 광범위한 배경 지식과 정보 수집이 필요합니다. 심층 연구는 이러한 추론 능력을 바탕으로 이러한 격차를 해소하고 사람들이 직장과 일상 생활에서 직면하는 다양한 문제를 해결할 수 있도록 지원합니다.

심층 연구를 사용하는 방법

ChatGPT의 메시지 편집기에서 "심층 조사"를 선택하고 쿼리를 입력합니다. 스트리밍 플랫폼에 대한 경쟁 분석이든 최고의 통근용 자전거에 대한 맞춤형 보고서이든 필요한 정보를 ChatGPT에 알려주세요. 파일이나 스프레드시트를 첨부하여 질문에 대한 맥락을 추가할 수 있습니다. 실행이 완료되면 수행한 단계와 사용된 소스의 요약이 포함된 사이드바가 나타납니다.

심층 연구는 작업을 완료하는 데 5~30분 정도 소요될 수 있으며, 네트워크를 더 깊이 파고드는 데 시간이 필요합니다. 그 동안에는 퇴근하거나 다른 작업을 할 수 있으며, 연구가 완료되면 알림을 받게 됩니다. 최종 결과물은 채팅에서 보고서 형태로 제공되며, 향후 몇 주에 걸쳐 이러한 보고서에 포함된 이미지, 데이터 시각화 및 기타 분석 결과물을 추가하여 보다 명확하고 맥락적인 정보를 제공할 예정입니다.

심층 연구와 달리 GPT-4o는 실시간 멀티모달 대화에 적합합니다. 대상깊이와 디테일이 중요한 다면적인 도메인별 영역질문, 광범위한 탐색을 위한 심층 조사, 각 문장을 인용하는 능력은 빠른 요약과 잘 문서화되고 검증된 답변(작업물로 사용할 수 있는)의 차이점입니다.

OpenAI 推出 DeepResearch ，利用o3模型进行深度研究的智能体

이 심층 연구는 매우 상세한 방식으로 프롬프트에 응답하며, 쉽게 참조하고 비교할 수 있도록 상위 10개 선진국과 상위 10개 개발도상국에 대한 국가/지역 데이터를 나란히 제공합니다. 이 정보를 사용하여 상세하고 정보에 입각한 실용적인 시장 진출 권장 사항을 제공합니다. 공식 예시 보기: https://openai.com/index/introducing-deep-research/

작동 원리

딥 리서치는 다양한 영역의 하드 브라우징 및 추론 작업에 대해 엔드투엔드 강화 학습을 사용하여 훈련됩니다. 이 훈련을 통해 필요한 데이터를 찾기 위해 여러 단계의 궤적을 계획하고 실행하며, 필요한 경우 실시간 정보를 역추적하고 반응하는 방법을 배웠습니다. 또한 이 모델은 사용자가 업로드한 파일을 탐색하고, Python 도구를 사용하여 그래픽을 그리고 반복하며, 웹 사이트에서 생성된 그래픽과 이미지를 응답에 포함하고, 소스에서 특정 문장이나 단락을 인용할 수 있습니다. 이 교육을 받은 결과, 실제 문제에 초점을 맞춘 여러 공개 평가에서 새로운 경지에 도달했습니다.

인류의 마지막 시험

존재 인류의 마지막 시험(새 창에서 열기)(최근 발표된 평가로 전문가 수준의 다양한 주제에 대해 AI를 테스트하는 평가)에서 딥 리서치 지원 모델은 26.6%의 정확도로 새로운 최고 점수를 기록했습니다. 이 테스트에는 언어학에서 로켓 과학, 고전부터 생태학에 이르기까지 100개 이상의 주제를 다루는 3,000개 이상의 객관식 및 단답형 문제가 포함되어 있습니다. OpenAI o1에 비해 가장 크게 개선된 부분은 화학, 인문사회과학, 수학 분야였습니다. 심층 연구를 지원하는 모델은 필요할 때 전문화된 정보를 효과적으로 찾아내는 인간과 유사한 접근 방식을 보여줍니다.

모델링	정확도(%)
GPT-4o	3.3
Grok-2	3.8
Claude 3.5 소네트	4.3
쌍둥이자리 사고	6.2
OpenAI o1	9.1
DeepSeek-R1*	9.4
OpenAI o3-mini(중간)*	10.5
OpenAI o3-mini(높음)*	13.0
OpenAI 심층 연구**	26.6

이 모델은 멀티모달이 아니며 텍스트 전용 하위 집합에서 평가됩니다.
찾아보기 + 파이썬 도구 사용

GAIA

존재 GAIA(새 창에서 열기) (실제 문제에서 AI를 평가하기 위한 공개적으로 사용 가능한 벤치마크)는 외부의 심층 연구를 지원하는 모델에 대한 새로운 최첨단 수준(SOTA)에 도달했습니다. 순위표(새 창에서 열기) 목록 상단. 세 가지 난이도의 문제가 포함되어 있으며, 이 과제를 성공적으로 완료하려면 추론, 멀티모달 유창성, 웹 브라우징, 도구 사용 숙련도 등의 능력이 필요합니다.

GAIA 작업의 예

공식 예시 참조: https://openai.com/index/introducing-deep-research/

전문가 수준의 미션

도메인 전문가 수준의 일련의 작업에 대한 내부 평가에서 심층 연구는 도메인 전문가들로부터 어려운 수작업 조사를 자동화한 것으로 평가받았습니다.

합격률 및 최대 도구 호출 수

모델이 더 많이 훑어보고 생각할수록 더 나은 성능을 내기 때문에 생각할 시간을 주는 것이 중요합니다.

전문가 수준의 과제의 예

공식 예시 참조: https://openai.com/index/introducing-deep-research/

작업의 예상 경제적 가치는 사람이 소요한 시간보다 합격률과 더 관련이 있습니다. 모델이 어렵다고 생각하는 것과 사람이 시간이 많이 걸린다고 생각하는 것은 다릅니다.

제한 사항

딥 리서치를 통해 중요한 새로운 기능이 추가되었지만 아직 초기 단계에 있으며 한계가 있습니다. 내부 평가에 따르면, 기존 ChatGPT 모델보다 훨씬 낮은 수준이지만 때때로 허구의 사실을 생성하거나 응답에서 잘못된 추론을 할 수 있다고 합니다. 권위 있는 정보와 루머를 구분하는 데 어려움을 겪을 수 있으며, 현재 신뢰도 보정에서 약점을 보이고 있어 불확실성을 정확하게 전달하지 못하는 경우가 많습니다. 보고서와 인용문에는 게시 시점에 사소한 서식 오류가 있을 수 있으며, 작업을 시작하는 데 시간이 더 오래 걸릴 수 있습니다. 이러한 모든 문제는 사용량이 증가하고 시간이 지남에 따라 빠르게 개선될 것으로 기대합니다.

인터뷰

현재 ChatGPT의 심층 연구에는 매우 높은 연산 능력이 필요합니다. 연구 쿼리가 오래 걸릴수록 더 많은 추론 계산이 필요합니다. 오늘은 쿼리 타겟팅에 필요한 계산부터 시작하겠습니다. 프로 사용자최적화된 버전은 한 달에 최대 100개의 쿼리로 시작합니다.플러스 및 팀 사용자다음에 기업 사용자에게 액세스가 제공될 예정입니다. 영국, 스위스 및 유럽경제지역(EEA)의 사용자에게 액세스 권한을 제공하기 위해 계속 작업 중입니다.

고품질의 결과를 제공하면서도 더 작은 모델로 구동되는 심층 연구의 더 빠르고 비용 효율적인 버전이 출시되면 모든 유료 구독자에게 더 높은 요금 한도가 곧 제공될 예정입니다.

앞으로 몇 주, 몇 달 동안 기술 인프라를 개선하고 현재 릴리스를 면밀히 모니터링하며 더욱 엄격한 테스트를 실시할 예정입니다. 이는 반복적인 배포 원칙에 따른 것입니다. 모든 보안 점검이 계속해서 릴리스 기준을 충족한다면 약 한 달 후에 플러스 사용자들에게 심층적인 연구 결과를 공개할 예정입니다.

후속 조치 계획

딥 리서치는 현재 ChatGPT 네트워크에서 사용할 수 있으며, 한 달 이내에 모바일 및 데스크톱 애플리케이션에 출시될 예정입니다. 현재 딥 리서치는 오픈 웹과 업로드된 모든 파일에 액세스할 수 있습니다. 향후에는 보다 전문화된 데이터 소스에 연결하여 구독 기반 또는 내부 리소스로 액세스를 확장하여 더욱 강력하고 개인화된 결과를 얻을 수 있습니다.

앞으로 저희는 비동기식 실제 연구 및 개발을 수행하기 위해 ChatGPT에 에이전트 경험을 통합할 계획입니다. 비동기식 온라인 설문조사를 수행할 수 있는 딥 리서치와 실제 조치를 취할 수 있는 오퍼레이터의 결합으로 ChatGPT는 점점 더 복잡한 작업을 수행할 수 있게 될 것입니다.