o1-preview에 필적하는 자체 개발 추론 모델인 DeepSeek-R1-Lite가 온라인에 출시되었습니다!

44.3K 00

어제 딥시크는 DeepSeek-R1라이트와 함께 작동하는 프로그램인 -Lite의 미리 보기입니다. o1 경쟁하는 자율 추론 거시 언어 모델과 비교하고, o1이 공개하지 않는 완전한 사고 과정을 사용자에게 제시합니다.

OpenAI의 o1-프리뷰와 마찬가지로 DeepSeek-R1-Lite 프리뷰는 과제에 대해 추론하고 미리 계획하고 모델이 답에 도달할 수 있도록 일련의 작업을 수행하며 전체 사고 과정을 보여주었으며, 강화 학습을 사용하여 학습된 DeepSeek-R1-Lite는 추론 과정에 많은 반사와 검증이 포함되며 사고의 연쇄는 수만 단어 길이로 길어 효율적입니다. 추론 과정에는 많은 반성과 검증이 포함되며, 생각의 사슬이 수만 단어에 달해 더 효율적입니다. 현재는 웹 사용만 지원하며, 정식 버전은 완전한 오픈 소스로 공개될 예정입니다.

媲美 o1-preview 的国产推理模型——DeepSeek-R1-Lite上线

딥시크-R1-라이트 프리뷰는 수학, 코드 및 복잡한 논리적 추론 작업에 탁월하여 일부 테스트에서 o1-프리뷰를 능가합니다. 미국 수학 경시대회 AMC의 최고 난이도인 AIME와 세계 최고의 프로그래밍 경시대회인 코드포스와 같은 권위 있는 리뷰에서 우수한 성적을 기록했습니다. o1-preview 및 기타 모델.

기본적인 '딸기 테스트'를 하면 완벽하게 대답합니다.

질문의 복잡성에 따라 DeepSeek-R1은 답변하기 전에 수십 초 동안 "생각"할 수 있으며, 사용자들은 동일한 질문에 대해 o1보다 더 긴 추론 시간을 보고했습니다. 공식적으로는 생각의 사슬의 길이가 길어질수록 추론 시간이 길어질수록 더 정확한 결과를 얻을 수 있습니다.

온라인에서 다양한 테스트가 수행되었으며, DeepSeek는 보안 조치를 무시하는 방식으로 메시지를 표시하는 등 탈옥을 쉽게 할 수 있습니다. 한 X 사용자는 특별한 탈옥 프롬프트를 작성하여 자세한 탈옥 방법을 알려주는 DeepSeek-R1-Lite를 받았습니다.

물론 온라인 테스트에서 DeepSeek-R1-Lite는 여전히 모든 종류의 플롭이 발생했으며, 특히 o1과 마찬가지로 틱택토 및 기타 로직 문제에서 성능이 저하되었습니다.

chat.deepseek.com에 로그인하고 입력 상자에서 "심층 사고" 모드를 선택하여 DeepSeek-R1-Lite 미리 보기와 대화하세요. "심층 사고" 모드는 수학, 코드 등의 복잡한 논리적 추론 문제를 위해 특별히 설계되었으며, 단순한 질문보다 더 포괄적이고 명확하며 엄밀한 답변을 제공합니다.

그러나 현재 웹 사용만 지원하며, 당분간 API 호출은 지원하지 않으며, 일일 사용 할당량은 50개에 불과합니다.