유출된 Microsoft 문서: GPT-4o-mini는 8억, o1-mini는 100억에 불과?

AI 뉴스11개월 전에 게시 됨 AI 공유 서클

20.8K 00

주류 클로즈 소스 LLM의 파라미터 크기에 대한 논의가 계속되고 있으며, 2024년 마지막 2일에 Microsoft에서 다음과 같은 기사를 발표했습니다.임상 노트에서 의료 오류 감지 및 수정추측실험참조 표준MEDEC 연구는 실수로 매개변수의 규모를 직접적으로 놓쳤습니다:o1-preview, GPT-4.GPT-4o 및클로드 3.5 소네트.

논문 주소: https://arxiv.org/pdf/2412.19260v1

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

실험의 실험 부분에서는 큰 모델 매개변수 스케일을 3개의 블록으로 나눕니다:7-8B, ~100-300B, ~1.7T그러나 (아닌)GPT-4o-mini첫 번째 슬롯에 8B만 배치된 것은 다소 믿기지 않습니다.

요약

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

Claude 3.5 소네트(2024-10-22), ~175B
ChatGPT, ~175B
GPT-4, 약 1.76T
GPT-4o, ~200B
GPT-4o-mini(gpt-4o-2024-05-13) 전용 8B
최신 o1-mini(o1-mini-2024-09-12) 전용 100B
O1-PREVIEW (O1-PREVIEW-2024-09-12) ~ 300B

© 저작권 정책

기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.

관련 문서

科技新秀 Rokid AR 眼镜：CEO 演示“脱稿”演讲，引爆市场期待

Rokid AR 글래스: CEO가 '즉흥적인' 연설을 시연하며 시장의 기대감을 높입니다.

9개월 전

022.7K

微软：黑客利用人工智能提升其网络攻击技巧

Microsoft: 해커는 AI를 사용하여 사이버 공격 기술을 향상시킵니다.

2 년 전

021.5K

全新 Qwen2.5-VL-32B-Instruct 多模态模型发布，性能超72B！

슈퍼 72B 성능을 갖춘 새로운 Qwen2.5-VL-32B-Instruct 멀티 모달 모델 출시!

8개월 전

028.4K

2024年度中文大模型基准测评报告（SuperCLUE）

2024년 중국 대형 모델 벤치마킹 보고서(SuperCLUE)

11개월 전

039.2K

댓글 없음

댓글에 참여하려면 로그인해야 합니다!

지금 로그인

댓글 없음...