Durchgesickertes Microsoft-Papier: nur 8B für GPT-4o-mini und 100B für o1-mini?

AI-NachrichtenGeschrieben vor 7 Monaten AI-Austauschkreis

1.3K 00

Es gab eine anhaltende Diskussion über die Parametergrößen von Mainstream-LLMs mit geschlossenem Quellcode, und in den letzten 2 Tagen von 2024 wurde ein Artikel von Microsoft über dieAufdeckung und Korrektur von medizinischen Fehlern in klinischen AufzeichnungenVermutungenExperimentBezugsgrößeDie MEDEC-Studie hat versehentlich und direkt die Größenordnung ihrer Parameter verfehlt:o1-Vorschau, GPT-4.GPT-4o undClaude 3.5 Sonett.

Adresse des Papiers: https://arxiv.org/pdf/2412.19260v1

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

Im experimentellen Teil des Versuchs werden die großen Modellparameterskalen ebenfalls in 3 Blöcke unterteilt:7-8B, ~100-300B, ~1,7Taber (nicht)GPT-4o-miniMit nur 8B auf dem ersten Platz zu stehen, ist ein bisschen unglaublich.

Zusammenfassungen

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

Claude 3.5 Sonnet (2024-10-22), ~175B
ChatGPT, ~175B
GPT-4, etwa 1,76 T
GPT-4o, ~200B
GPT-4o-mini (gpt-4o-2024-05-13) nur 8B
Letzter o1-mini (o1-mini-2024-09-12) nur 100B
o1-vorschau (o1-vorschau-2024-09-12) ~ 300B

© urheberrechtliche Erklärung

Der Artikel ist urheberrechtlich geschützt und darf nicht ohne Genehmigung vervielfältigt werden.

Ähnliche Artikel

Claude 3.7 Sonnet 系统评估报告（中文版）

Claude 3.7 Sonnet-Systembewertungsbericht (chinesische Version)

vor 6 Monaten

01.7K

达摩院“寻光”视频创作平台全面评测

Die Videoerstellungsplattform "Searchlight" des Dharma-Instituts Vollständige Überprüfung

vor 8 Monaten

01.2K

AI 加持，百度文库化身效率神器：DeepSeek R1 满血版强势赋能

KI-gestützte Baidu-Wikipedia wird zum Effizienz-Tool: DeepSeek R1 Vollversion ermächtigt

vor 5 Monaten

01K

5个可以在国内直接使用的ChatGPT工具(2024年8月)

5 ChatGPT-Tools, die direkt zu Hause verwendet werden können (August 2024)

vor 12 Monaten

01.8K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

keine

Keine Kommentare...