AI Personal Learning
und praktische Anleitung
豆包Marscode1

AI-Nachrichten Seite 11

DeepSeek:被媒体忽视的问题-首席AI分享圈

DeepSeek: von den Medien ignorierte Themen

Gastbeiträge von Lennart Heim und Sihao Huang, dieser Artikel wird in Lennarts Blog veröffentlicht. Lennart schreibt regelmäßig für ChinaTalk und hat kürzlich an einer Diskussion über Geopolitik in der Ära des Testzeit-Computings teilgenommen, und Sihao hat bereits über Pekings Vision einer globalen KI-Governance geschrieben. ...

分析师Alberto Romero猜测:其实OpenAI的GPT-5早就有了-首席AI分享圈

Analyst Alberto Romero spekuliert: Eigentlich ist der GPT-5 von OpenAI längst überfällig

Lassen Sie uns das neue Jahr auf eine aufregende Art und Weise beginnen Möglicherweise durch GPT-5 Was wäre, wenn ich Ihnen sagen würde, dass GPT-5 real ist. Es ist nicht nur real, sondern es gestaltet die Welt bereits auf eine Weise, die Sie nicht sehen können. Hier ist ein hypothetischer Fall: OpenAI hat GPT-5 entwickelt, aber intern gehalten,...

微软 Azure+Copilot+AI PC 产品全线支持 DeepSeek R1 模型-首席AI分享圈

Microsoft Azure+Copilot+AI PC-Produkte unterstützen vollständig DeepSeek R1 Modelle

Am 30. Januar 2025 teilte Microsoft mit, dass das R1-Modell von DeepSeek jetzt auf seiner Cloud-Computing-Plattform Azure und den GitHub-Tools für Entwickler im Allgemeinen verfügbar ist. Microsoft sagte auch, dass Kunden bald in der Lage sein werden, R1-Modelle lokal auf ihren Copilot + PCs auszuführen. Zuvor haben wir über...

Anthropic CEO 妄言“中国威胁”,为美国 AI 霸权主义撑腰-首席AI分享圈

Der CEO von Anthropic unterstützt die Hegemonie der USA im Bereich der künstlichen Intelligenz (KI), indem er die "Bedrohung durch China" anprangert

1. die Verleumdung von Chinas KI-Entwicklung und die Darstellung von "Chinas Bedrohungstheorie" Der Autor des Artikels, der sich auf die Position der Vereinigten Staaten stellt, übertreibt absichtlich die so genannte "Bedrohung" der Vereinigten Staaten durch den technologischen Fortschritt chinesischer KI-Unternehmen wie DeepSeek und setzt sie zwangsweise mit der so genannten "XXX-Bedrohung" in Beziehung, die voll von Kalter-Kriegs-Denken und ideologischer Voreingenommenheit ist. "XXX-Bedrohung", dieses Argument ist voll von Denken des Kalten Krieges und ideologischer Voreingenommenheit. ...

基于MoE架构的Qwen2.5-Max全面超越DeepSeek V3-首席AI分享圈

Qwen2.5-Max auf Basis der MoE-Architektur übertrifft DeepSeek V3 vollständig

Modellübersicht In den letzten Jahren hat sich das Training großer Modelle auf der Grundlage der Mixture of Experts (MoE)-Architektur zu einer wichtigen Forschungsrichtung im Bereich der künstlichen Intelligenz entwickelt. Das Qwen-Team hat vor kurzem das Qwen2.5-Max-Modell veröffentlicht, das Pre-Training-Daten von mehr als 20 Billionen Token und ein verfeinertes Post-Training-Schema in M...

LLM 蒸馏:一场关于大模型独立性的“暗战”?-首席AI分享圈

LLM-Destillation: ein "dunkler Krieg" gegen die Unabhängigkeit großer Modelle?

I. HINTERGRUND UND HERAUSFORDERUNGEN Mit der rasanten Entwicklung von KI-Technologien sind groß angelegte Sprachmodelle (LLMs) zu einem zentralen Treiber im Bereich der Verarbeitung natürlicher Sprache geworden. Das Training dieser Modelle erfordert jedoch enorme Rechenressourcen und Zeitkosten, was zum Aufkommen von Knowledge Distillation (KD) Techniken geführt hat. Wissensdestillation funktioniert durch die Kombination großer ...

DeepSeek暂时限制了新的注册,理由是“大规模恶意攻击”-首席AI分享圈

DeepSeek begrenzt vorübergehend neue Registrierungen unter Hinweis auf "massive bösartige Angriffe".

DeepSeek wurde von einem massiven böswilligen Angriff getroffen, der aufgrund eines Angriffs auf seinen Online-Dienst, der zu einem regen Registrierungsprozess führte, vorübergehend neue Registrierungen eingeschränkt hat. Das Problem begann um den 27. Januar 2025 mit einer DeepSeek-API-Fehlermeldung, während der es auch bei der Registrierung zu kleineren Problemen kam. Am frühen Morgen des 28. Januar war die API ...

Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调-首席AI分享圈

Qwen2.5-VL veröffentlicht: Unterstützt langes Videoverstehen, visuelle Lokalisierung, strukturierte Ausgabe, Open Source Feinabstimmung

In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben zahlreiche Entwickler neue Modelle auf der Grundlage des visuellen Sprachmodells Qwen2-VL entwickelt und dem Qwen-Team wertvolles Feedback gegeben. Während dieser Zeit hat sich das Qwen-Team darauf konzentriert, noch nützlichere visuelle Sprachmodelle zu entwickeln. Heute freut sich das Qwen-Team, das neue...

百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini-首席AI分享圈

Baichuan Intelligence bringt Baichuan-Omni-1.5 Omnimodales Großmodell heraus, das das GPT-4o Mini in mehreren Messungen übertrifft

Gegen Ende des Jahres gibt es wieder gute Nachrichten aus dem Bereich der großen Modelle im Inland. Baichuan Intelligence hat vor kurzem eine Reihe von großen Modellprodukten intensiv veröffentlicht, nach dem Full-Scene Deep Inference Modell Baichuan-M1-Preview und dem medizinischen Augmented Open Source Modell Baichuan-M1-14B, und hat dann das omni-modale Modell Baichuan-Omni-1.5 wieder auf den Markt gebracht...

DeepSeek:中国开源AI飓风席卷硅谷,重塑全球AI格局-首席AI分享圈

DeepSeek: Chinas Open-Source-KI-Wirbelsturm fegt durch das Silicon Valley und verändert die globale KI-Landschaft

Heute hat DeepSeek, ein aufstrebender Stern am chinesischen KI-Himmel, mit seiner erstaunlichen Geschwindigkeit und Stärke ein weltweites "Erdbeben" im Wissenschafts- und Technologiesektor ausgelöst. Diese App, die als "das Licht der einheimischen KI" bekannt ist, führte nicht nur ChatGPT auf der kostenlosen Liste des App Store in der Region USA an, sondern auch die kostenlose Liste des App Store in China....

深度分析丨下一个3000亿美元Agents市场,附案例分析-首席AI分享圈

Eingehende Analyse丨Der nächste 300-Milliarden-Dollar-Agentenmarkt, mit Fallstudien

Ende 2024 prognostizierte YC-Partner Jared, dass in den nächsten Jahren vertikale KI-Agenten ein aufstrebender Markt sein werden, der zehnmal größer ist als SaaS, und dass in diesem Bereich auch Technologiegiganten mit einer Marktkapitalisierung von mehr als 300 Milliarden Dollar entstehen können. Damals sagte Microsoft-CEO Satya auch kühne Worte: "KI-Agenten werden alle SaaS ersetzen ...

大模型能理解多长的视频?智谱 GLM-4V-Plus:2小时-首席AI分享圈

Wie lange kann ein Video von einem großen Modell verstanden werden? Smart Spectrum GLM-4V-Plus: 2 Stunden

Basierend auf den beiden vorangegangenen Generationen von Videomodellen (CogVLM2-Video und GLM-4V-PLUS) haben wir die Techniken zum Verstehen von Videos weiter optimiert und die Beta-Version GLM-4V-Plus-0111 veröffentlicht. Diese Version führt Techniken wie die native variable Auflösung ein, die die Fähigkeit des Modells verbessert, sich an unterschiedliche Videolängen und Auflösungen anzupassen....

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型-首席AI分享圈

Qwen2.5-1M: Ein Open Source Qwen Modell mit Unterstützung für 1 Million Token-Kontexte

1. einleitung Vor zwei Monaten hat das Qwen-Team Qwen2.5-Turbo aktualisiert, um Kontextlängen von bis zu einer Million Token zu unterstützen. Heute hat Qwen offiziell das Open-Source-Modell Qwen2.5-1M und die entsprechende Unterstützung für das Inferenz-Framework veröffentlicht. Hier sind die Highlights des Releases: Open Source Modelle: Dieses Release bietet zwei...

有道 子曰-o1推理模型发布!首个输出分步式讲解,消费级显卡即可部署-首席AI分享圈

Arigatou Ziyou-o1 Inferenzmodell veröffentlicht! Erste Schritt-für-Schritt-Erklärung der Ausgabe, die auf Consumer-Grafikkarten eingesetzt werden kann

2025 der Anfang des Jahres, die AI-Industrie aus einem großen Modell "Argumentation Flut", da OpenAI freigegeben o1, verschiedene Argumentation Modelle weiterhin entstehen, das Modell der höheren Ordnung Argumentation Fähigkeit läutete den Ausbruch der Verbesserung der Wert ihrer Anwendung ist auch mehr und mehr auf die Industrie weit verbreitete Aufmerksamkeit zu erhalten. Vor kurzem hat NetEase offiziell die erste inländische Ausgabe Schritt-für-Schritt-Erklärung der Argumentation Modell...

de_DEDeutsch