AI Personal Learning
und praktische Anleitung
TRAE

AI-Nachrichten Seite 13

基于MoE架构的Qwen2.5-Max全面超越DeepSeek V3-首席AI分享圈

Qwen2.5-Max auf Basis der MoE-Architektur übertrifft DeepSeek V3 vollständig

Modellübersicht In den letzten Jahren hat sich das Training großer Modelle auf der Grundlage der Mixture of Experts (MoE)-Architektur zu einer wichtigen Forschungsrichtung im Bereich der künstlichen Intelligenz entwickelt. Das Qwen-Team hat vor kurzem das Qwen2.5-Max-Modell veröffentlicht, das Pre-Training-Daten von mehr als 20 Billionen Token und ein verfeinertes Post-Training-Schema in M...

LLM 蒸馏:一场关于大模型独立性的“暗战”?-首席AI分享圈

LLM-Destillation: ein "dunkler Krieg" gegen die Unabhängigkeit großer Modelle?

I. HINTERGRUND UND HERAUSFORDERUNGEN Mit der rasanten Entwicklung von KI-Technologien sind groß angelegte Sprachmodelle (LLMs) zu einem zentralen Treiber im Bereich der Verarbeitung natürlicher Sprache geworden. Das Training dieser Modelle erfordert jedoch enorme Rechenressourcen und Zeitkosten, was zum Aufkommen von Knowledge Distillation (KD) Techniken geführt hat. Wissensdestillation funktioniert durch die Kombination großer ...

DeepSeek暂时限制了新的注册,理由是“大规模恶意攻击”-首席AI分享圈

DeepSeek begrenzt vorübergehend neue Registrierungen unter Hinweis auf "massive bösartige Angriffe".

DeepSeek wurde von einem massiven böswilligen Angriff getroffen, der aufgrund eines Angriffs auf seinen Online-Dienst, der zu einem regen Registrierungsprozess führte, vorübergehend neue Registrierungen eingeschränkt hat. Das Problem begann um den 27. Januar 2025 mit einer DeepSeek-API-Fehlermeldung, während der es auch bei der Registrierung zu kleineren Problemen kam. Am frühen Morgen des 28. Januar war die API ...

Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调-首席AI分享圈

Qwen2.5-VL veröffentlicht: Unterstützt langes Videoverstehen, visuelle Lokalisierung, strukturierte Ausgabe, Open Source Feinabstimmung

In den fünf Monaten seit der Veröffentlichung von Qwen2-VL haben zahlreiche Entwickler neue Modelle auf der Grundlage des visuellen Sprachmodells Qwen2-VL entwickelt und dem Qwen-Team wertvolles Feedback gegeben. Während dieser Zeit hat sich das Qwen-Team darauf konzentriert, noch nützlichere visuelle Sprachmodelle zu entwickeln. Heute freut sich das Qwen-Team, das neue...

百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini-首席AI分享圈

Baichuan Intelligence bringt Baichuan-Omni-1.5 Omnimodales Großmodell heraus, das das GPT-4o Mini in mehreren Messungen übertrifft

Gegen Ende des Jahres gibt es wieder gute Nachrichten aus dem Bereich der großen Modelle im Inland. Baichuan Intelligence hat vor kurzem eine Reihe von großen Modellprodukten intensiv veröffentlicht, nach dem Full-Scene Deep Inference Modell Baichuan-M1-Preview und dem medizinischen Augmented Open Source Modell Baichuan-M1-14B, und hat dann das omni-modale Modell Baichuan-Omni-1.5 wieder auf den Markt gebracht...

DeepSeek:中国开源AI飓风席卷硅谷,重塑全球AI格局-首席AI分享圈

DeepSeek: Chinas Open-Source-KI-Wirbelsturm fegt durch das Silicon Valley und verändert die globale KI-Landschaft

Heute hat DeepSeek, ein aufstrebender Stern am chinesischen KI-Himmel, mit seiner erstaunlichen Geschwindigkeit und Stärke ein weltweites "Erdbeben" im Wissenschafts- und Technologiesektor ausgelöst. Diese App, die als "das Licht der einheimischen KI" bekannt ist, führte nicht nur ChatGPT auf der kostenlosen Liste des App Store in der Region USA an, sondern auch die kostenlose Liste des App Store in China....

深度分析丨下一个3000亿美元Agents市场,附案例分析-首席AI分享圈

Eingehende Analyse丨Der nächste 300-Milliarden-Dollar-Agentenmarkt, mit Fallstudien

Ende 2024 prognostizierte YC-Partner Jared, dass in den nächsten Jahren vertikale KI-Agenten ein aufstrebender Markt sein werden, der zehnmal größer ist als SaaS, und dass in diesem Bereich auch Technologiegiganten mit einer Marktkapitalisierung von mehr als 300 Milliarden Dollar entstehen können. Damals sagte Microsoft-CEO Satya auch kühne Worte: "KI-Agenten werden alle SaaS ersetzen ...

大模型能理解多长的视频?智谱 GLM-4V-Plus:2小时-首席AI分享圈

Wie lange kann ein Video von einem großen Modell verstanden werden? Smart Spectrum GLM-4V-Plus: 2 Stunden

Basierend auf den beiden vorangegangenen Generationen von Videomodellen (CogVLM2-Video und GLM-4V-PLUS) haben wir die Techniken zum Verstehen von Videos weiter optimiert und die Beta-Version GLM-4V-Plus-0111 veröffentlicht. Diese Version führt Techniken wie die native variable Auflösung ein, die die Fähigkeit des Modells verbessert, sich an unterschiedliche Videolängen und Auflösungen anzupassen....

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型-首席AI分享圈

Qwen2.5-1M: Ein Open Source Qwen Modell mit Unterstützung für 1 Million Token-Kontexte

1. einleitung Vor zwei Monaten hat das Qwen-Team Qwen2.5-Turbo aktualisiert, um Kontextlängen von bis zu einer Million Token zu unterstützen. Heute hat Qwen offiziell das Open-Source-Modell Qwen2.5-1M und die entsprechende Unterstützung für das Inferenz-Framework veröffentlicht. Hier sind die Highlights des Releases: Open Source Modelle: Dieses Release bietet zwei...

有道 子曰-o1推理模型发布!首个输出分步式讲解,消费级显卡即可部署-首席AI分享圈

Arigatou Ziyou-o1 Inferenzmodell veröffentlicht! Erste Schritt-für-Schritt-Erklärung der Ausgabe, die auf Consumer-Grafikkarten eingesetzt werden kann

2025 der Anfang des Jahres, die AI-Industrie aus einem großen Modell "Argumentation Flut", da OpenAI freigegeben o1, verschiedene Argumentation Modelle weiterhin entstehen, das Modell der höheren Ordnung Argumentation Fähigkeit läutete den Ausbruch der Verbesserung der Wert ihrer Anwendung ist auch mehr und mehr auf die Industrie weit verbreitete Aufmerksamkeit zu erhalten. Vor kurzem hat NetEase offiziell die erste inländische Ausgabe Schritt-für-Schritt-Erklärung der Argumentation Modell...

TokenVerse:谷歌开源了多图风格混合创意工具 Whisk-首席AI分享圈

TokenVerse: Google veröffentlicht Whisk, ein kreatives Werkzeug zum Mischen mehrerer Bildstile

1. einleitung: Eine neue Ära der Bilderzeugung Im heutigen digitalen Zeitalter hat die Bilderzeugungstechnologie beeindruckende Fortschritte gemacht. Ganz gleich, ob Sie ein Designer, ein Künstler oder einfach nur ein normaler Mensch sind, der personalisierte Inhalte erstellen möchte: Bilderzeugungstools können Ihnen helfen, Ihre Ideen zum Leben zu erwecken. Allerdings sind herkömmliche...

Windsurf CodiumAI:PR 助手大升级-首席AI分享圈

Windsurf CodiumAI: PR-Assistentin aufgestiegen!

Woher kommt der PR-Assistent? Der PR-Assistent ist ein neuer Akteur auf dem Gebiet der Softwareentwicklung und entstand aus dem Bedürfnis der Menschen, Codeänderungen einfacher zu verwalten. Er entstand aus dem Bedürfnis, die Verwaltung von Codeänderungen zu vereinfachen, was für die Leute früher eine Qual war, und er begann als eine Möglichkeit, einige einfache Prüfungen zu automatisieren, aber jetzt ist er sehr leistungsfähig geworden...

Text2Edit:文本驱动视频广告创作的原生多模态模型(未发布)-首席AI分享圈

Text2Edit: Ein natives multimodales Modell für die textgesteuerte Erstellung von Videoanzeigen (unveröffentlicht)

Allgemeine Einführung Text2Edit ist ein Open-Source-Projekt, das auf GitHub gehostet wird und darauf abzielt, effiziente Funktionen zur Textbearbeitung und Werbeerstellung bereitzustellen. Das Hauptziel des Projekts ist es, den Nutzern zu helfen, Textinhalte schnell zu bearbeiten und qualitativ hochwertiges Werbematerial durch eine einfach zu bedienende Oberfläche und leistungsstarke Funktionen zu generieren.Text2Edi...

Day of AI:麻省理工打造的免费人工智能自学网站-首席AI分享圈

Day of AI: eine kostenlose Website zum Selbststudium von KI, erstellt vom MIT

Der Day of AI (Tag der Künstlichen Intelligenz) wurde im Juni 2021 am MIT ins Leben gerufen. Unter der Leitung eines Teams von Lehrkräften und Forschern von RAISE (Responsible Artificial Intelligence and Education) des MIT zielt das Projekt "Day of AI" darauf ab, Schüler aller Fachrichtungen und Fähigkeiten auf den "Day of AI" vorzubereiten...

十方融海 小智AI 已跃居GitHub全球排行榜第一!-首席AI分享圈

Ten Square Ronghai Xiaozhi AI hat sich an die Spitze des globalen GitHub-Rankings gesetzt!

Künstliche Intelligenz (KI) ist in der heutigen, sich ständig verändernden Technologie eine Kraft, mit der man rechnen muss und die die Art und Weise, wie wir leben und arbeiten, tiefgreifend verändert. Die Ten Square Ronghai Xiaozhi AI Voice Box hat sich mit ihrer exzellenten Leistung und innovativen Benutzererfahrung an die Spitze des globalen GitHub-Rankings gesetzt...

Operator 系统技术文档-首席AI分享圈

Operator System Technische Dokumentation

Originalartikel: https://cdn.openai.com/operator_system_card.pdf EXPLAIN: OpenAI bringt Operator auf den Markt, die erste Intelligenz auf L3-Ebene: Eröffnung einer neuen Ära der Mensch-Computer-Interaktion 1 Einleitung Operator ist eine F&E-Vorschauversion unseres Computer Usage Agent (CUA)-Modells, das die GPT -4...

OpenAI 推出首个L3级智能体Operator:开启人机交互新时代-首席AI分享圈

OpenAI bringt Operator auf den Markt, die erste L3-Level-Intelligenz, die eine neue Ära der Mensch-Computer-Interaktion einleitet

Die Computernutzungsbranche ist voll von Start-ups, schwarzen Schafen und riesigen Big Playern, und jetzt mischt OpenAI sie auf. Sie können Desktop Automation Intelligence Body folgen, haben wir Dutzende von verwandten Produkten gesammelt. Das Feld der künstlichen Intelligenz wird zunehmend wettbewerbsfähig, nicht nur Startup-Newcomer auftauchen, Technologie-Riesen haben auch eingegeben...

de_DEDeutsch