Últimos recursos sobre IA

共 3102 篇文章

Información sobre el curso Últimos recursos sobre IA Base de conocimientos de IA Noticias AI

ordenar

hojear Marcador (Internet)

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Serie de modelos multilingües multimodales de código abierto Wisdom Spectrum AI

GLM-4.6V es una serie de grandes modelos lingüísticos multimodales de código abierto de Smart Spectrum AI. La serie contiene dos versiones: GLM-4.6V (106B-A12B), la versión base para escenarios de nube y clúster de alto rendimiento, con la arquitectura Mixed Expert (MoE), un total de unos 106.000 millones de referencias y una activación...

Últimos recursos sobre IA

hace 6 meses

031.6K

吴恩达的LangChain for LLM应用开发免费课程

Curso gratuito de LangChain para el desarrollo de aplicaciones LLM por Ernest Ng

LangChain for LLM Application Development es un curso en línea de DeepLearning.AI en el que participan el fundador de LangChain, Harrison Chase, y Andrew Ng.

Últimos recursos sobre IA Información sobre el curso

hace 9 meses

065.3K

吴恩达的Transformer LLMs工作原理免费课程

Curso gratuito sobre el funcionamiento de los Transformer LLM, por Enda Wu

Los LLM transformadores funcionan según el principio que DeepLearning.AI y Jay Alammar y Maarten Grootend, autores de Hands-On Large Language Models...

Últimos recursos sobre IA Información sobre el curso

hace 9 meses

059.4K

Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - ¡El último modelo de Dark Side of the Moon!

Kimi K2-0905 es un modelo avanzado de IA de Dark Side of the Moon Technologies Ltd. que destaca en la asistencia a la programación, genera código de forma eficiente y favorece la generación de código ordenado y estandarizado en el desarrollo front-end. La longitud del contexto del modelo se amplía hasta 256K para gestionar tareas complejas.

Últimos recursos sobre IA

hace 9 meses

082.5K

Nano Banana - 谷歌推出的AI图像编辑模型

Nano Banana - Modelo de edición de imágenes con inteligencia artificial de Google

Nano Banana es el nombre en clave de Gemini 2.5 Flash Image para Gemini, un modelo de generación y edición de imágenes AI de Google que genera imágenes detalladas y fotorrealistas basadas en simples indicaciones de texto para realizar modificaciones de alta calidad en imágenes existentes.

Últimos recursos sobre IA

hace 10 meses

075.2K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - Modelado multimodal eficiente de código abierto por KunlunWanwei

Skywork UniPic 2.0 es un eficiente modelo multimodal de código abierto de Quintessence, centrado en la generación, edición y comprensión de imágenes. El modelo se basa en una arquitectura SD3.5-Medium de 2B parámetros, y se realiza mediante pre-entrenamiento, estrategia de refuerzo progresivo de doble tarea y co-entrenamiento....

Últimos recursos sobre IA

hace 10 meses

049.8K

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - Modelo de generación de voz de MiniMax

MiniMax Speech 2.5 es un modelo avanzado de generación del habla desarrollado por el equipo MiniMax. Supone un avance significativo en el campo de la síntesis del habla, especialmente en términos de expresividad multilingüe, precisión en la reproducción del timbre y cobertura lingüística. El modelo admite 40 idiomas...

Últimos recursos sobre IA

hace 10 meses

055K

GPT-5 - OpenAI推出的最强语言模型，统一智能系统

GPT-5 - El modelo de lenguaje más sólido presentado por OpenAI, sistema de inteligencia unificado

GPT-5 es el último modelo de lenguaje lanzado por OpenAI con varias actualizaciones. Es un sistema de inteligencia unificada con un enrutador en tiempo real integrado que cambia automáticamente entre los modos de pensamiento eficiente y profundo en función de la complejidad del problema, lo que permite una respuesta rápida y respuestas precisas.GPT-5 tiene varias versiones, incluyendo para pu...

Últimos recursos sobre IA

hace 10 meses

053.3K

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian lanza el modelo básico de código abierto de Qwen-Image

Qwen-Image es un modelo base de generación de imágenes de código abierto lanzado por el equipo Alibaba Tongyi Qianqian. Con 20.000 millones de parámetros, adopta la arquitectura de transformador de difusión multimodal (MMDiT), que incorpora tres módulos: comprensión multimodal, codificación de alta resolución y modelado de difusión.Qwen-Image...

Últimos recursos sobre IA

hace 10 meses

052.9K

RedOne - 小红书最新推出的社交大模型

RedOne: el último megamodelo social de Little Red Book

RedOne es un gran modelo lingüístico adaptado a las redes sociales presentado por Little Red Book. El modelo se entrena mediante una estrategia de formación en tres fases que incorpora conocimientos sociales y culturales, refuerza las capacidades multitarea y alinea las preferencias humanas.RedOne supera significativamente al modelo base en rendimiento de tareas sociales, en detección de contenidos nocivos y navegación...

Últimos recursos sobre IA

hace 10 meses

049.2K

TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - Asistente de desarrollo automatizado de Wordhop TRAE

TRAE SOLO es un asistente de desarrollo automatizado de IA introducido por TRAE, un asistente de programación de IA lanzado por ByteDance, para simplificar el proceso de desarrollo de software con tecnología de IA.TRAE SOLO entiende las necesidades del usuario, admite descripciones de texto, comandos de voz y cargas de archivos para introducir los requisitos, y planifica automáticamente...

Últimos recursos sobre IA

hace 11 meses

079.3K

LiveTalking：开源实时互动数字人直播系统，实现音视频同步对话

LiveTalking: sistema digital interactivo en tiempo real de código abierto que permite el diálogo síncrono por audio y vídeo.

Introducción completa LiveTalking es un sistema humano digital interactivo en tiempo real de código abierto , se ha comprometido a la construcción de alta calidad humana digital solución en vivo . El proyecto utiliza el protocolo de código abierto Apache 2.0 , integrado con una serie de tecnologías de vanguardia , incluyendo ER-NeRF renderizado , audio en tiempo real y procesamiento de streaming de vídeo ...

Últimos recursos sobre IA # AI Java Proyecto de código abierto # AI Digital Man

hace 1 año

0167.3K

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

meso- (química)Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code是月之暗面（Moonshot AI）发布并开源的编程专用大模型，属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化，聚焦代码生成、理解、调试及多文件项目架...

Últimos recursos sobre IA

hace 4 horas

0742

Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

meso- (química)Octask - 光魔科技推出的新一代 AI 原生内容工作室平台

Octask 是深圳光魔科技推出的新一代 AI 原生内容工作室平台，由谷歌与腾讯背景团队打造，获得百度 A 轮投资。核心创新在于将 AI 工具"员工化"，通过像素风格的沉浸式虚拟工作室，让创作者以"老...

Últimos recursos sobre IA

hace 11 horas

01.1K

蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

meso- (química)蛙蛙写作2.0升级深度解析：三栏架构如何重塑AI长篇创作体验

2025年7月，蛙蛙写作正式发布2.0版本，这是该产品自2024年上线以来幅度最大的一次产品重构。此次升级不仅在底层技术能力上实现了对主流大模型的深度整合，更在产品交互架构上做出了突破性的创新——引入...

Últimos recursos sobre IA

Hace 1 día

04K

JoyAI-Echo - 京东开源的分钟级长音视频生成框架

meso- (química)JoyAI-Echo - 京东开源的分钟级长音视频生成框架

JoyAI-Echo 是京东开源的分钟级长音视频生成框架，专为解决AI视频"角色易崩、声音乱变、生成缓慢"三大痛点而设计。基于LTX-2.3 DiT架构，通过跨模态记忆库在长达5分钟的多镜头视频中保持...

Últimos recursos sobre IA

hace 2 días

03.6K

Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

meso- (química)Meoo CLI - 阿里云Meoo秒悟团队推出的开源命令行工具

Meoo CLI是阿里云Meoo秒悟团队推出的开源命令行工具，是本地AI编程助手与云端能力之间的连接入口，让开发者无需手动处理复杂的云服务配置，即可实现项目的快速部署和上线。

Últimos recursos sobre IA

hace 2 días

04.6K

Claude Fable 5 - Anthropic发布的第五代大型语言模型

meso- (química)Claude Fable 5 - Anthropic发布的第五代大型语言模型

Claude Fable 5是Anthropic发布的第五代大型语言模型，属于其Claude系列，是首个面向公众开放的“Mythos级”（神话级）模型。

Últimos recursos sobre IA

hace 2 días

03.7K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

Últimos recursos sobre IA

hace 1 semana

017.2K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

Últimos recursos sobre IA

hace 1 semana

014.9K

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash 是微软自研的AI编程模型，采用137B参数MoE架构，专为真实开发环境训练，直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。

Últimos recursos sobre IA

hace 1 semana

012.1K

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家（MoE）架构，拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...

Últimos recursos sobre IA

hace 1 semana

012.7K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

Últimos recursos sobre IA

hace 1 semana

014.9K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

Últimos recursos sobre IA

hace 1 semana

014.1K

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构是阿里达摩院推出的 AI 原生应用搭建平台，平台以"Create For What You Want"为理念，让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力，支持通过自然语言描述需求...

Últimos recursos sobre IA

hace 1 semana

013.1K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

Últimos recursos sobre IA

hace 1 semana

012.5K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

Últimos recursos sobre IA

hace 2 semanas

017.1K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

Últimos recursos sobre IA

hace 2 semanas

015.1K

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型，专为生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部...

Últimos recursos sobre IA

hace 2 semanas

010.5K

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI（Bailian CLI）是阿里云Model Studio官方开源的命令行工具，通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力，涵盖文本...

Últimos recursos sobre IA

hace 2 semanas

010.1K

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory是腾讯混元推出的记忆插件，专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链三层核心架构，解决 Ag...

Últimos recursos sobre IA

hace 2 semanas

011K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

Últimos recursos sobre IA

hace 2 semanas

014K

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering（锻造...

Últimos recursos sobre IA

hace 2 semanas

012.1K

omp - 开源的终端 AI Coding Agent

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

Últimos recursos sobre IA

hace 2 semanas

012.8K

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 是自变量机器人（X Square Robot）推出的开源视觉-语言-动作（VLA）大模型，拥有 40 亿参数，基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...

Últimos recursos sobre IA

hace 2 semanas

011K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

Últimos recursos sobre IA

hace 2 semanas

015.7K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

Últimos recursos sobre IA

hace 2 semanas

012.6K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

Últimos recursos sobre IA

hace 2 semanas

014K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

Últimos recursos sobre IA

hace 2 semanas

013.8K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

Últimos recursos sobre IA

hace 3 semanas

015.4K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

Últimos recursos sobre IA

hace 3 semanas

015.2K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

Últimos recursos sobre IA

hace 3 semanas

012.2K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

Últimos recursos sobre IA

hace 3 semanas

015.7K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

Últimos recursos sobre IA

hace 3 semanas

015.2K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

Últimos recursos sobre IA

hace 3 semanas

014.5K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

Últimos recursos sobre IA

hace 3 semanas

015.8K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

Últimos recursos sobre IA

hace 3 semanas

017.4K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

Últimos recursos sobre IA

hace 3 semanas

015.3K

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型，首发版本为 Gemini Omni Flash。作为 Google 首个真正...

Últimos recursos sobre IA

hace 3 semanas

014.2K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

Últimos recursos sobre IA

hace 3 semanas

014.6K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

Últimos recursos sobre IA

hace 3 semanas

014.9K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

Últimos recursos sobre IA

hace 3 semanas

015.5K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

Últimos recursos sobre IA

hace 3 semanas

014.9K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

Últimos recursos sobre IA

hace 3 semanas

018.8K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

Últimos recursos sobre IA

hace 3 semanas

014.6K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

Últimos recursos sobre IA

hace 4 semanas

031.8K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

Últimos recursos sobre IA

hace 4 semanas

017.1K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

Últimos recursos sobre IA

hace 4 semanas

021.4K

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架，专为自动驾驶场景设计。框架在业内首次将VLA（视觉-语言-动作）模型、世界模型与潜空间推理三大技术路线统一到单一架...

Últimos recursos sobre IA

hace 4 semanas

015K

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...

Últimos recursos sobre IA

hace 4 semanas

014.4K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

Últimos recursos sobre IA

hace 1 mes

024K

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge是专为AI编程代理设计的开源后端平台，由PostgreSQL和PostgREST构建，提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令，支持...

Últimos recursos sobre IA

hace 1 mes

018.5K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

Últimos recursos sobre IA

hace 1 mes

023.6K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

Últimos recursos sobre IA

hace 1 mes

020.5K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

Últimos recursos sobre IA

hace 1 mes

020.5K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

Últimos recursos sobre IA

hace 1 mes

021.7K

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型，也是首款具备 GPT-5 级推理能力的端到端语音代理模型，上下文窗口扩展至 128K，支持图像输入、五级可调推理强度与并行...

Últimos recursos sobre IA

hace 1 mes

017.9K

JJT - 360推出的全链路AI演示文稿创作工具

JJT - 360推出的全链路AI演示文稿创作工具

JJT（超级J的AI PPT）是360推出的全链路AI演示文稿创作工具，让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据，AI即可自动生成结构完整、视觉专业的演示文稿

Últimos recursos sobre IA

hace 1 mes

019.2K

觅游 - 美团推出的 AI 原生共生社区

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

Últimos recursos sobre IA

hace 1 mes

020K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

Últimos recursos sobre IA

hace 1 mes

023.7K

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign是 OpenCoworkAI 团队开发的开源桌面端 AI 设计工具，采用 MIT 协议，定位为 Claude Design 的开源替代品，同时覆盖 v0 by Vercel...

Últimos recursos sobre IA

hace 1 mes

015.8K

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 是深度求索发布的新一代大语言模型系列预览版，已同步开源并开放 API。系列采用 MoE 架构，包含 V4-Pro（1.6T 参数 / 49B 激活）与 V4-Flash（284...

Últimos recursos sobre IA

hace 1 mes

014.7K

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T是蚂蚁集团百灵团队发布的万亿级旗舰思考模型，总参数1万亿，采用稀疏MoE架构，推理时仅激活约630亿参数，兼顾规模与效率。核心创新支持High与XHigh两档可调节推理强度

Últimos recursos sobre IA

hace 1 mes

019.8K

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3是xAI公司推出的最新一代大语言模型，属于Grok系列的重要更新版本，支持100万token的上下文窗口，可一次性处理整本书、大型代码库或长文档，思维链推理强制开启，模型在给出答案前会...

Últimos recursos sobre IA

hace 1 mes

014.5K

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型5.1（ERNIE 5.1）是百度发布的新一代基础大模型，采用创新的"多维弹性预训练"（Once-for-All）技术，实现"一次训练，生成多种规模模型"。通过弹性深度、弹性宽度与弹性稀疏度...

Últimos recursos sobre IA

hace 1 mes

016.3K

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime 是阶跃星辰发布的新一代实时语音大模型，目前已全量上线开放平台。模型主打"活人感"对话体验，通过副语言感知、千万级人设自定义与双商进阶的对话能力，实现从文本...

Últimos recursos sobre IA

hace 1 mes

014.8K

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1是Luma AI推出的图像生成模型，将文本理解与图像生成整合进同一个 decoder-only、autoregressive 模型中，非像主流方案那样把语言模型和图像模型拼接使用。

Últimos recursos sobre IA

hace 1 mes

015.6K

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体，以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...

Últimos recursos sobre IA

hace 2 meses

016.3K

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite是Google DeepMind发布的低成本AI视频生成模型，定位为Veo系列中最实惠的版本，专为大规模视频生成场景设计。模型支持文本和图像生成视频，输出720p和1080p分...

Últimos recursos sobre IA

hace 2 meses

012.3K

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型，专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力，能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码，实现"所...

Últimos recursos sobre IA

hace 2 meses

014.2K

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image 是阿里巴巴通义实验室发布的图像生成与编辑统一模型，定位为"全场景视觉创作旗舰"。模型直击AI生图领域"标准脸"审美疲劳和"色彩盲盒"痛点，采用生成与理解统一的底层架构，具备文...

Últimos recursos sobre IA

hace 2 meses

015.1K

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda是Lightpanda.io公司开发的开源无头浏览器，专为AI自动化和Web抓取设计。采用Zig语言从零构建，去除了图形渲染等冗余功能，核心优势是速度比Chrome快11倍，内存占...

Últimos recursos sobre IA

hace 2 meses

012.8K

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0是昆仑万维发布的实时交互式世界模型，属于AIGC全家桶中的三大核心模型之一。模型通过物理仿真驱动，解决了传统世界模型易失忆、环境不稳定的问题，支持720p、40fps实时...

Últimos recursos sobre IA

hace 2 meses

016.5K

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9是昆仑万维旗下天工AI在中关村论坛上发布的AI音乐模型，是Mureka系列的最新迭代版本，通过技术创新重塑数字音乐创作生态。基于Musicot（Music Chain-of-Thou...

Últimos recursos sobre IA

hace 2 meses

016.7K

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next 是美团龙猫开源的原生多模态大模型，采用"下一个Token预测"（NTP）统一架构，将图像、语音与文本映射为同源离散Token，打破传统"语言为中心"的拼凑式设计。核心创新包括...

Últimos recursos sobre IA

hace 2 meses

017.8K

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时，重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力，支持最长15秒1080P视频生成。

Últimos recursos sobre IA

hace 2 meses

018.8K

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni是阿里通义推出的新一代全模态大模型，支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构，支持256K超长上下文，可处理10小时音频或...

Últimos recursos sobre IA

hace 2 meses

017.6K

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体，央企首个深度兼容OpenClaw生态的"自研小龙虾"，主打"本地优先、隐私至上"。采用一键安装开箱即用设计，适配Windows/ma...

Últimos recursos sobre IA

hace 2 meses

019.2K

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor 是基于浏览器的3D建筑设计与可视化工具，专为建筑师、设计师和开发者打造，支持在网页端直接进行楼层规划、空间布局和建筑场景探索。采用现代Web技术栈（React Three ...

Últimos recursos sobre IA

hace 2 meses

014.8K

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw（科研龙虾）是面向科研人员的云端 AI 协同系统，定位为"科研人的深夜搭子"。能深度分析文献、自主执行实验、自动排版生成论文/PPT/海报，记住用户电脑里的所有研究资料，将灵感、执行与...

Últimos recursos sobre IA

hace 2 meses

014.4K

Voxtral TTS - Mistral AI推出的开源文本转语音模型

Voxtral TTS - Mistral AI推出的开源文本转语音模型

Voxtral TTSoxtral TTS是法国AI公司Mistral AI发布的开源文本转语音模型，采用40亿参数轻量化架构，量化后仅需3GB内存即可在智能手机等边缘设备实时运行。模型原生支持英语...

Últimos recursos sobre IA

hace 2 meses

011.9K

商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手

商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手

商汤输入法AudioClaw是商汤科技基于日日新多模态大模型打造的AI语音智能应用，深度接入OpenClaw底层能力，定位为"会听话的龙虾"智能助手。

Últimos recursos sobre IA

hace 3 meses

016K

SenseAudio - 商汤科技推出的一站式 AI 语音开放平台

SenseAudio - 商汤科技推出的一站式 AI 语音开放平台

SenseAudio 是商汤科技推出的AI语音开放平台，面向开发者与企业提供一站式语音AI解决方案。平台集成语音识别（ASR）、语音合成（TTS）、音色克隆等核心能力，语音识别覆盖20+语言并支持说话...

Últimos recursos sobre IA

hace 3 meses

015.8K

TurboQuant - Google Research 推出的突破性内存压缩算法

TurboQuant - Google Research 推出的突破性内存压缩算法

TurboQuant 是 Google Research 推出的突破性内存压缩算法，专为解决大语言模型推理中的 KV 缓存瓶颈而设计。

Últimos recursos sobre IA

hace 3 meses

015.7K

Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型

Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型

Gemini 3.1 Flash Live 是 Google 推出的旗舰级实时语音模型，被誉为"迄今最高质量的音频和语音模型"。主打超低延迟的自然对话体验，支持 90+ 种语言的原生多模态交互，能精准...

Últimos recursos sobre IA

hace 3 meses

017.1K

Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型

Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型

Lyria 3 Pro是谷歌推出的最先进的AI音乐生成模型。相比前代Lyria 3仅30秒的生成时长，Pro版本可一次性生成长达3分钟的完整音轨，精准控制前奏、主歌、副歌、桥段等歌曲结构。

Últimos recursos sobre IA

hace 3 meses

015.6K

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI是开源的命令行工具框架，将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口，将网站（如B站、知乎、Twitter等）和Electron应用（如Cursor、No...

Últimos recursos sobre IA

hace 3 meses

023.9K

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw 是涂鸦智能（Tuya Smart）推出的 AI 助理，基于 OpenClaw 架构搭建，是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...

Últimos recursos sobre IA

hace 3 meses

019.2K

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo 是 marswaveai 团队开源的中文语音输入工具，专为 macOS 打造。用户只需轻点 Control 键即可录音，松手后语音会在本地实时转为文字并自动填入当前应用。

Últimos recursos sobre IA

hace 3 meses

018K

Más información