최신 AI 리소스

共 3143 篇文章

코스 정보 최신 AI 리소스 AI 기술 자료 AI 뉴스

순서대로 정렬

훑어보기 북마크(인터넷)

FLUX.2 - 黑森林开源的图像生成与编辑模型

FLUX.2 - 블랙 포레스트 오픈 소스 이미지 생성 및 편집 모델

FLUX.2는 블랙 포레스트 랩에서 출시한 오픈 소스 이미지 생성 및 편집 모델로, 텍스트 원시 이미지, 다중 이미지 참조, 풍부한 디테일, 선명한 질감, 안정적인 조명으로 이미지 편집을 지원합니다. FLUX.2 [프로](최상위 클로즈드 소스에 필적하는...

최신 AI 리소스

8개월 전

041.7K

Petri - Anthropic开源的 AI 安全审计框架

Petri - Anthropic의 오픈 소스 AI 보안 감사 프레임워크

Petri는 Anthropic에서 개발한 오픈 소스 AI 보안 감사 프레임워크로, AI 모델의 보안 및 동작 정렬을 체계적으로 평가합니다. 자동화된 감사자가 대상 모델과 여러 차례 대화하는 실제 시나리오를 시뮬레이션한 다음, 심사 에이전트가 모델의...

최신 AI 리소스

9개월 전

041.6K

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

DeepSeek-Math-V2 - 딥시크 오픈 소스 수학적 추론 모델

DeepSeek-Math-V2는 팬텀 큐브 산하의 인공지능 회사 딥시크의 오픈소스 수학 추론 모델로, 최신 버전은 딥시크-V3.2-Exp-Base를 기반으로 개선되어 제미니 딥씽크의 성능을 능가하는 국제적인 수치를 달성했습니다....

최신 AI 리소스

8개월 전

041.5K

MiniMax M2.7 - MiniMax 推出的旗舰级 Agent 推理大模型

MiniMax M2.7 - MiniMax 推出的旗舰级 Agent 推理大模型

MiniMax M2.7 是 MiniMax 推出的旗舰级 Agent 推理大模型，主打"模型自我进化"能力。模型通过构建 Agent Harness 体系，深度参与自身训练与优化流程，在部分研发场景...

최신 AI 리소스

4개월 전

041.5K

Gemini 3.1 Flash-Lite - Google推出的最轻量、最具性价比的模型

Gemini 3.1 Flash-Lite - Google推出的最轻量、最具性价比的模型

Gemini 3.1 Flash-Lite 是 Google 发布的 Gemini 3 系列中最轻量、最具性价比的模型，主打极致速度与低成本。模型从 Gemini 3 Pro 蒸馏而来，输入价格仅 ...

최신 AI 리소스

5개월 전

041.5K

微信ClawBot - 微信官方推出连接 OpenClaw 的 AI 插件

微信ClawBot - 微信官方推出连接 OpenClaw 的 AI 插件

微信ClawBot是微信官方推出的AI插件，核心定位是连接OpenClaw（开源AI智能体框架）与微信的消息通道。用户只需在部署OpenClaw的设备上执行一条命令完成安装，可通过微信聊天界面直接发送...

최신 AI 리소스

4개월 전

041.5K

Seekdb - 蚂蚁OceanBase开源的AI原生混合搜索数据库

Seekdb - Ant OceanBase 오픈 소스 AI 네이티브 하이브리드 검색 데이터베이스

Seekdb(OceanBase Seekdb)는 짧은 대기 시간에서 고정밀 검색을 달성하기 위해 다단계 검색 메커니즘을 사용하여 벡터, 전체 텍스트, 스칼라 및 지리 공간 데이터의 통합 하이브리드 검색을 지원하는 Ant OceanBase 오픈 소스 AI 네이티브 하이브리드 검색 데이터베이스입니다 ...

최신 AI 리소스

8개월 전

041.4K

InkSight - Google开源的AI手写识别工具

InkSight - Google의 오픈 소스 AI 필기 인식 도구

InkSight는 종이 필기 노트를 편집 가능한 디지털 잉크 파일(예: SVG 형식)로 변환하는 Google의 오픈 소스 AI 필기 인식 도구입니다. 기존 OCR과 달리 텍스트 콘텐츠를 인식하고 필기 스타일, 단락 구조, 주요 표시를 복원하며 다국어 처리를 지원할 수 있습니다.

최신 AI 리소스

8개월 전

041.4K

YouClaw - Chat2DB 开源的极简 AI Agent 桌面客户端

YouClaw - Chat2DB 开源的极简 AI Agent 桌面客户端

YouClaw 是 Chat2DB 团队推出的极简 AI Agent 桌面客户端，主打"最懂你的 AI 个人助理"定位。基于 Tauri 2 + React 构建，安装包仅约 30MB，支持 Wind...

최신 AI 리소스

4개월 전

041.3K

悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Wujie-Emu3.5 - 위즈덤 소스 연구소 오픈 소스 멀티모달 월드 빅 모델

우지에-이뮤3.5는 베이징 지위안 인공지능 연구소의 오픈 소스 멀티모달 월드 매크로 모델로, 340억 개의 레퍼런스와 네이티브 월드 모델링 기능을 갖추고 있습니다. 10조 개의 멀티모달 토큰(790년 분량의 비디오 데이터 포함)으로 훈련된 이 모델은 물리 법칙을 시뮬레이션하고 그래픽 생성, 시각적 안내를 달성할 수 있습니다....

최신 AI 리소스

8개월 전

041.3K

SkyClaw - Skywork AI 推出的云端AI Agent工作空间

SkyClaw - Skywork AI 推出的云端AI Agent工作空间

SkyClaw 是 Skywork AI 推出的云端持久化智能工作空间，定位超越传统对话机器人的"主动执行型代理"。支持在 Slack、Discord、WhatsApp 等主流平台原生集成，能基于用户...

최신 AI 리소스

4개월 전

041.2K

Computer Use Preview - Google开源的AI浏览器自动化工具

컴퓨터 사용 미리보기 - Google의 오픈 소스 AI 브라우저 자동화 도구

컴퓨터 사용 미리보기는 자연어 명령을 통해 웹 페이지 상호 작용을 달성하기 위해 쌍둥이 자리 모델에 기반한 Google의 오픈 소스 AI 브라우저 자동화 도구입니다. 시각적 인식 프로세스의 "스크린 샷 → 분석 → 실행"을 사용하여 Playwrigh ...

최신 AI 리소스

7개월 전

041.1K

FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 그래픽용 360 오픈 소스 크로스 모달 시각 언어 모델

FG-CLIP 2는 360 인공 지능 연구소에서 출시 한 세계 최고의 그래픽 크로스 모드 시각 언어 모델 (VL-M)로 29 개의 권위있는 벤치 마크에서 Google 및 Meta의 유사 모델을 능가하여 현재 가장 강력한 VL-M으로, 총체적 ...

최신 AI 리소스

9개월 전

041K

肉包 - 开源AI手机自动化助手，能看懂屏幕自动执行

肉包 - 开源AI手机自动化助手，能看懂屏幕自动执行

肉包（Roubao）是开源的AI手机助手，让用户用现有Android手机能体验类似"豆包手机"的智能自动化功能。肉包基于视觉语言模型，能看懂屏幕内容并自动执行复杂任务，从点外卖、发微信到跨App操作...

최신 AI 리소스

4개월 전

040.7K

DuClaw - 百度智能云推出的OpenClaw云部署服务

DuClaw - 百度智能云推出的OpenClaw云部署服务

DuClaw是百度智能云推出的托管式OpenClaw服务，专为无技术背景用户设计。DuClaw免除了服务器配置、镜像选择和API密钥管理的繁琐步骤，用户订阅后可在网页端直接调用完整的智能体功能。

최신 AI 리소스

5개월 전

040.6K

ChatTutor - 开源的AI教学辅助工具，可视化互动学习

ChatTutor - 대화형 학습을 시각화하는 오픈 소스 AI 교육 보조 도구

ChatTutor는 오픈 소스 AI 교구로, STEM 과목의 시각적 대화형 학습에 중점을 두고 있습니다. 대화 Q&A 및 동적 그리기 기능을 달성하는 다중 지능형 바디 아키텍처를 통해 화이트보드에 수학 그래픽, 물리 회로 또는 마인드맵을 실시간으로 그릴 수 있어 사용자가 추상적인 일반 개념을 직관적으로 이해할 수 있도록 도와줍니다.

최신 AI 리소스

8개월 전

040.6K

GLM-5-Turbo - 智谱 AI 推出专为 OpenClaw 场景深度优化的基座模型

GLM-5-Turbo - 智谱 AI 推出专为 OpenClaw 场景深度优化的基座模型

GLM-5-Turbo 是智谱 AI 发布的全球首款专为 OpenClaw（龙虾）场景深度优化的基座模型，也是 GLM-5 系列的高速增强版本。模型从训练阶段就针对 Agent 任务的核心需求进行专...

최신 AI 리소스

5개월 전

040.5K

RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - Wisdom Source에서 여러 대학과 협력하여 오픈소스화한 양팔 로봇용 실제 로봇 데이터 세트입니다.

로보코인은 베이징 즈위안 인공지능 연구소가 여러 기업 및 대학과 함께 오픈소스화한 세계 최초의 대규모 양팔 로봇 실기계 데이터셋으로, 15종의 로봇 플랫폼, 18만 개의 실제 동작 궤적, 421종의 작업 시나리오가 포함되어 있습니다. 가장 큰 특징은 작업을 분해하는 계층적 주석 시스템을 채택했다는 점입니다.

최신 AI 리소스

8개월 전

040.4K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

최신 AI 리소스

2개월 전

040.2K

QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5 - 알리 통이 연구소 오픈 소스 긴 텍스트 추론 모델

QwenLong-L1.5는 알리바바 통이 연구소의 오픈 소스 긴 텍스트 추론 모델로, 매우 긴 컨텍스트(예: 100만~4백만 토큰)의 복잡한 추론 문제를 해결하는 데 중점을 둡니다. 핵심 혁신은 지식 그래프, SQL 구문 분석 및 다중 지능을 통한 학습 후 단계의 세 가지 주요 혁신에 있습니다 ...

최신 AI 리소스

7개월 전

040.2K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

최신 AI 리소스

2개월 전

040.2K

SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2 - ByteHop의 오픈 소스 멀티모달 시각 언어 모델

SAIL-VL2는 이미지와 텍스트와 같은 멀티모달 입력의 공동 모델링에 중점을 둔 Byte Jump 팀의 오픈 소스 멀티모달 시각 언어 모델입니다. 전문가(MoE) 아키텍처와 점진적 훈련 전략의 희소 혼합을 사용하여 2B~8B의 매개변수 규모, 특히 그래픽 이해, 수학적 이해에서 높은 성능을 달성합니다.

최신 AI 리소스

10개월 전

040.2K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

최신 AI 리소스

2개월 전

040.1K

BestBlogs - 开源的AI内容聚合平台，精选优质技术内容

BestBlogs - 다양한 고품질 기술 콘텐츠를 제공하는 오픈 소스 AI 콘텐츠 집계 플랫폼

베스트블로그는 기술 실무자, 기업가, 제품 관리자 등을 위한 고품질 콘텐츠를 제공하는 데 중점을 둔 플랫폼입니다. RSS 피드와 크롤러 기술을 통해 400개가 넘는 고품질 블로그에서 기사, 팟캐스트, 동영상 및 기타 다양한 형식의 콘텐츠를 수집합니다. 핵심 강점은 AI 빅 랭귀지 활용에 있습니다...

최신 AI 리소스

9개월 전

040.1K

Mobile-Agent-v3.5 - 阿里通义开源的原生GUI Agent框架

Mobile-Agent-v3.5 - 阿里通义开源的原生GUI Agent框架

Mobile-Agent-v3.5是阿里巴巴通义实验室开源的新一代多平台GUI Agent框架，支持桌面、手机、浏览器三大平台，可跨Android、Ubuntu、macOS、Windows实现自动化操...

최신 AI 리소스

5개월 전

039.9K

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T是蚂蚁集团百灵团队发布的万亿级旗舰思考模型，总参数1万亿，采用稀疏MoE架构，推理时仅激活约630亿参数，兼顾规模与效率。核心创新支持High与XHigh两档可调节推理强度

최신 AI 리소스

3 개월 전

039.9K

Mistral 3 - Mistral AI发布开源的最新多模态大模型系列

미스트랄 3 - 미스트랄 AI, 오픈 소스의 최신 멀티모달 대형 모델 시리즈 출시

미스트랄 3는 미스트랄 AI가 오픈소스로 공개한 최신 멀티모달 대형 모델 시리즈로, 플래그십 모델인 미스트랄 대형 3(총 파라미터 675B)와 이미지 이해 기능을 지원하는 미니스트랄 시리즈의 경량 버전(3B/8B/14B)으로 구성된다...

최신 AI 리소스

8개월 전

039.8K

Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 비디오 - 북경대학교에서 오픈소스화한 비디오 추론 모델 유나이티드바이트

Open-o3 Video는 북경대학교와 바이트댄스가 공동 개발한 오픈 소스 비디오 추론 모델로, 시간적 및 공간적 증거를 통해 비디오 추론을 향상시키는 데 중점을 두고 있습니다. 타임스탬프와 바운딩 박스로 주요 증거에 명시적으로 레이블을 지정하여 모델이 비디오 콘텐츠를 더 잘 이해하고 해석할 수 있도록 도와줍니다.

최신 AI 리소스

9개월 전

039.7K

SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - 상탕 테크놀로지의 오픈 소스 공간 인텔리전스 대규모 모델 제품군

센스노바-SI는 샹테크에서 출시한 오픈 소스 공간 지능 그랜드 모델로, 공간 이해와 추론에 있어 AI의 능력을 향상시키는 데 중점을 두고 있습니다. 이 모델은 공간 측정, 재구성, 관계 판단, 원근 변환, 변형 분석, 공간 추론 등 6가지 핵심 차원에서 탁월한 성능을 발휘하며 다른 모델보다 월등히 뛰어납니다.

최신 AI 리소스

9개월 전

039.6K

AlphaClaw - 熵简科技推出的金融投研 AI Agent 工具

AlphaClaw - 熵简科技推出的金融投研 AI Agent 工具

AlphaClaw 是熵简科技推出的金融投研 AI 工具，搭载于 AlphaEngine 平台，被誉为"投研小龙虾"。完成了从"有问必答的 AI 助手"向"自主执行的 AI 分析师"的进化，能独立跑通...

최신 AI 리소스

5개월 전

039.6K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

최신 AI 리소스

2개월 전

039.6K

Seedance 2.0 - 字节Seed团队推出的第二代多模态AI视频生成模型

Seedance 2.0 - 字节Seed团队推出的第二代多模态AI视频生成模型

Seedance 2.0 是字节跳动（TikTok母公司）Seed团队开发的第二代多模态AI视频生成模型，代表了从单纯文本/图像转视频工具向专业级电影制作平台的重大升级，支持文本、图像、视频片段和音频...

최신 AI 리소스

4개월 전

039.3K

GigaWorld-0 - 极佳视界开源的世界模型框架

기가월드-0 - 기가비전 오픈 소스 월드 모델링 프레임워크

기가월드-0는 국내 임베디드 인텔리전스 스타트업 기가AI의 오픈소스 월드 모델 프레임워크로, 주로 임베디드 인텔리전스(구현형 AI) 분야의 데이터 병목 문제를 해결하는 데 사용됩니다. 고품질의 다양하고 물리적으로 사실적인 학습 데이터를 효율적으로 생성하고, 푸시...

최신 AI 리소스

8개월 전

039.3K

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - 미션의 LongCat 팀 오픈 소스 이미지 생성 및 편집 모델

롱캣-이미지는 메이투안의 롱캣 팀이 출시한 오픈 소스 이미지 생성 및 편집 모델입니다. 시각 언어 모델(VLM) 조건부 인코더와 결합된 하이브리드 백본 아키텍처(MM-DiT+Single-DiT)를 사용하여 텍스트 생성 이미지와 여러 라운드의 이미지 편집을 수행할 수 있습니다....

최신 AI 리소스

8개월 전

039.1K

Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - 매직히치와 울리 울리 팀이 오픈소스로 제공하는 AI 워크플로 개발 도구

Flowra는 모델스코프와 우마일 WULI 팀의 오픈소스 그래프 실행 엔진 및 노드 패키지 개발 도구로, FlowBench의 핵심 구성 요소입니다. 지능형 캐싱, 병렬 스케줄링, 분산 지원을 갖춘 방향성 비순환 그래프(DAG) 조직 워크플로우를 통해 ...

최신 AI 리소스

8개월 전

039.1K

VibeVoice-Realtime - 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime - Microsoft 오픈 소스 경량 실시간 텍스트 음성 변환 모델

VibeVoice-Realtime은 짧은 지연 시간과 실시간 상호 작용을 위해 설계된 Microsoft의 오픈 소스 경량 실시간 텍스트 음성 변환(TTS) 모델입니다. 스트리밍 텍스트 입력을 지원하며, 첫 번째 텍스트 토큰부터 음성을 낼 수 있고, 지연 시간은 약 300ms에 불과하며, 동적 숫자에 적합합니다 ...

최신 AI 리소스

8개월 전

039K

JJT - 360推出的全链路AI演示文稿创作工具

JJT - 360推出的全链路AI演示文稿创作工具

JJT（超级J的AI PPT）是360推出的全链路AI演示文稿创作工具，让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据，AI即可自动生成结构完整、视觉专业的演示文稿

최신 AI 리소스

3 개월 전

038.9K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

최신 AI 리소스

2개월 전

038.7K

NineClaw - 好未来推出的教师专属 AI 原生桌面超级智能体

NineClaw - 好未来推出的教师专属 AI 原生桌面超级智能体

NineClaw（九章龙虾）是好未来（TAL）推出的行业首款教师专属AI原生桌面超级智能体，昵称"九龙"。深度融合好未来20年教研积累与海量题库资源，采用本地化运行架构，支持Windows和MacO...

최신 AI 리소스

4개월 전

038.1K

MiniMax M2.1 - MiniMax开源的编码和代理模型

MiniMax M2.1 - MiniMax 오픈 소스 코딩 및 에이전트 모델

MiniMax M2.1은 100억 건의 활성화를 달성한 MiniMax의 오픈 소스 코딩 및 에이전트 모델이며 Rust, Java, Golang, C++, Kotlin, Objective-C, TypeS 등 여러 주요 프로그래밍 언어를 지원합니다....

최신 AI 리소스

7개월 전

038K

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge是专为AI编程代理设计的开源后端平台，由PostgreSQL和PostgREST构建，提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令，支持...

최신 AI 리소스

3 개월 전

037.9K

Gemini Embedding 2 - Google推出的首个原生五模态 Embedding 模型

Gemini Embedding 2 - Google推出的首个原生五模态 Embedding 模型

企业知识库管理员：需要统一检索文档、会议录音、培训视频、产品图片等多模态资料的企业用户 RAG 应用开发者：为多模态内容提供语义检索能力，提升生成质量的 AI 应用开发者法律/医疗行业从业者：如 E...

최신 AI 리소스

5개월 전

037.7K

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型，也是首款具备 GPT-5 级推理能力的端到端语音代理模型，上下文窗口扩展至 128K，支持图像输入、五级可调推理强度与并行...

최신 AI 리소스

3 개월 전

037.5K

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体，央企首个深度兼容OpenClaw生态的"自研小龙虾"，主打"本地优先、隐私至上"。采用一键安装开箱即用设计，适配Windows/ma...

최신 AI 리소스

4개월 전

037.4K

HY-WU - 腾讯混元开源的实时神经参数生成框架

HY-WU - 腾讯混元开源的实时神经参数生成框架

HY-WU（混元无相）是腾讯混元推出的功能性神经记忆框架，能在AI推理时即时创建个性化适配参数。框架为每个任务"临时定制"专属技能，无需重新训练模型。

최신 AI 리소스

5개월 전

037.2K

NemoClaw - NVIDIA 推出的开源企业级 AI Agent 安全增强平台

NemoClaw - NVIDIA 推出的开源企业级 AI Agent 安全增强平台

NemoClaw 是 NVIDIA 推出的开源企业级 AI Agent 安全增强平台。作为 OpenClaw 的"安全插件"和运行时沙箱层，通过 OpenShell 为自主 AI 代理添加企业级的隐私...

최신 AI 리소스

5개월 전

037.2K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

최신 AI 리소스

2개월 전

037.1K

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1是Luma AI推出的图像生成模型，将文本理解与图像生成整合进同一个 decoder-only、autoregressive 模型中，非像主流方案那样把语言模型和图像模型拼接使用。

최신 AI 리소스

3 개월 전

036.9K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

최신 AI 리소스

2개월 전

036.8K

gws - 谷歌开源的CLI工具，支持接入各类AI Agent系统

gws - 谷歌开源的CLI工具，支持接入各类AI Agent系统

gws 是 Google Workspace 团队推出的命令行工具，采用 Rust 构建。工具支持运行时动态生成命令，通过读取 Google Discovery Service 实时适配所有 Work...

최신 AI 리소스

5개월 전

036.4K

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 是深度求索发布的新一代大语言模型系列预览版，已同步开源并开放 API。系列采用 MoE 架构，包含 V4-Pro（1.6T 参数 / 49B 激活）与 V4-Flash（284...

최신 AI 리소스

3 개월 전

036.4K

Fun-CineForge - 阿里通义实验室开源的影视级配音多模态大模型

Fun-CineForge - 阿里通义实验室开源的影视级配音多模态大模型

Fun-CineForge 是阿里通义实验室开源的首个支持影视级多场景配音的多模态大模型，基于 CosyVoice3 打造。通过"数据+模型"一体化设计，创新性地解决音画同步、情感表达、音色一致与时间...

최신 AI 리소스

5개월 전

036.4K

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时，重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力，支持最长15秒1080P视频生成。

최신 AI 리소스

4개월 전

036.4K

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型5.1（ERNIE 5.1）是百度发布的新一代基础大模型，采用创新的"多维弹性预训练"（Once-for-All）技术，实现"一次训练，生成多种规模模型"。通过弹性深度、弹性宽度与弹性稀疏度...

최신 AI 리소스

3 개월 전

036.3K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

최신 AI 리소스

2개월 전

036.2K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

최신 AI 리소스

2개월 전

036.1K

EdgeClaw - 面壁智能联合清华等开源的端云协同 AI 智能体框架

EdgeClaw - 面壁智能联合清华等开源的端云协同 AI 智能体框架

EdgeClaw 是面壁智能联合清华大学等机构开源的端云协同 AI 智能体框架，主打安全可控与本地部署。首创三层数据安全协议（S1/S2/S3），通过规则检测器与本地 LLM 语义检测器实时分类请求敏...

최신 AI 리소스

4개월 전

035.9K

HiDreamClaw - 智象未来推出的多模态原生AI智能体应用

HiDreamClaw - 智象未来推出的多模态原生AI智能体应用

HiDreamClaw 是智象未来（HiDream.ai）推出的多模态原生AI智能体应用，定位为图片与视频生成垂直领域的创作助手。目前已接入其海外平台vivago，面向创作者提供7×24小时在线服务。

최신 AI 리소스

4개월 전

035.8K

Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

Ovis-Image - Ali AIDC-AI 팀의 오픈 소스 벤처 그래프 모델

Ovis-Image는 알리바바 인터내셔널 디지털 커머스 그룹의 AIDC-AI 팀이 오픈소스화한 70억 개의 파라미터로 구성된 텍스트 생성 그래프 모델로, 고품질 텍스트 렌더링에 중점을 두고 있습니다. Ovis-U1 아키텍처를 기반으로 고급 시각 디코더와 양방향 토큰 리파이너를 계승합니다.

최신 AI 리소스

8개월 전

035.7K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

최신 AI 리소스

2개월 전

035.7K

MiMo-V2-TTS - 小米推出的自研语音合成大模型

MiMo-V2-TTS - 小米推出的自研语音合成大模型

MiMo-V2-TTS是小米推出的自研语音合成大模型，与MiMo-V2-Pro、MiMo-V2-Omni共同构成小米面向"Agent时代"的三大基础模型矩阵。模型基于自研Audio Tokenizer...

최신 AI 리소스

4개월 전

035.6K

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...

최신 AI 리소스

2개월 전

035.5K

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架，专为自动驾驶场景设计。框架在业内首次将VLA（视觉-语言-动作）模型、世界模型与潜空间推理三大技术路线统一到单一架...

최신 AI 리소스

2개월 전

035.2K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

최신 AI 리소스

2개월 전

035.2K

InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

인스턴스어셈블 - 리틀 레드북과 푸단대학교 오픈 소스 레이아웃 제어 생성 기술

인스턴스어셈블은 샤오홍슈와 푸단대학교가 공동으로 오픈소스화한 레이아웃 제어 생성 기술로, '인스턴스 어셈블 주의' 메커니즘을 통해 단순한 레이아웃에서 복잡한 레이아웃, 희박한 레이아웃에서 조밀한 레이아웃까지 정확한 이미지 생성을 달성합니다. 먼저 이미지 배경에 2단계 캐스케이드 아키텍처를 채택한 다음 하나씩 하나씩 ...

최신 AI 리소스

7개월 전

035K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

최신 AI 리소스

2개월 전

034.9K

Mistral Small 4 - Mistral AI 开源的多模态大模型

Mistral Small 4 - Mistral AI 开源的多模态大模型

Mistral Small 4 是 Mistral AI 开源的多模态大模型，采用 1190 亿参数 MoE 架构（每 token 激活 60 亿参数），支持 256K 超长上下文。核心突破在于三合一...

최신 AI 리소스

4개월 전

034.7K

Xiaomi MiMo-V2-Omni - 小米推出的Agent全模态基座模型

Xiaomi MiMo-V2-Omni - 小米推出的Agent全模态基座模型

Xiaomi MiMo-V2-Omni 是小米推出的面向Agent时代的全模态基座模型，专为现实世界中复杂的多模态交互与执行场景打造。模型从底层构建了融合文本、视觉、语音的统一架构，将"感知"与"行动...

최신 AI 리소스

4개월 전

034.7K

MiniMax Music 2.5+ - MiniMax推出的AI音乐生成模型

MiniMax Music 2.5+ - MiniMax推出的AI音乐生成模型

MiniMax Music 2.5+是MiniMax推出的AI音乐生成模型，专注器乐创作。模型精通古典管弦、电子氛围、自然声景等多元风格，擅长将东方传统乐器与西方现代编曲融合，实现跨风格创新。

최신 AI 리소스

5개월 전

034.7K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

최신 AI 리소스

2개월 전

034.7K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

최신 AI 리소스

2개월 전

034.7K

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign是 OpenCoworkAI 团队开发的开源桌面端 AI 设计工具，采用 MIT 协议，定位为 Claude Design 的开源替代品，同时覆盖 v0 by Vercel...

최신 AI 리소스

3 개월 전

034.6K

Xiaomi MiMo-V2-Pro - 小米推出的旗舰级MoE大模型

Xiaomi MiMo-V2-Pro - 小米推出的旗舰级MoE大模型

Xiaomi MiMo-V2-Pro 是小米推出的旗舰级MoE大模型，采用1万亿总参数、420亿激活参数的混合专家架构，支持最高100万token超长上下文。模型以代号"Hunter Alpha"匿名...

최신 AI 리소스

4개월 전

034.6K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

최신 AI 리소스

2개월 전

034.6K

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni是阿里通义推出的新一代全模态大模型，支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构，支持256K超长上下文，可处理10小时音频或...

최신 AI 리소스

4개월 전

034.5K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

최신 AI 리소스

2개월 전

034.5K

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体，以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...

최신 AI 리소스

4개월 전

034.3K

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next 是美团龙猫开源的原生多模态大模型，采用"下一个Token预测"（NTP）统一架构，将图像、语音与文本映射为同源离散Token，打破传统"语言为中心"的拼凑式设计。核心创新包括...

최신 AI 리소스

4개월 전

034.2K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

최신 AI 리소스

2개월 전

034.1K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

최신 AI 리소스

2개월 전

034.1K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

최신 AI 리소스

2개월 전

033.9K

Vidu Claw - Vidu AI 推出的 AI 视频创意Agent

Vidu Claw - Vidu AI 推出的 AI 视频创意Agent

Vidu Claw（代号"V龙"）是生数科技旗下 Vidu AI 平台推出的 AI 创意智能体，定位为"你的第一个 AI 创意员工"。基于 Vidu 视频大模型构建，能自动完成从创意理解、脚本撰写、分...

최신 AI 리소스

4개월 전

033.9K

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code - 月之暗面Kimi开源的编程专用大模型

Kimi K2.7 Code是月之暗面（Moonshot AI）发布并开源的编程专用大模型，属于Kimi K2系列的最新迭代版本。专为长上下文编程和复杂任务优化，聚焦代码生成、理解、调试及多文件项目架...

최신 AI 리소스

2개월 전

033.9K

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw 是涂鸦智能（Tuya Smart）推出的 AI 助理，基于 OpenClaw 架构搭建，是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...

최신 AI 리소스

4개월 전

033.9K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

최신 AI 리소스

2개월 전

033.8K

MAI-Image-2 - 微软推出的第二代自研图像生成模型

MAI-Image-2 - 微软推出的第二代自研图像生成模型

MAI-Image-2 是微软推出的第二代自研图像生成模型，模型在权威评测平台 LMArena 中跃升至全球第三位，仅次于谷歌和 OpenAI，标志着微软在图像生成领域实现从"追赶者"到"第一梯队"的...

최신 AI 리소스

4개월 전

033.8K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

최신 AI 리소스

2개월 전

033.7K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

최신 AI 리소스

2개월 전

033.7K

Qwen3.5-Max-Preview - 阿里通义千问推出的旗舰大模型预览版

Qwen3.5-Max-Preview - 阿里通义千问推出的旗舰大模型预览版

Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版，在 LM Arena 国际大模型竞技场以1464分跻身全球前五、国内第一，标志着国产大模型首次进入全球第一梯队。

최신 AI 리소스

4개월 전

033.6K

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime 是阶跃星辰发布的新一代实时语音大模型，目前已全量上线开放平台。模型主打"活人感"对话体验，通过副语言感知、千万级人设自定义与双商进阶的对话能力，实现从文本...

최신 AI 리소스

3 개월 전

033.5K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

최신 AI 리소스

2개월 전

033.5K

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9是昆仑万维旗下天工AI在中关村论坛上发布的AI音乐模型，是Mureka系列的最新迭代版本，通过技术创新重塑数字音乐创作生态。基于Musicot（Music Chain-of-Thou...

최신 AI 리소스

4개월 전

033.5K

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型，专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力，能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码，实现"所...

최신 AI 리소스

4개월 전

033.5K

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo 是 marswaveai 团队开源的中文语音输入工具，专为 macOS 打造。用户只需轻点 Control 键即可录音，松手后语音会在本地实时转为文字并自动填入当前应用。

최신 AI 리소스

4개월 전

033.4K

Fun-CosyVoice3.5 - 阿里通义实验室推出的第三代语音合成大模型

Fun-CosyVoice3.5 - 阿里通义实验室推出的第三代语音合成大模型

Fun-CosyVoice3.5是阿里通义实验室推出的第三代语音合成大模型，主打"自然语言指令控制"能力，用户可直接用口语化描述（如"语气坚定一点""语速慢一点"）来调节合成语音的情绪、语速和风格，无...

최신 AI 리소스

5개월 전

033.4K

GPT-5.4 mini - OpenAI 推出的轻量级 AI 模型

GPT-5.4 mini - OpenAI 推出的轻量级 AI 模型

GPT-5.4 mini 是 OpenAI 发布的轻量级模型，定位为"迄今能力最强的小型模型"。在保留 GPT-5.4 核心能力的同时，实现了速度提升 2 倍以上，成本大幅降低，专为对延迟敏感的高频工...

최신 AI 리소스

4개월 전

033.3K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

최신 AI 리소스

2개월 전

033.1K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

최신 AI 리소스

2개월 전

033K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

최신 AI 리소스

2개월 전

032.9K