最新のAIリソース

共 3096 篇文章

コース情報最新のAIリソース AI知識ベース AIニュース

順番に並べる

目を通すブックマーク

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Wisdom Spectrum AI オープンソース多言語ラージ言語モデルシリーズ

GLM-4.6Vは、Smart Spectrum AIによってオープンソース化されたマルチモーダル大規模言語モデルのシリーズです。このシリーズには2つのバージョンがあります：GLM-4.6V (106B-A12B)は、クラウドおよび高性能クラスタシナリオ用の基本バージョンで、Mixed Expert (MoE)アーキテクチャ、合計約1060億参照、および活性化...

最新のAIリソース

6ヶ月前

030.8K

吴恩达的LangChain for LLM应用开发免费课程

アーネスト・ンによるLLMアプリケーション開発コースのための無料LangChain

LangChainによるLLMアプリケーション開発は、DeepLearning.AIが提供するオンラインコースで、LangChainの創設者であるハリソン・チェイスとアンドリュー・ングが登場します。

最新のAIリソースコース情報

9ヶ月前

064.1K

吴恩达的Transformer LLMs工作原理免费课程

エンダ・ウーによるトランスフォーマーLLMの仕組みに関する無料コース

トランスフォーマーLLMは、DeepLearning.AIと『Hands-On Large Language Models』の著者であるJay Alammar氏とMaarten Grootend氏が提唱する原理で動作する。

最新のAIリソースコース情報

9ヶ月前

058K

Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - Dark Side of Moonの最新モデル！

Kimi K2-0905は、Dark Side of the Moon Technologies Ltd.の先進的なAIモデルであり、プログラミング支援に優れ、効率的にコードを生成し、フロントエンド開発において整然とした標準化されたコードの生成をサポートします。モデルのコンテキスト長は256Kまで拡張され、複雑なタスクにも対応します。

最新のAIリソース

9ヶ月前

081.3K

Nano Banana - 谷歌推出的AI图像编辑模型

ナノ・バナナ - GoogleのAI画像編集モデル

ナノ・バナナは、ジェミニ2.5フラッシュイメージのコードネームです。ジェミニは、Googleが提供するAI画像生成・編集モデルで、シンプルなテキストプロンプトに基づいて詳細で写実的な画像を生成し、既存の画像に高品質な修正を加えます。

最新のAIリソース

10ヶ月前

074.2K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。

最新のAIリソース

10ヶ月前

048.7K

MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMaxの音声生成モデル

MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。

最新のAIリソース

10ヶ月前

053.8K

GPT-5 - OpenAI推出的最强语言模型，统一智能系统

GPT-5 - 統合知能システムOpenAIが導入した最強の言語モデル

GPT-5はOpenAIがリリースした最新の言語モデルで、いくつかのアップグレードが施されています。リアルタイム・ルーターを内蔵した統合知能システムで、問題の複雑さに応じて効率的な思考モードと深い思考モードを自動的に切り替え、迅速な応答と正確な回答を可能にする。

最新のAIリソース

10ヶ月前

052K

Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian、Qwen-Imageのオープンソース基本モデルを発表

Qwen-Imageは、Alibaba Tongyi Qianqianチームによってリリースされたオープンソースの画像生成ベースモデルです。200億のパラメータを持ち、マルチモーダル理解、高解像度コーディング、拡散モデリングの3つのモジュールを組み込んだマルチモーダル拡散変換アーキテクチャ（MMDiT）を採用しています。

最新のAIリソース

10ヶ月前

051.6K

RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。

最新のAIリソース

10ヶ月前

048.4K

TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手

TRAE SOLO - Wordhop TRAEのAI自動開発アシスタント

TRAE SOLOは、ByteDance社が立ち上げたAIプログラミングアシスタントTRAEが、AI技術でソフトウェア開発プロセスを簡素化するために導入したAI自動開発アシスタントです。TRAE SOLOは、ユーザーのニーズを理解し、要件を入力するためのテキスト記述、音声コマンド、ファイルアップロードをサポートし、自動的に計画を立てます。

最新のAIリソース

11ヶ月前

078.1K

LiveTalking：开源实时互动数字人直播系统，实现音视频同步对话

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingは、オープンソースのリアルタイムインタラクティブデジタルヒューマンシステムであり、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーミング処理を含む多くの最先端技術と統合されています。

最新のAIリソース # AI Java オープンソースプロジェクト # AIデジタルマン

1年前

0163.8K

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B - 谷歌开源的多模态 AI 模型

Gemma 4 12B是谷歌开源的多模态AI模型，采用无编码器架构，仅需16GB显存即可在消费级设备运行。取消传统视觉和音频编码器，通过轻量级嵌入模块直接处理原始数据，实现9GB显存占用下接近26B参...

最新のAIリソース

5日前

08.9K

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work - 月之暗面 Kimi 推出的桌面端产品

Kimi Work 是月之暗面（Moonshot AI）公测的桌面端产品，为面向知识工作者的通用型本地 Agent。将 Kimi Code 在工程场景中验证过的本地 Agent 能力，迁移到普通知识工...

最新のAIリソース

5日前

08.1K

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash - 微软自研的 AI 编程模型

MAI-Code-1-Flash 是微软自研的AI编程模型，采用137B参数MoE架构，专为真实开发环境训练，直接使用GitHub Copilot的生产工具链学习多文件编辑、终端调用等实际工作流。

最新のAIリソース

5日前

06.5K

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 - 微软AI发布的首款自研高级推理模型

MAI-Thinking-1 是微软AI发布的首款自研高级推理模型。模型采用35B活跃参数、约1T总参数的稀疏混合专家（MoE）架构，拥有256K超长上下文窗口。完全基于干净且拥有商业许可的企业级数据...

最新のAIリソース

5日前

07.1K

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 - NVIDIA 开源的物理 AI 全模态模型

Cosmos 3 是 NVIDIA 开源的首个完全开放的物理 AI 全模态模型，采用创新的 Mixture-of-Transformers（MoT）架构，将视觉推理、物理世界生成与动作预测统一在单一系...

最新のAIリソース

5日前

09.2K

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini - 字节跳动开源的视频生成与编辑统一框架

Bernini是字节跳动开源的视频生成与编辑统一框架，采用"先理解，再生成"的协同架构：MLLM Planner深度解析文本指令与视觉输入，DiT Renderer将其转化为高质量连续视频。

最新のAIリソース

6日前

08.5K

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构 - 阿里达摩院推出的 AI 原生应用搭建平台

语构是阿里达摩院推出的 AI 原生应用搭建平台，平台以"Create For What You Want"为理念，让用户无需编写代码即可快速创建各类应用。语构内置 AI 能力，支持通过自然语言描述需求...

最新のAIリソース

6日前

08.3K

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus - 阿里通义千问推出的多模态智能体基座模型

Qwen3.7-Plus 是阿里巴巴通义千问团队推出的多模态智能体基座模型，在 Qwen3.7 强大文本能力基础上全面升级视觉-语言理解能力，同时完整保留编码、工具调用与生产力工作流等智能体特性。

最新のAIリソース

6日前

08.5K

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3 - 稀宇科技发布的新一代人工智能大模型

MiniMax M3是稀宇科技发布的新一代人工智能大模型，采用自研稀疏注意力机制（MSA），支持100万tokens超长上下文和原生多模态功能（图像/视频输入及桌面操作）。编程能力在SWE-Bench...

最新のAIリソース

1週間前

012.8K

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA - 阿里通义实验室发布的统一视觉-语言-动作具身基础模型

Qwen-VLA 是阿里通义实验室发布的统一视觉-语言-动作（VLA）具身基础模型。以 Qwen3.5-4B 为视觉语言主干，搭配 1.15B 参数的 DiT（Diffusion Transforme...

最新のAIリソース

1週間前

011.5K

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash - 阶跃星辰开源的 AI 模型，专为生产级 Agent 设计

Step 3.7 Flash是阶跃星辰（StepFun）开源的新一代AI模型，专为生产级智能代理（Agent）设计。在速度、成本与复杂任务处理能力间取得平衡，支持编程、搜索和多模态工作流，并针对本地部...

最新のAIリソース

1週間前

08.3K

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI - 阿里云 Model Studio 开源的命令行工具

阿里云百炼CLI（Bailian CLI）是阿里云Model Studio官方开源的命令行工具，通过一行命令即可让任意AI Agent自动调用阿里云百炼平台的150+款模型和10+款应用能力，涵盖文本...

最新のAIリソース

1週間前

08.2K

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory - 腾讯混元推出的记忆插件，为长期协作型 Agent 设计

Hy-Memory是腾讯混元推出的记忆插件，专为 Openclaw 等长期协作型 Agent 设计。通过 6层记忆框架 × System1/System2 双系统 × 演化链三层核心架构，解决 Ag...

最新のAIリソース

1週間前

08.9K

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 - Anthropic 推出的最新旗舰 AI 模型

Claude Opus 4.8 是 Anthropic 推出的最新旗舰 AI 模型，在 Opus 4.7 基础上全面升级了编码、Agentic 推理与知识工作能力，新增动态工作流（Dynamic Wo...

最新のAIリソース

2週間前

011.9K

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain - 面壁智能联合清华大学、OpenBMB开源的大模型预训练框架

ForgeTrain 是面壁智能联合清华大学、OpenBMB 开源社区发布的全球首个完全由 AI 编写、零人类代码介入的生产级大模型预训练框架。框架采用独创的 Forge Engineering（锻造...

最新のAIリソース

2週間前

010.1K

omp - 开源的终端 AI Coding Agent

omp - 开源的终端 AI Coding Agent

omp（oh-my-pi）是开源的终端 AI Coding Agent，由 can1357 基于 Mario Zechner 的 Pi 项目扩展而来。不是简单的聊天式代码助手，是将终端、代码仓库、L...

最新のAIリソース

2週間前

010.5K

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 - 自变量机器人开源的视觉-语言-动作大模型

Wall-OSS-0.5 是自变量机器人（X Square Robot）推出的开源视觉-语言-动作（VLA）大模型，拥有 40 亿参数，基于 30 亿参数的 VLM 骨干网络构建。采用"梯度桥接协同训...

最新のAIリソース

2週間前

09.3K

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck - 清华、面壁智能、OpenBMB等开源的Agent 操作系统

PilotDeck 是清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9Stars 联合研发并开源的 Agent 操作系统。以WorkSpace（工作舱）为核心架构，为每个任务提供独...

最新のAIリソース

2週間前

013.7K

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer - 群核科技开源的3D高斯浏览器

Aholo Viewer是群核科技开源的3D高斯浏览器，支持在普通设备浏览器中流畅渲染10亿级高斯点的超大3D场景。核心技术采用chunk-based LOD树架构，相比李飞飞团队的Spark 2.0...

最新のAIリソース

2週間前

010.3K

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy - 腾讯云 WeData 推出的大数据 AI 智能体工作台

DataBuddy 是腾讯云 WeData 数据开发治理平台内置的 AI 智能体工作台，基于 WorkBuddy 同源 Agent 底层能力，采用分层 Agent 协作架构（Harness AI 理念...

最新のAIリソース

2週間前

012.2K

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译 - 腾讯混元推出的 AI 翻译工具

腾讯Hy翻译是腾讯混元团队基于自研Hy-MT2大模型开发的AI翻译工具，主打全场景适配能力。支持33种语言互译及5种民汉/方言翻译，提供学术论文、法律合同等9种翻译风格预设，可通过微信小程序使用。

最新のAIリソース

2週間前

011.9K

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B - 面壁智能联合清华、OpenBMB开源的端侧文本基座模型

MiniCPM5-1B 是面壁智能联合清华大学与 OpenBMB 开源社区发布并开源的新一代端侧文本基座大模型。模型以仅 10 亿（1B）的参数规模，在国际权威榜单 AA-Index（Artifici...

最新のAIリソース

2週間前

013K

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 - 昆仑万维旗下天工AI推出的高性能Agent模型

SkyClaw-v1.0 是昆仑万维旗下天工AI推出的高性能Agent模型，同时发布轻量化版本 SkyClaw-v1.0-lite。模型专为真实智能体工作流设计，支持百万token超长上下文，深度优化...

最新のAIリソース

2週間前

013.5K

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN - 面壁智能联合清华开源的端到端大模型系列

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布并开源的中国首个完全基于国产算力平台（华为昇腾）实现端到端训练的三值（1.58-bit）大模型系列。系列包含 0.5B、1B...

最新のAIリソース

2週間前

010.5K

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed - 智谱AI发布的旗舰级高速推理API

GLM-5.1-highspeed 是智谱AI发布的旗舰级高速推理API，基于GLM-5.1打造，输出速度达到 400 tokens/s，刷新当前全球大模型厂商API的速度上限。

最新のAIリソース

2週間前

013.3K

LongCat-Video-Avatar 1.5 - 美团开源的音频驱动数字人视频生成模型

LongCat-Video-Avatar 1.5 是美团 LongCat 团队开源的音频驱动数字人视频生成模型，基于 13.6B 参数的 LongCat-Video 基础模型构建，采用 MIT 协议完...

最新のAIリソース

2週間前

013.6K

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 - 腾讯混元开源的多语言机器翻译模型家族

Hy-MT2 是腾讯混元开源的多语言机器翻译模型家族，专为复杂真实场景设计。包含 1.8B、7B 和 30B-A3B（MoE）三个尺寸，均支持 33种语言之间的互译，具备多语言翻译指令遵循能力。

最新のAIリソース

2週間前

013.1K

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro - 智象未来发布的旗舰级闭源图像大模型

HiDream-O1-Image-Pro 是智象未来（HiDream-ai）发布的旗舰级闭源图像大模型，采用新一代原生全模态架构 Unified Transformer（UiT），参数规模超过2000...

最新のAIリソース

3週間前

013.6K

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙 - 开源的 AI 翻译浏览器扩展插件

陪读蛙（Read Frog）是前字节跳动软件工程师 mengxi-ream 开源的 AI 浏览器扩展插件，定位为"沉浸式语言学习助手"，通过 AI 技术将日常网页阅读转化为语言学习过程，支持在原文旁直...

最新のAIリソース

3週間前

015.1K

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory - 腾讯云开源的 AI 智能体记忆工具

TencentDB Agent Memory是腾讯云开源的AI智能体记忆工具，专门解决长任务中Token消耗过快的问题。通过分层记忆架构（L0-L3）自动管理信息，将原始对话、关键结论、场景归纳和用户...

最新のAIリソース

3週間前

013K

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni - Google DeepMind 推出的新一代原生多模态生成模型

Gemini Omni 是 Google DeepMind 在 Google I/O 大会上推出的新一代原生多模态生成模型，首发版本为 Gemini Omni Flash。作为 Google 首个真正...

最新のAIリソース

3週間前

012.2K

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max - 阿里千问推出的新一代闭源旗舰大模型

Qwen3.7-Max是阿里云千问发布的面向智能体（Agent）时代的新一代闭源旗舰大模型，定位为"全能智能体基座"。模型在编程智能体、通用智能体、高难度推理、长周期自主执行等维度实现全面突破

最新のAIリソース

3週間前

012.8K

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate - 阿里通义千问发布的实时语音翻译大模型

Qwen3.5-LiveTranslate 是阿里巴巴通义千问团队发布的实时语音翻译大模型，基于 Qwen3.5-Omni Thinker-Talker 架构打造。模型支持 60 种语言的音频输入与文...

最新のAIリソース

3週間前

012.6K

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark - 谷歌推出的个人 AI 智能体

Gemini Spark是谷歌在2026年I/O大会上发布的个人AI智能体，是24/7全天候运行的AI代理，运行在谷歌云专属虚拟机上，无需用户设备（如电脑、手机）保持开启状态，即可持续执行任务。

最新のAIリソース

3週間前

013.4K

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 - Cursor 发布的最新一代专有 AI 编码模型

Composer 2.5 是 Cursor 发布的最新一代专有 AI 编码模型，基于月之暗面（Moonshot AI）开源的 Kimi K2.5 检查点构建，通过更大规模的强化学习与合成数据训练，在长...

最新のAIリソース

3週間前

012.7K

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis - 腾讯推出操作系统层级的个人AI助手

腾讯Marvis（中文名“马维斯”）是腾讯推出的操作系统层级的个人AI助手，帮助用户更高效地管理电脑和日常任务。可直接访问操作系统底层，支持文件管理（如搜索、整理、格式转换）、系统设置调整（如关闭广告...

最新のAIリソース

3週間前

016.5K

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash - Google I/O 大会发布的全新 AI 模型

Gemini 3.5 Flash 是 Google I/O 大会发布的全新 AI 模型，是 Gemini 3.5 家族的首个成员。打破了"Flash 系列牺牲性能换速度"的传统定位，在保持每秒约 28...

最新のAIリソース

3週間前

012.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

最新のAIリソース

3週間前

029K

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build - xAI 发布的早期测试版AI编程智能体工具

Grok Build是xAI发布的早期测试版AI编程智能体工具，主要面向专业软件开发者，是一个运行在终端（CLI）的编程智能体，帮助开发者完成编码、构建应用程序和自动化工作流程等任务，直接对标Anth...

最新のAIリソース

3週間前

015.2K

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman - 开源桌面个人 AI 助手，能主动理解用户的数字同事

OpenHuman是开源的个人AI助手项目，由Tiny Humans AI团队开发，解决传统AI助手缺乏长期记忆和上下文理解能力的问题。定位为“个人AI操作系统”或“数字分身”，目标是让AI从被动响应...

最新のAIリソース

3週間前

019.1K

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL - 小米技术开源的一步式潜空间语言视觉推理框架

Xiaomi OneVL 是小米技术团队发布并全面开源的一步式潜空间语言视觉推理框架，专为自动驾驶场景设计。框架在业内首次将VLA（视觉-语言-动作）模型、世界模型与潜空间推理三大技术路线统一到单一架...

最新のAIリソース

3週間前

012.7K

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI - 高德地图联合阿里千问推出的端云一体原生 A2UI 开源框架

AGenUI 是高德地图联合阿里千问C端应用团队发布的行业首个覆盖 iOS、Android、HarmonyOS 三端的端云一体原生 A2UI 开源框架。基于 Google 开源的 A2UI v0.9 ...

最新のAIリソース

3週間前

012.4K

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI - 开源终端 AI 编程智能体，终端原生 TUI 界面

DeepSeek-TUI 是美国独立开发者 Hunter Bown（GitHub: Hmbown）用 Rust 语言编写的开源终端 AI 编程智能体，专为 DeepSeek V4 系列模型（Pro/F...

最新のAIリソース

4週間前

021.7K

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge - 专为 AI 编程代理设计的开源后端平台

InsForge是专为AI编程代理设计的开源后端平台，由PostgreSQL和PostgREST构建，提供身份验证、存储、边缘函数等全栈服务。通过"语义层"将后端操作封装为AI可理解的标准化指令，支持...

最新のAIリソース

4週間前

016.4K

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam - Dzine 推出的端到端一体化 AI 动画创作平台

Anijam 是 Dzine 推出的 AI 驱动动画创作平台，用 AI Agent 为任何故事制作动画。并非简单的单片段视频生成工具，是一个端到端的一体化动画工作室。

最新のAIリソース

4週間前

021.5K

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 - 面壁智能联合清华开源的端侧多模态大模型

MiniCPM-V 4.6 是面壁智能（OpenBMB）联合清华大学发布并开源的端侧多模态大模型。模型总参数量仅 1.3B，是 MiniCPM-V 系列有史以来最小的模型，在多模态综合能力上超越了阿里...

最新のAIリソース

4週間前

018.3K

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠 - 零门槛 AI 应用创作平台，精准解析需求

灵珠是上海灵感菇智能科技有限公司打造的零门槛AI应用创作平台，由语生科学AI孵化平台推出。用户无需编写任何代码，只需在网页中输入创意想法，系统即可自动生成可实际运行的产品

最新のAIリソース

4週間前

018.6K

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA - 中国移动发布的一站式AI模型服务平台

MoMA（Mobile Model Access）是中国移动发布的一站式AI模型服务平台。平台接入超300款业界主流AI模型，包括自研"九天"基座大模型及DeepSeek、通义千问、豆包、Kimi...

最新のAIリソース

4週間前

019.3K

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 - OpenAI 发布的商用旗舰级实时语音模型

GPT-Realtime-2 是 OpenAI 发布商用的旗舰级实时语音模型，也是首款具备 GPT-5 级推理能力的端到端语音代理模型，上下文窗口扩展至 128K，支持图像输入、五级可调推理强度与并行...

最新のAIリソース

4週間前

016.1K

JJT - 360推出的全链路AI演示文稿创作工具

JJT - 360推出的全链路AI演示文稿创作工具

JJT（超级J的AI PPT）是360推出的全链路AI演示文稿创作工具，让用户以极简操作产出设计师级别的PPT。用户只需输入主题或粘贴数据，AI即可自动生成结构完整、视觉专业的演示文稿

最新のAIリソース

4週間前

017.4K

觅游 - 美团推出的 AI 原生共生社区

觅游 - 美团推出的 AI 原生共生社区

觅游（Meyo）是美团基础研发 AI 创新产品团队推出的 AI 原生共生社区，目前已进入公测阶段。产品以"养虾"为核心隐喻，将 AI Agent 升级为拥有身份、MBTI 人格、社交关系与成长属性的...

最新のAIリソース

4週間前

017.7K

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 - 字节跳动 Mamoda Team 推出的统一多模态生成模型

Mamoda2.5 是字节跳动 Mamoda Team 研发的全球首个 25B 级统一多模态生成模型，模型基于自回归-扩散（AR-Diffusion）框架，采用 Qwen3-VL-8B 理解模块与 D...

最新のAIリソース

4週間前

021.4K

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign - 开源桌面端 AI 设计工具，Claude Design 平替

Open CoDesign是 OpenCoworkAI 团队开发的开源桌面端 AI 设计工具，采用 MIT 协议，定位为 Claude Design 的开源替代品，同时覆盖 v0 by Vercel...

最新のAIリソース

4週間前

014.2K

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 - 深度求索发布的新一代大语言模型系列

DeepSeek-V4 是深度求索发布的新一代大语言模型系列预览版，已同步开源并开放 API。系列采用 MoE 架构，包含 V4-Pro（1.6T 参数 / 49B 激活）与 V4-Flash（284...

最新のAIリソース

4週間前

013.5K

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T - 蚂蚁百灵团队发布的万亿级旗舰思考模型

Ring-2.6-1T是蚂蚁集团百灵团队发布的万亿级旗舰思考模型，总参数1万亿，采用稀疏MoE架构，推理时仅激活约630亿参数，兼顾规模与效率。核心创新支持High与XHigh两档可调节推理强度

最新のAIリソース

4週間前

017.7K

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3 - xAI公司推出的最新一代大语言模型

Grok 4.3是xAI公司推出的最新一代大语言模型，属于Grok系列的重要更新版本，支持100万token的上下文窗口，可一次性处理整本书、大型代码库或长文档，思维链推理强制开启，模型在给出答案前会...

最新のAIリソース

4週間前

013.1K

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型 5.1 - 百度发布的新一代基础大模型

文心大模型5.1（ERNIE 5.1）是百度发布的新一代基础大模型，采用创新的"多维弹性预训练"（Once-for-All）技术，实现"一次训练，生成多种规模模型"。通过弹性深度、弹性宽度与弹性稀疏度...

最新のAIリソース

4週間前

014.1K

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime - 阶跃星辰发布的新一代实时语音大模型

StepAudio 2.5 Realtime 是阶跃星辰发布的新一代实时语音大模型，目前已全量上线开放平台。模型主打"活人感"对话体验，通过副语言感知、千万级人设自定义与双商进阶的对话能力，实现从文本...

最新のAIリソース

4週間前

013.3K

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1 - Luma AI推出的图像生成模型

Uni-1.1是Luma AI推出的图像生成模型，将文本理解与图像生成整合进同一个 decoder-only、autoregressive 模型中，非像主流方案那样把语言模型和图像模型拼接使用。

最新のAIリソース

4週間前

013.8K

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙 - 学而思推出的原生学生端精准学智能体

小精龙是学而思基于OpenClaw架构打造的原生学生端精准学智能体，以"大脑映射、私有财产、学习伴侣"为核心定位。首次将长期记忆、动态学情诊断、教育专属Skill链与情感陪伴系统整合为统一的学生专属A...

最新のAIリソース

2ヶ月前

014.9K

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite - Google DeepMind发布的低成本AI视频生成模型

Veo 3.1 Lite是Google DeepMind发布的低成本AI视频生成模型，定位为Veo系列中最实惠的版本，专为大规模视频生成场景设计。模型支持文本和图像生成视频，输出720p和1080p分...

最新のAIリソース

2ヶ月前

011.4K

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo - 智谱发布首个原生多模态Coding基座模型

GLM-5V-Turbo是智谱发布首个原生多模态Coding基座模型，专为视觉编程打造。模型从预训练阶段深度融合视觉与文本能力，能直接理解设计稿、网页截图、K线图表等视觉信息并生成可运行代码，实现"所...

最新のAIリソース

2ヶ月前

012.6K

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image - 阿里通义实验室推出的图像生成与编辑统一模型

Wan2.7-Image 是阿里巴巴通义实验室发布的图像生成与编辑统一模型，定位为"全场景视觉创作旗舰"。模型直击AI生图领域"标准脸"审美疲劳和"色彩盲盒"痛点，采用生成与理解统一的底层架构，具备文...

最新のAIリソース

2ヶ月前

013.9K

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda - 专为 AI 时代设计的开源无头浏览器

Lightpanda是Lightpanda.io公司开发的开源无头浏览器，专为AI自动化和Web抓取设计。采用Zig语言从零构建，去除了图形渲染等冗余功能，核心优势是速度比Chrome快11倍，内存占...

最新のAIリソース

2ヶ月前

011.7K

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0 - 昆仑万维发布的实时交互式世界模型

Matrix-Game 3.0是昆仑万维发布的实时交互式世界模型，属于AIGC全家桶中的三大核心模型之一。模型通过物理仿真驱动，解决了传统世界模型易失忆、环境不稳定的问题，支持720p、40fps实时...

最新のAIリソース

2ヶ月前

015K

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9 - 昆仑万维旗下天工 AI 推出的 AI 音乐模型

Mureka V9是昆仑万维旗下天工AI在中关村论坛上发布的AI音乐模型，是Mureka系列的最新迭代版本，通过技术创新重塑数字音乐创作生态。基于Musicot（Music Chain-of-Thou...

最新のAIリソース

2ヶ月前

015.2K

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next - 美团龙猫开源的原生多模态大模型

LongCat-Next 是美团龙猫开源的原生多模态大模型，采用"下一个Token预测"（NTP）统一架构，将图像、语音与文本映射为同源离散Token，打破传统"语言为中心"的拼凑式设计。核心创新包括...

最新のAIリソース

2ヶ月前

016.5K

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6 - 爱诗科技推出的最新一代AI视频生成模型

PixVerse V6是爱诗科技推出的最新一代AI视频生成模型。在保持秒级生成速度的同时，重点优化了人物真实感、复杂运动表现、物理模拟及声画协同能力，支持最长15秒1080P视频生成。

最新のAIリソース

2ヶ月前

017.1K

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni - 阿里通义推出的新一代全模态大模型

Qwen3.5-Omni是阿里通义推出的新一代全模态大模型，支持文本、图片、音频、音视频的原生理解与生成。采用Hybrid-Attention MoE架构，支持256K超长上下文，可处理10小时音频或...

最新のAIリソース

2ヶ月前

015.9K

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw - 中国移动推出的桌面级 AI 办公 Agent

移动云 MobileClaw 是中国移动推出的桌面级AI办公智能体，央企首个深度兼容OpenClaw生态的"自研小龙虾"，主打"本地优先、隐私至上"。采用一键安装开箱即用设计，适配Windows/ma...

最新のAIリソース

2ヶ月前

017.4K

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor- 开源 AI 3D 建筑设计与可视化工具，网页端直接使用

Pascal Editor 是基于浏览器的3D建筑设计与可视化工具，专为建筑师、设计师和开发者打造，支持在网页端直接进行楼层规划、空间布局和建筑场景探索。采用现代Web技术栈（React Three ...

最新のAIリソース

2ヶ月前

013.7K

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw - 面向科研人员的云端 AI Agent 协同系统

SciClaw（科研龙虾）是面向科研人员的云端 AI 协同系统，定位为"科研人的深夜搭子"。能深度分析文献、自主执行实验、自动排版生成论文/PPT/海报，记住用户电脑里的所有研究资料，将灵感、执行与...

最新のAIリソース

2ヶ月前

013.1K

Voxtral TTS - Mistral AI推出的开源文本转语音模型

Voxtral TTS - Mistral AI推出的开源文本转语音模型

Voxtral TTSoxtral TTS是法国AI公司Mistral AI发布的开源文本转语音模型，采用40亿参数轻量化架构，量化后仅需3GB内存即可在智能手机等边缘设备实时运行。模型原生支持英语...

最新のAIリソース

2ヶ月前

011K

商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手

商汤输入法AudioClaw - 商汤科技推出的AI语音智能助手

商汤输入法AudioClaw是商汤科技基于日日新多模态大模型打造的AI语音智能应用，深度接入OpenClaw底层能力，定位为"会听话的龙虾"智能助手。

最新のAIリソース

2ヶ月前

014.6K

SenseAudio - 商汤科技推出的一站式 AI 语音开放平台

SenseAudio - 商汤科技推出的一站式 AI 语音开放平台

SenseAudio 是商汤科技推出的AI语音开放平台，面向开发者与企业提供一站式语音AI解决方案。平台集成语音识别（ASR）、语音合成（TTS）、音色克隆等核心能力，语音识别覆盖20+语言并支持说话...

最新のAIリソース

2ヶ月前

014.4K

TurboQuant - Google Research 推出的突破性内存压缩算法

TurboQuant - Google Research 推出的突破性内存压缩算法

TurboQuant 是 Google Research 推出的突破性内存压缩算法，专为解决大语言模型推理中的 KV 缓存瓶颈而设计。

最新のAIリソース

2ヶ月前

014.2K

Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型

Gemini 3.1 Flash Live - Google 推出的旗舰级实时语音模型

Gemini 3.1 Flash Live 是 Google 推出的旗舰级实时语音模型，被誉为"迄今最高质量的音频和语音模型"。主打超低延迟的自然对话体验，支持 90+ 种语言的原生多模态交互，能精准...

最新のAIリソース

2ヶ月前

016K

Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型

Lyria 3 Pro - 谷歌推出的最先进AI音乐生成模型

Lyria 3 Pro是谷歌推出的最先进的AI音乐生成模型。相比前代Lyria 3仅30秒的生成时长，Pro版本可一次性生成长达3分钟的完整音轨，精准控制前奏、主歌、副歌、桥段等歌曲结构。

最新のAIリソース

2ヶ月前

014.4K

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI - 开源 AI 命令行工具框架，任何网站变成命令行

OpenCLI是开源的命令行工具框架，将网站、Electron应用和本地命令行工具统一转化为可通过命令行操作的接口，将网站（如B站、知乎、Twitter等）和Electron应用（如Cursor、No...

最新のAIリソース

2ヶ月前

022.6K

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw - 涂鸦智能推出的数字与物理世界联动 AI Agent

TuyaClaw 是涂鸦智能（Tuya Smart）推出的 AI 助理，基于 OpenClaw 架构搭建，是全球首个同时打通数字世界与物理世界的 AI Agent。与市面上仅能在屏幕内执行任务的"龙虾...

最新のAIリソース

2ヶ月前

017.6K

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo - 开源 AI 语音输入工具，专为 macOS 设计

TypeNo 是 marswaveai 团队开源的中文语音输入工具，专为 macOS 打造。用户只需轻点 Control 键即可录音，松手后语音会在本地实时转为文字并自动填入当前应用。

最新のAIリソース

2ヶ月前

016.4K

HiDreamClaw - 智象未来推出的多模态原生AI智能体应用

HiDreamClaw - 智象未来推出的多模态原生AI智能体应用

HiDreamClaw 是智象未来（HiDream.ai）推出的多模态原生AI智能体应用，定位为图片与视频生成垂直领域的创作助手。目前已接入其海外平台vivago，面向创作者提供7×24小时在线服务。

最新のAIリソース

3ヶ月前

017.8K

PrismAudio - 阿里通义实验室开源的视频生成音频框架

PrismAudio - 阿里通义实验室开源的视频生成音频框架

PrismAudio 是阿里通义实验室推出的视频生成音频框架，专注于为视频自动匹配严丝合缝的环境音效。框架创新性地引入"分解式思维链"（CoT）机制，让模型在生成音频前先分析视频内容、声音时序、音质特...

最新のAIリソース

3ヶ月前

016.6K

MAI-Image-2 - 微软推出的第二代自研图像生成模型

MAI-Image-2 - 微软推出的第二代自研图像生成模型

MAI-Image-2 是微软推出的第二代自研图像生成模型，模型在权威评测平台 LMArena 中跃升至全球第三位，仅次于谷歌和 OpenAI，标志着微软在图像生成领域实现从"追赶者"到"第一梯队"的...

最新のAIリソース

3ヶ月前

018.2K

NineClaw - 好未来推出的教师专属 AI 原生桌面超级智能体

NineClaw - 好未来推出的教师专属 AI 原生桌面超级智能体

NineClaw（九章龙虾）是好未来（TAL）推出的行业首款教师专属AI原生桌面超级智能体，昵称"九龙"。深度融合好未来20年教研积累与海量题库资源，采用本地化运行架构，支持Windows和MacO...

最新のAIリソース

3ヶ月前

020.7K

EdgeClaw - 面壁智能联合清华等开源的端云协同 AI 智能体框架

EdgeClaw - 面壁智能联合清华等开源的端云协同 AI 智能体框架

EdgeClaw 是面壁智能联合清华大学等机构开源的端云协同 AI 智能体框架，主打安全可控与本地部署。首创三层数据安全协议（S1/S2/S3），通过规则检测器与本地 LLM 语义检测器实时分类请求敏...

最新のAIリソース

3ヶ月前

019K

Qwen3.5-Max-Preview - 阿里通义千问推出的旗舰大模型预览版

Qwen3.5-Max-Preview - 阿里通义千问推出的旗舰大模型预览版

Qwen3.5-Max-Preview 是阿里通义千问团队推出的旗舰大模型预览版，在 LM Arena 国际大模型竞技场以1464分跻身全球前五、国内第一，标志着国产大模型首次进入全球第一梯队。

最新のAIリソース

3ヶ月前

017.6K

もっと読む