AI分享圈

AI正在改变世界！

文章487 网址273 书籍0 软件0 评论0

已发布487

InstanceAssemble - 小红书联合复旦大学开源的布局控制生成技术

InstanceAssemble是小红书和复旦大学联合开源的布局控制生成技术，通过“实例组装注意力”机制，实现了从简单到复杂、从稀疏到密集布局的精准图像生成。采用两阶段级联架构，先生成图像背景，再逐个...

最新AI资源

7个月前

033.5K

Zen Browser - 基于Firefox内核的开源AI网页浏览器

Zen Browser是基于Firefox内核的开源浏览器，主打简洁高效的浏览体验，核心特色是垂直标签栏和工作区隔离功能。采用侧边栏设计，能清晰展示50+个标签页的完整标题，支持多窗口分屏浏览。

最新AI资源

7个月前

050K

QwenLong-L1.5 - 阿里通义实验室开源的长文本推理模型

QwenLong-L1.5是阿里巴巴通义实验室开源的长文本推理模型，专注于解决超长上下文（如1M-4M tokens）的复杂推理问题。核心突破在于后训练阶段的三大创新：通过知识图谱、SQL解析和多智能...

最新AI资源

7个月前

038.9K

Infographic - 阿里AntV团队开源的信息图生成框架

Infographic是阿里AntV团队开源的新一代框架，基于G2和Ant Design开发，专注于快速生成高质量信息图，提供30+布局模板、120+预设主题及AI智能生成功能。

最新AI资源

7个月前

045.1K

opcode - 专为Claude Code设计的开源图形化桌面应用

opcode是专为Claude Code设计的开源图形化桌面应用，开发者winfunc基于Tauri 2 + React 18 + Rust开发。提供可视化界面管理Claude Code项目，支持创建...

最新AI资源

7个月前

043.6K

TurboDiffusion - 生数科技联合清华等开源的视频生成加速框架

TurboDiffusion是清华大学、生数科技和加州大学伯克利分校联合开源的视频生成加速框架，能在保持画质几乎无损的情况下，将视频生成速度提升100-200倍。通过稀疏线性注意力、采样步数蒸馏和8位...

最新AI资源

7个月前

048.6K

MedASR - 谷歌开源的医疗语音识别模型

MedASR是谷歌开源的1.05亿参数医疗语音识别模型，在5000小时脱敏临床语料上微调，针对药品、剂量、解剖术语优化，内置6-gram医学语言模型，在私有放射科数据集RAD-DICT上词错率仅4.6...

最新AI资源

7个月前

050.2K

Fun-Audio-Chat-8B - 阿里通义开源的端到端语音交互大模型

Fun-Audio-Chat-8B是阿里通义团队开源的80亿参数端到端语音大模型，直接语音进语音出，无需ASR+LLM+TTS拼接，中文英文双语流利，延迟低、音色自然。采用双分辨率共享LLM与25Hz...

最新AI资源

7个月前

045.8K

PromptFill - 开源的结构化提示词生成AI工具，专为AI绘画设计

PromptFill是专为AI绘画设计的结构化提示词生成工具，通过可视化的“填空”交互方式，帮助用户快速构建、管理和迭代复杂的Prompt，提升AI图像生成的效率与质量。PromptFill的核心功能...

最新AI资源

7个月前

047.9K

GLM-4.7 - 智谱AI开源的最新一代旗舰大模型

GLM-4.7是智谱AI发布并开源的最新一代旗舰大模型，主要针对AI编程、复杂推理和智能体任务进行了深度优化。模型支持200k上下文长度和128k最大输出，具备多语言编码、长程任务规划和工具协同能力...

最新AI资源

7个月前

065.7K

加载更多