# AI分享圈 > 最好最全的AI免费资源分享网站 --- ## 页面 - [友情链接](https://aisharenet.com/links/): - [投稿](https://aisharenet.com/contribute/): - [排行榜](https://aisharenet.com/rankings/): - [我要投稿](https://aisharenet.com/woyaotougao/): - [找回密码](https://aisharenet.com/zhaohuimima/): - [会员中心](https://aisharenet.com/huiyuanzhongxin/): - [Privacy Policy](https://aisharenet.com/privacy-policy/): 1. Introduction We r... - [精选AI工具列表](https://aisharenet.com/tuijiangongju/): - [工具分类](https://aisharenet.com/tooltag/): --- ## 文章 - [MiniMax Speech 2.5 - MiniMax推出的语音生成模型](https://aisharenet.com/minimax-speech-25/): MiniMax Speech 2. 5是... - [GPT-5 - OpenAI推出的最强语言模型,统一智能系统](https://aisharenet.com/gpt-5/): GPT-5是什么 GPT-5是OpenA... - [dots.vlm1 - 小红书hi lab开源的多模态大模型](https://aisharenet.com/dotsvlm1/): dots. vlm1是什么 dots. ... - [Genie 3 - 谷歌推出的通用世界模型](https://aisharenet.com/genie-3/): Genie 3是什么 Genie 3 是... - [Claude Opus 4.1 - Anthropic推出的最强编程模型](https://aisharenet.com/claude-opus-4-1/): Claude Opus 4. 1是什么 ... - [gpt-oss - OpenAI推出的开源推理模型系列](https://aisharenet.com/gpt-oss/): gpt-oss是什么 gpt-oss是 ... - [MiDashengLM - 小米开源的声音理解模型](https://aisharenet.com/midashenglm/): MiDashengLM是什么 MiDas... - [MOSS-TTSD - 清华实验室开源的双语对话语音生成模型](https://aisharenet.com/moss-ttsd/): MOSS-TTSD是什么 MOSS-TT... - [AudioGen-Omni - 快手推出的多模态音频生成模型](https://aisharenet.com/audiogen-omni/): AudioGen-Omni是什么 Aud... - [LangExtract - 谷歌开源的Python库,提取结构化信息](https://aisharenet.com/langextract/): LangExtract是什么 LangE... - [Qwen-Image - 通义千问推出开源的文生图基础模型](https://aisharenet.com/qwen-image/): Qwen-Image是什么 Qwen-I... - [RedOne - 小红书最新推出的社交大模型](https://aisharenet.com/redone/): RedOne是什么 RedOne 是小红... - [FastDeploy - 百度推出的高性能大模型推理与部署工具](https://aisharenet.com/fastdeploy/): FastDeploy是什么 FastDe... - [InteriorGS - 群核科技推出的3D高斯语义数据集](https://aisharenet.com/interiorgs/): InteriorGS是什么 Interi... - [DragonV2.1 - 微软推出的零样本语音合成模型](https://aisharenet.com/dragonv21/): DragonV2. 1是什么 Drago... - [ScreenCoder – 开源的UI截图生成前端代码工具](https://aisharenet.com/screencoder/): ScreenCoder是什么 Scree... - [Gemini 2.5 Deep Think - 谷歌推出的AI推理模型](https://aisharenet.com/gemini-25-deep-think/): Gemini 2. 5 Deep Thi... - [MindLink - 昆仑万维推出的开源推理大模型](https://aisharenet.com/mindlink/): MindLink是什么 MindLink... - [Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型](https://aisharenet.com/kimi-k2-turbo-preview/): Kimi K2 高速版是什么 Kimi ... - [dots.ocr - 小红书hi lab推出的开源多语言文档解析模型](https://aisharenet.com/dots-ocr/): dots. ocr是什么 dots. o... - [HYPIR - 中国科学院团队推出的新型图像复原大模型](https://aisharenet.com/hypir/): HYPIR是什么 HYPIR 是中国科学... - [FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型](https://aisharenet.com/flux1-krea-dev/): FLUX. 1 Krea 是什么 FLU... - [Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型](https://aisharenet.com/qwen3-coder-flash/): Qwen3-Coder-Flash是什么... - [Wide Research - Manus平台推出的多智能体协同功能](https://aisharenet.com/wide-research/): Wide Research是什么 Wid... - [Seed Diffusion - 字节跳动最新推出的扩散语言模型](https://aisharenet.com/seed-diffusion/): Seed Diffusion是什么 Se... - [小星绪 - 京东健康推出的AI情绪漫画生成产品](https://aisharenet.com/xiaoxingxu/): 小星绪是什么 小星绪是京东健康推出的AI... - [1688 AI版 - 阿里旗下1688平台推出的AI生意助手](https://aisharenet.com/1688aiapp/): 1688 AI版是什么 1688 AI版... - [阶跃深研 - 阶跃星辰推出的AI深入研究工具](https://aisharenet.com/jieyue-deepsearch/): 阶跃深研是什么 阶跃深研是阶跃星辰推出的... - [Runway Aleph - Runway推出的全新AI视频编辑模型](https://aisharenet.com/runway-aleph/): Runway Aleph是什么 Runw... - [WebShaper - 阿里通义开源的AI训练数据合成系统](https://aisharenet.com/webshaper/): WebShaper是什么 WebShap... - [Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型](https://aisharenet.com/skywork-unipic/): Skywork UniPic是什么 Sk... - [ChatGPT Study - OpenAI推出的创新学习模式](https://aisharenet.com/chatgpt-study/): ChatGPT Study是什么 Cha... - [通义万相Wan2.2 - 阿里推出的开源AI视频生成模型](https://aisharenet.com/wan22/): 通义万相Wan2. 2是什么 通义万相W... - [GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型](https://aisharenet.com/glm-45/): GLM-4. 5是什么 GLM-4. 5... - [Coze Studio - 字节跳动推出的开源AI Agent开发平台](https://aisharenet.com/coze-studio/): Coze Studio是什么 Coze ... - [Coze Loop – 字节Coze开源的AI Agent开发与调试平台](https://aisharenet.com/coze-loop/): Coze Loop是什么 Coze Lo... - [悟能 - 商汤科技最新推出的具身智能平台](https://aisharenet.com/wuneng/): 悟能是什么 悟能是商汤科技推出的具身智能... - [Intern-S1 - 上海AI Lab开源的科学多模态大模型](https://aisharenet.com/intern-s1/): Intern-S1是什么 Intern-... - [混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型](https://aisharenet.com/hunyuanworld-10/): 混元3D世界模型 1. 0是什么 混元3... - [日日新 V6.5 - 商汤科技推出的最新多模态推理大模型](https://aisharenet.com/sensenova-v65/): 日日新 V6. 5是什么 日日新 V6.... - [Opal - 谷歌推出的AI工作流创建平台](https://aisharenet.com/opal/): Opal是什么 Opal 是谷歌实验室推... - [Qwen-MT - 阿里通义推出的机器翻译模型](https://aisharenet.com/qwen-mt/): Qwen-MT是什么 Qwen-MT 是... - [Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型](https://aisharenet.com/agentar-fin-r1/): Agentar-Fin-R1是什么 Ag... - [MonkeyCode - 开源的企业级AI编程助手](https://aisharenet.com/monkeycode/): MonkeyCode是什么 Monkey... - [Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型](https://aisharenet.com/seed-liveinterpret-20/): Seed LiveInterpret 2... - [Excel MCP Server - 基于MCP的AI Excel处理工具](https://aisharenet.com/excel-mcp-server/): Excel MCP Server是什么 ... - [ChatFlow - 开源AI工作流自动化工具](https://aisharenet.com/chatflow/): ChatFlow是什么 ChatFlow... - [Mureka V7 - 昆仑万维推出的AI音乐生成模型](https://aisharenet.com/mureka-v7/): Mureka V7是什么 Mureka ... - [Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型](https://aisharenet.com/seed-gr-3/): Seed GR-3是什么 Seed GR... - [Qwen3-Coder - 阿里通义千问开源的的代码生成模型](https://aisharenet.com/qwen3-coder/): Qwen3-Coder是什么 Qwen3... - [OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型](https://aisharenet.com/openreasoning-nemotron/): OpenReasoning-Nemotr... - [Seed-X - 字节跳动推出的开源多语言翻译模型](https://aisharenet.com/seed-x/): Seed-X是什么 Seed-X 是字节... - [JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统](https://aisharenet.com/joyagent-jdgenie/): JoyAgent-JDGenie是什么 ... - [TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手](https://aisharenet.com/trae-solo/): TRAE SOLO是什么 TRAE SO... - [雾象Fogsight - AI动画生成Agent,输入主题生成完整动画](https://aisharenet.com/fogsight/): 雾象Fogsight是什么 雾象Fogs... - [Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型](https://aisharenet.com/goedel-prover-v2/): Goedel-Prover-V2是什么 ... - [BytePlus - 字节跳动推出的企业级智能云服务平台](https://aisharenet.com/byteplus/): BytePlus是什么 BytePlus... - [飞书妙搭 - 飞书推出的AI原生系统搭建平台](https://aisharenet.com/feida/): 飞书妙搭是什么 飞书妙搭是飞书推出的企业... - [MirageLSD - Decart AI推出首个实时AI视频生成模型](https://aisharenet.com/miragelsd/): MirageLSD是什么 MirageL... - [Kimi Playground - 月之暗面推出的一站式AI工具调用体验平台](https://aisharenet.com/kimi-playground/): Kimi Playground是什么 K... - [ChatGPT Agent – OpenAI推出的通用智能AI Agent](https://aisharenet.com/chatgpt-agent/): ChatGPT Agent是什么 Cha... - [GLM-Experimental - 智谱AI推出的实验性模型](https://aisharenet.com/glm-experimental/): GLM-Experimental是什么 ... - [PromptForge - AI 提示词生成与优化工作台](https://aisharenet.com/promptforge/): PromptForge是什么 Promp... - [VikingDB - 火山引擎推出的高性能云原生向量数据库](https://aisharenet.com/vikingdb/): VikingDB是什么 VikingDB... - [RoboBrain 2.0 - 智谱开源的通用具身大脑模型](https://aisharenet.com/robobrain-20/): RoboBrain 2. 0是什么 Ro... - [RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架](https://aisharenet.com/roboos-20/): RoboOS 2. 0是什么 RoboO... - [EXAONE 4.0 - LG推出的混合推理模型](https://aisharenet.com/exaone-40/): EXAONE 4. 0是什么 EXAON... - [Tizzy.ai - 百度推出的AI搜索应用](https://aisharenet.com/tizzyai/): Tizzy. ai是什么 Tizzy. ... - [Voxtral - Mistral AI推出的开源语音模型](https://aisharenet.com/voxtral/): Voxtral是什么 Voxtral 是... - [k2 – 月之暗面Kimi最新推出的MoE架构基础模型](https://aisharenet.com/k2/): k2是什么 k2是Moonshot AI... - [Grok 4 – 马斯克旗下xAI推出的最新大模型](https://aisharenet.com/grok-4/): Grok 4是什么 Grok 4 是 x... - [GenFlow超能搭子 – 百度文库推出的通用AI Agent](https://aisharenet.com/genflow/): GenFlow超能搭子是什么 GenFl... - [TRAE Agent - 字节跳动开源的软件工程任务助手](https://aisharenet.com/trae-agent/): TRAE Agent是什么 TRAE A... - [Higress MCP - 今日投资推出的MCP服务平台](https://aisharenet.com/higress-mcp/): Higress MCP是什么 Higre... - [CodeBuddy IDE - 腾讯推出的AI全栈开发助手](https://aisharenet.com/codebuddy-ide/): CodeBuddy IDE是什么 Cod... - [宠TA - 京东推出的AI宠物互动产品](https://aisharenet.com/chongta/): 宠TA是什么 宠TA是京东推出的AIGC... - [聊愈小宇宙 - 京东健康推出的AI心理陪伴产品](https://aisharenet.com/chat-healing/): 聊愈小宇宙是什么 聊愈小宇宙是京东健康推... - [Shortcut - AI Excel Agent,一键完成复杂Excel任务](https://aisharenet.com/shortcut/): Shortcut是什么 Shortcut... - [星流Agent - Liblib推出的AI一站式设计Agent](https://aisharenet.com/xingliu-art-agent/): 星流Agent是什么 星流Agent是L... - [Step-Audio-AQAA – StepFun推出的端到端大音频语言模型](https://aisharenet.com/step-audio-aqaa/): Step-Audio-AQAA是什么 S... - [MuseSteamer - 百度推出的视频生成大模型](https://aisharenet.com/musesteamer/): MuseSteamer是什么 MuseS... - [绘想 - 百度推出的AI视频生成平台](https://aisharenet.com/huixiang/): 绘想是什么 绘想是百度推出的 AI 视频... - [羚珑 - 京东推出的AI商品图设计工具](https://aisharenet.com/linglong-jd/): 羚珑是什么 羚珑是京东推出的智能设计工具... - [腾讯广告妙思 - 腾讯广告推出的一站式AI广告创意平台](https://aisharenet.com/admuse/): 腾讯广告妙思是什么 腾讯广告妙思是腾讯广... - [图可丽 - AI图像处理工具,一键图像和视频抠图神器](https://aisharenet.com/tukeli/): 图可丽是什么 图可丽是AI图像处理工具,... - [圆周旅迹 – AI旅行规划应用,自动生成个性化行程](https://aisharenet.com/pitravel/): 圆周旅迹是什么 圆周旅迹是AI旅行规划应... - [ML-Master – 上海交大推出的AI专家Agent](https://aisharenet.com/ml-master/): ML-Master是什么 ML-Mast... - [Paperpal - AI学术写作工具,全面覆盖写作全流程](https://aisharenet.com/paperpal/): Paperpal是什么 Paperpal... - [GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列](https://aisharenet.com/glm-41v-thinking/): GLM-4. 1V-Thinking是什... - [ThinkSound - 阿里通义推出的音频生成模型](https://aisharenet.com/thinksound/): ThinkSound是什么 ThinkS... - [Mapify - XMind推出的AI思维导图生成工具](https://aisharenet.com/mapify/): Mapify是什么 Mapify 是 X... - [CodeArts Doer - 华为云推出的AI智能开发助手](https://aisharenet.com/codearts-doer/): CodeArts Doer是什么 Cod... - [Qwen-TTS - 阿里通义千问推出的语音合成模型](https://aisharenet.com/qwen-tts/): Qwen-TTS是什么 Qwen-TTS... - [MultiAgentPPT - 开源的AI演示文稿生成系统](https://aisharenet.com/multiagentppt/): MultiAgentPPT是什么 Mul... - [Ovis-U1 - 阿里推出的多模态统一AI模型](https://aisharenet.com/ovis-u1/): Ovis-U1是什么 Ovis-U1是阿... - [袋鼠参谋 – 美团推出的商家AI智能决策应用](https://aisharenet.com/kangaroo-advisor/): 袋鼠参谋是什么 袋鼠参谋是美团推出的面向... - [AI抖音 - 抖音推出的智能深度思考与搜索应用](https://aisharenet.com/aidouyin/): AI抖音是什么 AI抖音是抖音推出的智能... - [Qwen VLo – 通义千问推出的多模态统一理解与生成模型](https://aisharenet.com/qwen-vlo/): Qwen VLo是什么 Qwen VLo... - [AiBiao – AI图表处理工具,对话式进行数据查询、清洗、分析](https://aisharenet.com/aibiao/): AiBiao是什么 AiBiao 是AI... - [Doppl - 谷歌推出的AI虚拟试衣应用](https://aisharenet.com/doppl/): Doppl是什么 Doppl是谷歌推出的... --- # # Detailed Content ## 页面 ### 友情链接 - Published: 2025-05-29 - Modified: 2025-05-29 - URL: https://aisharenet.com/links/ --- ### 投稿 - Published: 2025-05-29 - Modified: 2025-05-29 - URL: https://aisharenet.com/contribute/ --- ### 排行榜 - Published: 2025-05-26 - Modified: 2025-05-26 - URL: https://aisharenet.com/rankings/ --- ### 我要投稿 - Published: 2025-02-03 - Modified: 2025-02-03 - URL: https://aisharenet.com/woyaotougao/ --- ### 找回密码 - Published: 2025-02-03 - Modified: 2025-02-03 - URL: https://aisharenet.com/zhaohuimima/ --- ### 会员中心 - Published: 2025-02-03 - Modified: 2025-02-03 - URL: https://aisharenet.com/huiyuanzhongxin/ --- ### Privacy Policy - Published: 2025-01-30 - Modified: 2025-01-31 - URL: https://aisharenet.com/privacy-policy/ 1. Introduction We respect your privacy and are committed to complying with applicable privacy laws, including the General Data Protection Regulation (GDPR). This policy explains how we collect, use, and protect your data when you visit our website. ... --- ### 精选AI工具列表 - Published: 2024-09-24 - Modified: 2025-05-26 - URL: https://aisharenet.com/tuijiangongju/ --- ### 工具分类 - Published: 2024-09-24 - Modified: 2025-05-26 - URL: https://aisharenet.com/tooltag/ --- --- ## 文章 ### MiniMax Speech 2.5 - MiniMax推出的语音生成模型 - Published: 2025-08-08 - Modified: 2025-08-08 - URL: https://aisharenet.com/minimax-speech-25/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MiniMax Speech 2. 5是什么 MiniMax Speech 2. 5 是 MiniMax 团队开发的先进语音生成模型。在语音合成领域取得了显著进步,尤其在多语种表现力、音色复刻精度和语种覆盖范围上实现了飞跃。模型支持 40 种语言,能精准复刻不同语言、口音和特殊年龄的声音,彻底摆脱了传统语音合成的“机械感”,提供自然流畅的语音体验。MiniMax Speech 2. 5 已全球上线,用户可通过 MiniMax 开放平台或官网体验。 MiniMax Speech 2. 5的功能特色... --- ### GPT-5 - OpenAI推出的最强语言模型,统一智能系统 - Published: 2025-08-08 - Modified: 2025-08-08 - URL: https://aisharenet.com/gpt-5/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 GPT-5是什么 GPT-5是OpenAI最新发布的语言模型,具有多项升级。是一个统一智能系统,内置实时路由器,能根据问题复杂度自动切换高效模式与深度思考模式,实现快速响应与精准解答。GPT-5拥有多个版本,包括面向普通用户的GPT-5、适合轻量级任务的GPT-5 mini和nano,以及专为企业和高级用户提供的GPT-5 Pro模式,后者在超高难度科学问题上表现出色。 在性能方面,GPT-5的幻觉率大幅降低,事实错误率比前代GPT-4o降低了45%,深度思考模式下比o3降低了80%。编程能力显... --- ### dots.vlm1 - 小红书hi lab开源的多模态大模型 - Published: 2025-08-06 - Modified: 2025-08-06 - URL: https://aisharenet.com/dotsvlm1/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 dots. vlm1是什么 dots. vlm1 是小红书 hi lab 开源的首个多模态大模型。基于从零训练的 12 亿参数视觉编码器 NaViT 和 DeepSeek V3 大语言模型(LLM),具备强大的视觉感知和文本推理能力。模型在视觉理解和推理任务上表现出色,接近闭源 SOTA 模型水平,在文本任务上也保持了竞争力。dots. vlm1 的视觉编码器 NaViT 完全从零开始训练,原生支持动态分辨率,在文本监督基础上增加了纯视觉监督,提升了感知能力。训练数据引入了多种合成数据思路,覆盖... --- ### Genie 3 - 谷歌推出的通用世界模型 - Published: 2025-08-06 - Modified: 2025-08-06 - URL: https://aisharenet.com/genie-3/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Genie 3是什么 Genie 3 是谷歌 DeepMind 推出的新一代通用世界模型,支持实时生成高度动态且连贯的虚拟世界。Genie 3 能模拟物理现象、自然生态系统,还支持创建奇幻场景和历史场景。用文本提示,用户能改变世界的状态,比如调整天气或添加新物体。Genie 3 的视觉一致性可维持数分钟,视觉记忆能追溯到一分钟前,为 AI 智能体提供理想的训练环境。Genie 3用自回归生成技术,逐帧生成画面,确保环境的动态性和丰富性。Genie 3在教育、娱乐、AI 研究等领域展现出巨大的应用... --- ### Claude Opus 4.1 - Anthropic推出的最强编程模型 - Published: 2025-08-06 - Modified: 2025-08-06 - URL: https://aisharenet.com/claude-opus-4-1/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Claude Opus 4. 1是什么 Claude Opus 4. 1 是 Anthropic 公司推出的先进大型语言模型,专为高效处理复杂任务而设计。模型在编程领域表现出色,能生成高质量代码,支持长达 32k 的单次输出,适应多种编程风格。模型具备强大的自主决策能力,能协调复杂的企业工作流程,管理多渠道营销活动。在内容创作方面,支持生成自然流畅的文本,尤其擅长创意写作。Claude Opus 4. 1 的推理能力非常出色,支持即时响应和逐步推理,用户根据需求灵活选择。模型安全性极高,无害响应... --- ### gpt-oss - OpenAI推出的开源推理模型系列 - Published: 2025-08-06 - Modified: 2025-08-06 - URL: https://aisharenet.com/gpt-oss/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 gpt-oss是什么 gpt-oss是 OpenAI 推出的开源推理模型系列,支持为开发者提供高效、灵活且易于部署的 AI 解决方案。gpt-oss包含两个版本,gpt-oss-120B 拥有 1170 亿参数,支持在 80GB GPU 上运行;gpt-oss-20B 拥有 210 亿参数,支持在 16GB 内存的普通设备上使用。两者基于 MoE 架构,支持 128k 上下文长度,推理速度快,性能接近闭源的 o4-mini 和 o3-mini。gpt-oss 支持工具调用、链式思考,适合多步骤推... --- ### MiDashengLM - 小米开源的声音理解模型 - Published: 2025-08-05 - Modified: 2025-08-05 - URL: https://aisharenet.com/midashenglm/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MiDashengLM是什么 MiDashengLM 是小米开源的高效声音理解大模型,具体参数版本为MiDashengLM-7B ,专注于音频处理与理解。模型基于 Xiaomi Dasheng 音频编码器和 Qwen2. 5-Omni-7B Thinker 解码器构建,能对语音、环境声和音乐进行统一理解。模型具备卓越的推理效率,首 Token 延迟仅为业界先进模型的 1/4,支持大规模并行处理,适用智能座舱、智能家居等场景。MiDashengLM 训练数据完全开源,支持学术和商业用途,能为多模态... --- ### MOSS-TTSD - 清华实验室开源的双语对话语音生成模型 - Published: 2025-08-05 - Modified: 2025-08-05 - URL: https://aisharenet.com/moss-ttsd/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MOSS-TTSD是什么 MOSS-TTSD 是清华大学语音与语言实验室开发的开源口语对话语音生成模型。模型能将文本对话脚本转化为自然流畅且富有表现力的对话语音,支持中英文双语生成。模型基于先进的语义-音学神经网络音频编解码器和大规模预训练语言模型,结合超过 100 万小时的单人语音数据和 40 万小时的对话语音数据进行训练。MOSS-TTSD 支持零样本语音克隆,能根据对话脚本生成准确的对话者切换语音,无需额外样本即可实现音色克隆。MOSS-TTSD 适用 AI 播客、影视配音、长篇访谈、新闻... --- ### AudioGen-Omni - 快手推出的多模态音频生成模型 - Published: 2025-08-05 - Modified: 2025-08-05 - URL: https://aisharenet.com/audiogen-omni/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 AudioGen-Omni是什么 AudioGen-Omni 是快手推出的多模态音频生成模型,能基于视频、文本等输入生成高质量的音频、语音和歌曲。AudioGen-Omni 基于先进的技术,如多模态扩散Transformer和相位对齐各向异性位置注入,实现精准的视听对齐和跨模态同步。模型支持多语言输入,推理速度快,1. 91秒即可生成8秒音频,表现出色。AudioGen-Omni 适用视频配音、语音合成、歌曲创作等多种场景,能显著提升创作效率和内容丰富度。 AudioGen-Omni的主要功能 ... --- ### LangExtract - 谷歌开源的Python库,提取结构化信息 - Published: 2025-08-05 - Modified: 2025-08-05 - URL: https://aisharenet.com/langextract/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 LangExtract是什么 LangExtract 是 Google 开源的 Python 库,利用大型语言模型(LLMs)从非结构化文本中提取结构化信息。通过用户定义的指令和少量示例,能高效地识别并组织关键细节,例如从临床笔记中提取药物名称或从文学作品中提取人物关系等。LangExtract 的核心优势在于精确的源文本定位功能,可以将每次提取映射到原文的准确位置,支持可视化高亮显示,方便追溯和验证。支持多种语言模型,包括云端模型和本地开源模型,能处理长文档并优化提取效率。LangExtrac... --- ### Qwen-Image - 通义千问推出开源的文生图基础模型 - Published: 2025-08-05 - Modified: 2025-08-05 - URL: https://aisharenet.com/qwen-image/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen-Image是什么 Qwen-Image是阿里巴巴通义千问团队发布的开源图像生成基础模型。拥有200亿参数,采用多模态扩散变换器架构(MMDiT),融合了多模态理解、高分辨率编码和扩散模型三大模块。Qwen-Image的核心优势在于强大的复杂文本渲染能力和精准的图像编辑功能,能生成包含多行布局、精细细节的中英文文本图像,支持风格迁移、增删改等多种操作。在AI Arena公开评测中表现优异,位列开源模型第一,在中文文本渲染方面表现出色。Qwen-Image适用于海报设计、PPT制作、品牌营... --- ### RedOne - 小红书最新推出的社交大模型 - Published: 2025-08-04 - Modified: 2025-08-04 - URL: https://aisharenet.com/redone/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 RedOne是什么 RedOne 是小红书推出的专为社交网络定制的大语言模型。模型通过三阶段训练策略,融入社交文化知识,强化多任务能力,并对齐人类偏好。RedOne 在社交任务性能上显著优于基础模型,在有害内容检测和浏览后搜索优化方面表现出色,能有效降低有害内容曝光率并提升用户点击率。模型具备内容理解、信息提取、语义匹配、对话与角色模拟、翻译等多种功能,为社交平台的内容管理和用户体验优化提供强大支持。 RedOne的主要功能 内容理解与分类:能精准识别用户生成内容的主题和意图,自动进行分类。 信... --- ### FastDeploy - 百度推出的高性能大模型推理与部署工具 - Published: 2025-08-04 - Modified: 2025-08-04 - URL: https://aisharenet.com/fastdeploy/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 FastDeploy是什么 FastDeploy 是百度推出的高性能推理与部署工具,专为大语言模型(LLMs)和视觉语言模型(VLMs)设计。FastDeploy 基于飞桨(PaddlePaddle)框架开发,支持多种硬件平台(如 NVIDIA GPU、昆仑芯 XPU 等),具备负载均衡、量化优化、分布式推理等特性,能显著提升模型推理性能并降低硬件成本。FastDeploy 兼容 OpenAI API 和 vLLM 接口,支持本地和服务化推理,简化大模型的部署流程。最新版本 FastDeploy... --- ### InteriorGS - 群核科技推出的3D高斯语义数据集 - Published: 2025-08-04 - Modified: 2025-08-04 - URL: https://aisharenet.com/interiorgs/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 InteriorGS是什么 InteriorGS是群核科技推出的高质量3D高斯语义数据集。数据集包含1000个3D场景,涵盖80多种室内环境,如家庭、便利店、婚宴厅和博物馆等。数据集中有755个类别的554,000多个对象实例,每个对象都配备3D框和语义标注,并提供占用地图以支持导航和空间理解。数据集用3D高斯溅射技术重建场景,结合空间大模型赋予语义信息,是全球首个适用智能体自由运动的大规模3D数据集。InteriorGS为机器人和AI智能体的空间感知能力提升提供丰富的训练素材,数据集已在Hug... --- ### DragonV2.1 - 微软推出的零样本语音合成模型 - Published: 2025-08-04 - Modified: 2025-08-04 - URL: https://aisharenet.com/dragonv21/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 DragonV2. 1是什么 DragonV2. 1 是微软推出的先进的零样本文本到语音(TTS)模型。模型基于 Transformer 架构,支持多语言和零样本语音克隆,仅需 5-90 秒的语音提示能生成自然、富有表现力的语音。模型在发音准确性、语音自然度和可控性方面进行显著改进,支持 SSML 音素标签和自定义词典,能精确控制发音和口音。模型集成水印技术,确保语音合成的合规性和安全性。DragonV2. 1 能广泛应用在视频内容创作、智能客服、教育与培训、智能助手及企业品牌推广等多个领域,为... --- ### ScreenCoder – 开源的UI截图生成前端代码工具 - Published: 2025-08-04 - Modified: 2025-08-04 - URL: https://aisharenet.com/screencoder/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ScreenCoder是什么 ScreenCoder 是开源的智能工具,能将 UI 设计截图快速转换为高质量的 HTML/CSS 代码。工具基于模块化多智能体架构,结合视觉理解、布局规划和代码合成技术,支持生成高精度且语义化的前端代码。用户能根据需求轻松调整布局和样式,实现设计与开发的无缝衔接。工具支持多种生成模型,生成的代码能直接用在生产环境,适用快速原型设计和像素级完美界面构建,能显著提升前端开发效率,广泛应用在前端开发加速、设计与开发协作、快速原型制作及小型团队与创业公司等场景。 Scre... --- ### Gemini 2.5 Deep Think - 谷歌推出的AI推理模型 - Published: 2025-08-03 - Modified: 2025-08-03 - URL: https://aisharenet.com/gemini-25-deep-think/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Gemini 2. 5 Deep Think是什么 Gemini 2. 5 Deep Think 是谷歌推出的 AI 推理模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel Thinking)和强化学习,能同时探索多种解法,互相验证并优化,最终得出最佳答案。Deep Think 特别擅长处理复杂的数学问题、算法设计、科研推理和创意开发任务。在性能上,Deep Think 在多个基准测试中表现出色,例如在 HLE 测试... --- ### MindLink - 昆仑万维推出的开源推理大模型 - Published: 2025-08-03 - Modified: 2025-08-03 - URL: https://aisharenet.com/mindlink/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MindLink是什么 MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率与准确性。计划驱动推理范式去掉了“think”标签,降低了推理成本,提升了多轮对话能力。提出了新的数学分析方法,显著提升了数学推理水平。在性能方面,Skywork MindLink在“人类最后的考试”评测中获得第一名,在数学领域的USAMO等四项评测中也位居榜首。基于Qwen3-32B和Qwen2. 5-72B进行后训练,节省了... --- ### Kimi K2 高速版 - 月之暗面Kimi推出的高速版语言模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/kimi-k2-turbo-preview/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Kimi K2 高速版是什么 Kimi K2 高速版(kimi-k2-turbo-preview)是月之暗面Kimi推出的高性能语言模型。模型在 Kimi K2 的基础上进行优化,输出速度大幅提升,每秒可生成 40 个 Tokens,远超普通版本。这一特性让模型在实时对话、代码生成和内容创作等需要快速响应的场景中表现出色。目前用户可通过 Moonshot AI 开放平台接入模型,享受高效、智能的语言模型服务。在撰写文章、生成代码片段和日常聊天场景中,Kimi K2 高速版能快速给出高质量的回复,... --- ### dots.ocr - 小红书hi lab推出的开源多语言文档解析模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/dots-ocr/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 dots. ocr是什么 dots. ocr是小红书hi lab开源的多语言文档解析模型,基于17亿参数的视觉语言模型(VLM),能高效地进行文档布局检测和内容识别,同时保持良好的阅读顺序。dots. ocr支持多种语言,能解析文本、表格、公式和图片等元素,推理速度快,性能在业界处于领先水平。通过简单的输入提示词切换,模型能灵活应对不同的文档解析任务,输出格式多样,包括JSON和Markdown等。dots. ocr在小语种解析和公式识别方面表现出色,适用学术研究、金融文档处理、教育资料解析等多... --- ### HYPIR - 中国科学院团队推出的新型图像复原大模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/hypir/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 HYPIR是什么 HYPIR 是中国科学院深圳先进技术研究院董超团队推出的图像复原大模型。模型结合扩散模型的分数先验与对抗生成网络,实现高效、高质量的图像复原。HYPIR 能快速修复老照片、提升分辨率,同时保持文字清晰和纹理锐度。HYPIR 支持个性化文本引导复原,用户能定制风格与细节,技术优势在于预训练扩散模型初始化复原网络,及单步对抗生成模型训练,相比传统方法速度大幅提升。HYPIR 在高分辨率图像修复、影视修复、文化遗产保护和数字内容创作等领域具有广阔应用前景。 HYPIR的主要功能 极速... --- ### FLUX.1 Krea [dev] - 黑森林和Krea AI联合推出的文生图模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/flux1-krea-dev/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 FLUX. 1 Krea 是什么 FLUX. 1 Krea 是 Black Forest Labs 和 Krea AI 联合推出的文生图模型。模型根据输入的文本描述,能生成高质量、逼真的图像,具有独特的美学风格,避免传统 AI 图像生成中常见的模糊背景和蜡质纹理等问题。模型基于 12B 参数的扩散变换器架构,通过预训练和后训练阶段,包括监督微调(SFT)和人类反馈的强化学习(RLHF),进一步优化图像质量和风格。FLUX. 1 Krea 与 FLUX. 1 生态系统兼容,支持 diffusers... --- ### Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/qwen3-coder-flash/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen3-Coder-Flash是什么 Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,具备卓越的代理式编程和工具调用能力,擅长处理复杂编程任务。模型支持 256K tokens 的长上下文理解,能扩展至 1M tokens,适合大型代码库处理,避免上下文断层。模型基于 305 亿参数的因果语言模型架构,用分组查询注意力机制,优化函数调用格式,支持 Qwen Code、CLINE 等平台。Qwen3-Coder-Flash 能高效生成高质量代码,支持本地部署,开发者... --- ### Wide Research - Manus平台推出的多智能体协同功能 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/wide-research/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Wide Research是什么 Wide Research 是 Manus 平台推出的强大功能,专为处理复杂且大规模的任务而设计。平台通过系统级的并行处理机制和智能体协作协议,能支持上百个通用智能体同时工作。智能体能像团队成员一样协作,共享信息并高效完成任务,如研究财富 500 强企业的多维度数据,对比顶尖 MBA 项目,Wide Research 都能轻松应对。目前Wide Research主要面向 Pro 用户开放,未来将逐步覆盖更多用户层级,为用户在企业研究、学术探索、市场分析等多个领域... --- ### Seed Diffusion - 字节跳动最新推出的扩散语言模型 - Published: 2025-08-01 - Modified: 2025-08-01 - URL: https://aisharenet.com/seed-diffusion/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Seed Diffusion是什么 Seed Diffusion 是字节跳动推出的实验性扩散语言模型,能处理代码生成任务。模型基于两阶段扩散训练、约束顺序学习和强化高效并行解码等技术,显著提升推理速度,达到2146 tokens/s,比同等规模的自回归模型快5. 4倍。模型在多个代码基准测试中表现优异,尤其在代码编辑任务上超越传统模型。模型能快速生成代码原型、优化代码质量,并辅助编程教学,展现离散扩散模型在代码生成领域的巨大潜力。 Seed Diffusion的主要功能 快速生成代码:推理速度极... --- ### 小星绪 - 京东健康推出的AI情绪漫画生成产品 - Published: 2025-07-31 - Modified: 2025-07-31 - URL: https://aisharenet.com/xiaoxingxu/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 小星绪是什么 小星绪是京东健康推出的AI情绪漫画生成产品,目前处于测试阶段,产品以情绪驱动漫画故事生成为核心功能,用户能通过语音或文字输入表达情绪或讲述故事,AI根据输入生成匹配的四格漫画及故事解读。小星绪设有“情绪星球”,如养生、故事、疗愈、艺术等,支持用户选择不同风格,生成的漫画能分享到社交平台,帮助用户建立情感共鸣。小星绪能用在情绪表达和心理健康支持,激发创意,为用户提供个性化内容体验。 小星绪的主要功能 情绪识别与漫画生成:用户通过语音或文字输入情绪或讲述故事,AI能快速识别情绪并生成匹... --- ### 1688 AI版 - 阿里旗下1688平台推出的AI生意助手 - Published: 2025-07-31 - Modified: 2025-07-31 - URL: https://aisharenet.com/1688aiapp/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 1688 AI版是什么 1688 AI版是阿里巴巴旗下1688平台推出的智能生意助手应用,专为小B买家和商家设计。应用基于1688平台海量数据,提供商机推送、选品推荐、创意生成、企业查询等功能,帮助用户精准把握市场动态、快速找到热门商品、创新产品设计,并能全面评估合作伙伴。应用支持语音交互和多语言商品详情生成,助力商家提升采购效率、拓展国际市场,推动B2B产业链升级。 1688 AI版的主要功能 AI商机洞察:支持实时推送用户关注品类的最新市场动态和商机,支持个性化设置,帮助用户精准把握细分领域... --- ### 阶跃深研 - 阶跃星辰推出的AI深入研究工具 - Published: 2025-07-30 - Modified: 2025-08-03 - URL: https://aisharenet.com/jieyue-deepsearch/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 阶跃深研是什么 阶跃深研是阶跃星辰推出的高效AI研究工具,能在短时间内自主完成复杂问题的研究并生成专业报告。工具专为金融、咨询、医疗、法律等领域设计,凭借深度搜索与信息整合能力,在行业评测中表现优异。工具基于自主强化学习和多智能体架构研发,能理解用户需求,厘清研究目标,规划研究计划,并调用搜索、知识库查询、代码执行及可视化输出等工具完成任务。阶跃深研具备聚焦搜索、自选信源、专属知识库等高级功能,支持多种格式导出报告,能有效提升研究效率与质量。 阶跃深研的主要功能 需求澄清与计划制定:能理解用户的... --- ### Runway Aleph - Runway推出的全新AI视频编辑模型 - Published: 2025-07-30 - Modified: 2025-07-30 - URL: https://aisharenet.com/runway-aleph/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Runway Aleph是什么 Runway Aleph 是 Runway 推出的先进 AI 视频编辑模型,基于简单文字指令,快速实现视频内容的增删、风格转换、环境调整和镜头运动优化等功能。用户无需复杂操作,轻松移除多余元素、改变场景氛围、将现实风格转为卡通,甚至模拟新镜头视角。模型核心优势在于基于上下文的编辑能力,能解视频的叙事逻辑,避免常见错误。模型支持生成 360p 分辨率、5-30 秒的视频,生成视频无版权限制,可用在商业用途。 Runway Aleph的主要功能 内容编辑:精准识别、添... --- ### WebShaper - 阿里通义开源的AI训练数据合成系统 - Published: 2025-07-30 - Modified: 2025-07-30 - URL: https://aisharenet.com/webshaper/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 WebShaper是什么 WebShaper 是阿里巴巴通义实验室推出的 AI 训练数据合成系统,基于形式化建模和智能体扩展机制,生成高质量、可扩展的训练数据,助力 AI 智能体提升复杂信息检索能力。系统引入“知识投影”概念,用集合操作构造复杂问题结构,精准控制任务复杂度。其中 Expander 智能体能简单“种子问题”出发,逐步扩展为复杂推理任务,生成的训练数据可控且可解释。WebShaper 结合监督微调与强化学习策略,让模型在复杂任务中表现出色,适用文献整理、市场调研、智能学习助手、生活决... --- ### Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型 - Published: 2025-07-30 - Modified: 2025-07-30 - URL: https://aisharenet.com/skywork-unipic/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Skywork UniPic是什么 Skywork UniPic 是昆仑万维开源的多模态预训练模型,具备图像理解、文本生成图像和图像编辑三大核心能力。模型基于自回归架构,融合 MAR 编码器和 SigLIP2 主干,用 1. 5B 参数规模实现高性能,逼近大模型效果。基于渐进式多任务训练,模型在理解、生成和编辑任务上表现出色,且能在消费级显卡上流畅运行。Skywork UniPic 适用创意设计、教育、游戏开发、文化遗产保护等多个领域,为开发者提供高效、实用的多模态解决方案。 Skywork U... --- ### ChatGPT Study - OpenAI推出的创新学习模式 - Published: 2025-07-30 - Modified: 2025-07-30 - URL: https://aisharenet.com/chatgpt-study/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ChatGPT Study是什么 ChatGPT Study 是 OpenAI 推出的创新学习模式,能帮助用户更高效地学习和理解知识。ChatGPT Study 通过苏格拉底式提问、支架式响应和个性化教学,引导用户主动思考,逐步解决问题。用户能在 ChatGPT 界面上开启学习模式,输入学习主题后,系统通过引导性问题和反馈帮助用户深入理解知识。学习模式适用学术学习和语言提升,助力职业技能发展和个人兴趣培养。ChatGPT Study适合免费版、Plus、Pro 和 Team 用户,未来将开放给 ... --- ### 通义万相Wan2.2 - 阿里推出的开源AI视频生成模型 - Published: 2025-07-29 - Modified: 2025-07-29 - URL: https://aisharenet.com/wan22/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 通义万相Wan2. 2是什么 通义万相Wan2. 2是阿里巴巴开源的先进AI视频生成模型,总参数量达270亿。模型包含文生视频、图生视频和统一视频生成三种模式,能根据文本描述、图片或两者的结合生成高质量视频。模型首次引入混合专家(MoE)架构,结合扩散模型和高压缩率3D VAE,大幅提升生成质量和效率,同时支持在消费级显卡上运行。模型具备电影级美学控制系统,支持精准定制光影、色彩等效果。目前,开发者能通过GitHub、HuggingFace等平台获取模型和代码,企业通过阿里云百炼调用API进行应... --- ### GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型 - Published: 2025-07-29 - Modified: 2025-07-29 - URL: https://aisharenet.com/glm-45/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 GLM-4. 5是什么 GLM-4. 5 是智谱推出的开源 SOTA 模型,专为智能体应用设计,融合推理、代码生成和智能体能力。模型基于混合专家(MoE)架构,包含两个版本,3550 亿参数的 GLM-4. 5 和 1060 亿参数的 GLM-4. 5-Air,激活参数分别为 320 亿和 120 亿。模型在推理、代码生成等任务中表现出色,支持多模态输入输出,提供“思考模式”和“非思考模式”适应复杂任务和即时响应需求。模型参数效率高,API 调用成本低,生成速度快,适用全栈开发、编程辅助、内容创... --- ### Coze Studio - 字节跳动推出的开源AI Agent开发平台 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/coze-studio/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Coze Studio是什么 Coze Studio 是字节跳动开源的 AI 智能体开发平台,专为开发者设计,能简化 AI 应用的构建、部署与管理。Coze Studio提供一站式开发环境,支持 Prompt、RAG、Plugin 和 Workflow 等核心技术,基于可视化编排工具,开发者能实现零代码或低代码开发,快速搭建复杂 AI 应用。平台内置插件框架,支持集成第三方 API 或私有功能,扩展智能体能力。平台支持多模型接入,具备知识库管理、数据库支持和实时交互功能,提供丰富的 API 和 ... --- ### Coze Loop – 字节Coze开源的AI Agent开发与调试平台 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/coze-loop/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Coze Loop是什么 Coze Loop 是字节跳动旗下 Coze 平台开源的 AI 智能体开发与运维管理平台。平台为开发者提供从开发、调试到评估、监控的全生命周期管理,涵盖提示词工程、Agent 效果评测、性能监控与调优等功能。通过 AI 辅助优化和多模型对比,开发者能高效编写、优化提示词,快速定位问题并选择最优模型。平台透明决策监控功能支持实现 AI 工作流程全链路可视化,助力开发者打造高质量的 AI 智能体,适用虚拟陪伴、营销内容生成、智能客服、教育辅导、金融风控等多种场景。 Coze... --- ### 悟能 - 商汤科技最新推出的具身智能平台 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/wuneng/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 悟能是什么 悟能是商汤科技推出的具身智能平台,专为机器人和智能设备设计。悟能基于“开悟”世界模型与多模态大模型技术,整合视觉、语音、触觉等多传感器输入,具备强大的感知、决策和行动能力。通过分层设计,系统分为感知层、决策层和行动层,各层协同工作,支持实时数据处理与反馈,确保快速响应环境变化。悟能支持嵌入端侧芯片,适配多种场景,可广泛应用在家庭服务、工业自动化、自动驾驶、医疗护理和商业服务等领域,为智能设备赋予自主执行复杂任务的能力。 悟能的主要功能 强大的感知能力:通过视觉、语音、触觉等多种传感器... --- ### Intern-S1 - 上海AI Lab开源的科学多模态大模型 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/intern-s1/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Intern-S1是什么 Intern-S1是上海人工智能实验室推出的科学多模态大模型。模型将语言和多模态能力深度融合,具备跨模态科学解析、语言与视觉融合、科学数据处理、科学问题解答、实验设计与优化等强大功能。模型首创“跨模态科学解析引擎”,能精准解读化学分子式、蛋白质序列、地震波信号等复杂科学模态数据,在多学科专业任务中超越顶尖闭源模型。Intern-S1基于动态Tokenizer和时序信号编码器,实现多种科学模态的深度融合,用通专融合的科学数据合成方法,具备强大的通用推理能力和顶尖专业能力,... --- ### 混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/hunyuanworld-10/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 混元3D世界模型 1. 0是什么 混元3D世界模型 1. 0(Hunyuan World 1. 0 )是腾讯开源的业界首个可沉浸漫游、可交互、可仿真的世界生成模型。模型融合全景视觉生成与分层3D重建技术,支持用文字或图片输入,快速生成360度沉浸式三维场景,用户能在其中自由漫游并体验交互感。模型支持物理仿真与二次编辑,生成场景可导入Unity、Unreal Engine等主流引擎,适用游戏开发、影视特效、教育仿真等场景。混元3D世界模型 1. 0用“语意层次化3D场景表征及生成算法”,具备高质量... --- ### 日日新 V6.5 - 商汤科技推出的最新多模态推理大模型 - Published: 2025-07-28 - Modified: 2025-07-28 - URL: https://aisharenet.com/sensenova-v65/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 日日新 V6. 5是什么 日日新 V6. 5 是商汤科技推出的先进多模态推理大模型,专为处理图像与文本混合输入而设计,支持精准理解图像内容并结合文本生成描述或回答问题。模型凭借创新的图文交错思维链技术,让图像以本体形式参与推理,显著提升跨模态推理精度,且越Gemini 2. 5 Pro。模型用轻量级视觉编码器和纵深语言模型架构,推理成本低,性价比高。日日新 V6. 5在自动驾驶、机器人、智能家居、智能教育和医疗健康等领域表现出色,为各行业提供高效、智能的解决方案,推动智能化发展。 日日新 V6.... --- ### Opal - 谷歌推出的AI工作流创建平台 - Published: 2025-07-25 - Modified: 2025-07-25 - URL: https://aisharenet.com/opal/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Opal是什么 Opal 是谷歌实验室推出的创新 AI 工作流生成平台,能帮助用户快速创建和分享 AI 应用,无需编写代码。Opal 通过自然语言交互和可视化编辑界面,让用户能轻松地将提示、模型调用和工具串联成多步骤的工作流。Opal 提供丰富的模板库,方便用户快速上手,支持将应用分享给他人使用。目前,Opal 正在美国地区进行公开测试,适合用在内容创作、数据分析、客户服务、教育学习和项目管理等多种场景,是加速 AI 应用开发和协作的强大工具。 Opal的主要功能 可视化工作流构建:Opal 将... --- ### Qwen-MT - 阿里通义推出的机器翻译模型 - Published: 2025-07-25 - Modified: 2025-07-25 - URL: https://aisharenet.com/qwen-mt/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen-MT是什么 Qwen-MT 是阿里通义千问团队推出的先进Qwen-MT - 阿里通义推出的机器翻译模型,基于强大的 Qwen3 架构,支持 92 种语言的互译,覆盖全球 95% 以上人口。模型基于轻量级 MoE 架构,具备低延迟、低成本的特点,每百万输出 token 的 API 调用成本低至 0. 5 美元。Qwen-MT 提供术语干预、领域提示和翻译记忆等功能,支持高度定制翻译风格,满足复杂专业场景需求。Qwen-MT在自动和人工评估中均表现出色,翻译准确且流畅,适用跨语言内容创作、... --- ### Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型 - Published: 2025-07-25 - Modified: 2025-07-25 - URL: https://aisharenet.com/agentar-fin-r1/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Agentar-Fin-R1是什么 Agentar-Fin-R1是蚂蚁数科推出的面向金融领域的先进大语言模型。模型基于强大的Qwen3架构开发,提供8B和32B两种参数规模版本,能精准处理复杂的金融推理任务,包括多步骤分析、风险评估和战略规划等。模型基于精细化的金融任务标签体系和多维度可信度保障框架进行优化,确保数据来源、合成和治理的可信性。模型在金融基准测试和通用推理任务中均展现出卓越性能,支持金融智能客服、风险评估、市场分析、财务报表解析和个性化推荐等多种应用场景,同时严格遵循合规性要求,为... --- ### MonkeyCode - 开源的企业级AI编程助手 - Published: 2025-07-25 - Modified: 2025-07-25 - URL: https://aisharenet.com/monkeycode/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MonkeyCode是什么 MonkeyCode 是开源的企业级本地 AI 编程助手,专为注重隐私和安全的开发团队设计。MonkeyCode 支持私有化部署和离线使用,确保代码数据安全。工具功能强大,包括智能代码补全、自然语言编程、代码安全扫描等,能显著提升开发效率并保障代码质量。MonkeyCode 配备企业级管理面板,支持对 AI 编程行为进行严格审计和管控。基于 Docker 技术,安装部署便捷,同时兼容多种本地化大模型,满足不同开发需求。MonkeyCode 适用企业级代码开发、代码安全... --- ### Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型 - Published: 2025-07-25 - Modified: 2025-07-25 - URL: https://aisharenet.com/seed-liveinterpret-20/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Seed LiveInterpret 2. 0 是什么 Seed LiveInterpret 2. 0 是字节跳动 Seed 团队推出的先进同声传译模型,支持中英双向翻译。模型具备接近真人水平的翻译准确率和极低延迟,平均语音到语音延迟仅 2 - 3 秒,较传统系统降低 60% 以上。模型用全双工语音生成理解框架,支持多人语音输入,能实时复刻说话人的音色,无需提前采集样本。Seed LiveInterpret 2. 0 基于多模态大语言模型、监督微调和强化学习等技术,智能平衡翻译质量与延迟,在复杂... --- ### Excel MCP Server - 基于MCP的AI Excel处理工具 - Published: 2025-07-24 - Modified: 2025-07-24 - URL: https://aisharenet.com/excel-mcp-server/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Excel MCP Server是什么 Excel MCP Server 是基于 Model Context Protocol (MCP) 的服务器工具,无需安装 Microsoft Excel 就能操作 Excel 文件。Excel MCP Server支持创建、读取和修改工作簿,具备数据读写、格式化、公式计算、图表生成和数据透视表创建等功能。基于 stdio、HTTP 等传输方式,用户能灵活地进行本地或远程操作。Excel MCP Server强大的自动化处理能力,广泛应用在企业数据处理、数... --- ### ChatFlow - 开源AI工作流自动化工具 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/chatflow/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ChatFlow是什么 ChatFlow 是开源的 AI 工作流自动化工具,支持将复杂的需求转化为高效的工作流程。工具基于 AI 技术,帮助用户快速生成代码框架、测试用例,能辅助写作和设计软件架构。ChatFlow 的可视化界面让操作变得简单直观,让非技术用户能轻松上手。ChatFlow 支持多种应用场景,包括软件开发、写作、数据分析和教育培训等,显著提升工作效率。开发者、写作人员和项目管理者,都能从 ChatFlow 中受益,实现从模糊需求到具体实现的自动化转换。 ChatFlow的主要功能 ... --- ### Mureka V7 - 昆仑万维推出的AI音乐生成模型 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/mureka-v7/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Mureka V7是什么 Mureka V7 是昆仑万维推出的先进 AI 音乐生成模型。模型基于 MusiCoT 技术,支持先规划音乐的整体结构,再填充细节,生成更具连贯性和艺术性的音乐作品。模型支持多种音乐风格,如流行、摇滚、电子、古典等,涵盖 10 种语言,支持创作歌曲或纯音乐。支持用户用简单模式快速生成音乐,或在高级模式下进行深度定制,如上传参考歌曲、自定义歌词和音色等。模型提供音频编辑功能,支持局部修改、延长、裁剪等操作,生成的音乐具有创作证明,能合法使用。Mureka V7 适合个人音... --- ### Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/seed-gr-3/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Seed GR-3是什么 Seed GR-3 是字节跳动推出的通用机器人模型,具有强大的泛化能力,能适应新环境和复杂指令。模型融合视觉、语言和动作信息,基于机器人数据、VR 人类轨迹数据和公开图文数据的三合一训练法,提升对新物体和抽象概念的理解。GR-3 支持长程任务处理、柔性物体操作和双臂协同操作,搭配定制的 ByteMini 机器人身体,具备 22 个自由度,适合精细任务。它在家庭服务、工业物流、医疗保健、零售服务和灾难救援等领域有广泛的应用前景,是迈向通用机器人“大脑”的重要一步。 See... --- ### Qwen3-Coder - 阿里通义千问开源的的代码生成模型 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/qwen3-coder/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen3-Coder是什么 Qwen3-Coder 是阿里通义千问团队推出的先进代码生成模型。模型拥有 480B 参数和 35B 激活参数,支持原生 256K token 上下文,能扩展至 1M token。模型基于混合专家架构,经过大规模预训练和强化学习优化,根据自然语言描述生成高质量代码,支持多种编程语言,如 Python、JavaScript 和 Java 等。Qwen3-Coder 具备代理式编程能力,能自主规划多步骤任务并与外部工具交互。Qwen3-Coder 提供命令行工具和 AP... --- ### OpenReasoning-Nemotron - 英伟达推出的开源系列推理模型 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/openreasoning-nemotron/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 OpenReasoning-Nemotron是什么 OpenReasoning-Nemotron 是英伟达开源的一系列大型语言模型,支持处理数学、科学和代码领域的推理任务。模型基于 DeepSeek R1 0528 模型蒸馏而成,参数规模有 1. 5B、7B、14B 和 32B 四种,能满足不同计算需求。模型基于大规模数据蒸馏和有监督微调训练,推理能力出色,在数学领域表现卓越,超越同类竞品。OpenReasoning-Nemotron支持“重型”推理模式,结合 GenSelect 算法和多智能体... --- ### Seed-X - 字节跳动推出的开源多语言翻译模型 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/seed-x/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Seed-X是什么 Seed-X 是字节跳动 Seed 团队推出的多语言翻译模型,具备 70 亿参数,支持 28 种语言的双向翻译。模型融合多语言数据预训练、指令微调和强化学习技术,能高效处理复杂语言模式,让翻译质量更出色。Seed-X在自动与人工评估中表现优异,超越部分超大型模型。Seed-X 推出挑战性测试集,涵盖多种语言元素,推动翻译研究发展。Seed-X适用于、跨语言信息检索、多语言内容创作、在线教育、电子商务和社交媒体等多个场景,为全球用户和企业提供高效便捷的翻译服务。 Seed-X的... --- ### JoyAgent-JDGenie - 京东开源的轻量化通用多智能体系统 - Published: 2025-07-23 - Modified: 2025-07-23 - URL: https://aisharenet.com/joyagent-jdgenie/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 JoyAgent-JDGenie是什么 JoyAgent-JDGenie 是京东开源的轻量化通用多智能体系统,无需二次开发能直接使用。JoyAgent-JDGenie 能处理复杂任务,如生成报告、分析数据等,支持多种交付格式,如网页、PPT 和 Markdown。系统基于多智能体设计,多个子智能体协同工作,提升效率。JoyAgent-JDGenie 具备跨任务记忆和工具进化机制,能记住相似任务信息并基于已有工具生成新工具。JoyAgent-JDGenie 基于高并发 DAG 执行引擎和多智能体上... --- ### TRAE SOLO - 字节跳动TRAE推出的AI自动开发助手 - Published: 2025-07-21 - Modified: 2025-07-21 - URL: https://aisharenet.com/trae-solo/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 TRAE SOLO是什么 TRAE SOLO 是字节跳动推出的AI编程助手TRAE 推出的AI 自动化开发助手,用AI技术简化软件开发流程。TRAE SOLO能理解用户的需求,支持文字描述、语音指令和文件上传输入需求,自动规划并执行开发任务。从代码生成到测试,再到最终部署,TRAE SOLO 都能高效完成。TRAE SOLO 配备集成的开发环境,包括代码编辑器、终端、浏览器和文档面板,方便开发者实时监控进度并进行必要的调整。TRAE SOLO 支持多模态输入和多智能体协同工作,适用 Web 开发... --- ### 雾象Fogsight - AI动画生成Agent,输入主题生成完整动画 - Published: 2025-07-21 - Modified: 2025-07-21 - URL: https://aisharenet.com/fogsight/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 雾象Fogsight是什么 雾象Fogsight是创新的AI动画生成 Agent,基于大型语言模型(LLM)将抽象概念转化为生动的动画。用户输入主题,雾象Fogsight能生成包含双语旁白和电影级视觉效果的完整动画。其智能编排功能能自动完成从脚本到动画的创作流程,语言用户界面(LUI)支持用户用对话对动画进行精准调整。Fogsight适用教育、科普、产品展示和内容创作等多个领域,能快速将复杂概念转化为直观的视觉内容,极大地提升创作效率和效果。 雾象Fogsight的主要功能 概念即影像:用户输入... --- ### Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型 - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/goedel-prover-v2/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Goedel-Prover-V2是什么 Goedel-Prover-V2 是普林斯顿大学、清华大学和英伟达等顶尖机构联合推出的开源定理证明模型。模型基于创新技术如分层式数据合成、验证器引导的自我修正和模型平均等,显著提升自动形式化证明的性能。Goedel-Prover-V2模型有两个版本,32B 和 8B,模型在多个基准测试中表现卓越,例如在 MiniF2F 测试中,32B 模型的 Pass@32 成绩高达 90. 4%,超越规模更大的 DeepSeek-Prover-V2。模型能够自动生成复杂... --- ### BytePlus - 字节跳动推出的企业级智能云服务平台 - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/byteplus/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 BytePlus是什么 BytePlus 是字节跳动推出的企业级智能服务平台,面向海外提供多元化服务。平台涵盖内容分发与加速(CDN)、个性化推荐、增强现实、数据处理与分析、实时音视频通信、人工智能与机器学习等强大功能。BytePlus通过先进的技术和数据分析能力,帮助企业优化用户体验、提升业务效率、挖掘数据价值,支持全球数字化转型。BytePlus服务广泛应用在电商、媒体、教育、游戏等行业,助力企业在数字时代实现创新发展,成为企业数字化升级的有力助手。 BytePlus的主要功能 内容加速:通... --- ### 飞书妙搭 - 飞书推出的AI原生系统搭建平台 - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/feida/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 飞书妙搭是什么 飞书妙搭是飞书推出的企业级 AI 原生系统搭建平台。平台通过多 Agent 架构,快速将企业的业务需求转化为实际应用,支持从需求分析到功能设计、应用开发及问题修复的全流程。用户用对话方式,轻松搭建轻量级系统,如客户反馈、工单管理等,实现立等可取、所见即所得的效果。飞书妙搭具备局部 AI 精调、多模态输入、错误自动修复等功能,支持双端自适应,一次搭建能在 PC 端和移动端使用,大幅提升开发效率和应用智能化水平,为企业数字化转型提供高效便捷的工具。 飞书妙搭的主要功能 快速搭建系统原... --- ### MirageLSD - Decart AI推出首个实时AI视频生成模型 - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/miragelsd/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MirageLSD是什么 MirageLSD 是 Decart AI 团队推出的全球首个实时流扩散 AI 视频模型,能实现无限时长的实时视频生成,延迟低至 40 毫秒以内,支持 24 帧/秒的流畅输出。通过 Diffusion Forcing 技术和历史增强训练,解决了传统自回归模型在长时间生成中的误差累积问题,实现了视频的无限生成。基于Hopper 优化的 Mega Kernels、架构感知剪枝和 Shortcut Distillation 等技术,MirageLSD 在保持高画质的同时,大幅... --- ### Kimi Playground - 月之暗面推出的一站式AI工具调用体验平台 - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/kimi-playground/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Kimi Playground是什么 Kimi Playground 是月之暗面推出的面向开发者的 AI 工具调用体验平台。Kimi Playground 能让 AI 调用各种工具(如天气查询、酒店预订、数据分析等)完成复杂的任务,不只是进行对话。开发者能在平台上直观地选择和调用预置的官方工具或第三方工具,实时调整参数并查看调用细节。基于多个工具的协同调用,AI 能快速生成专业的解决方案,比如旅游行程规划或数据分析报告。平台能帮助开发者更好地探索和用 AI 的工具调用能力,提升开发效率和应用体验... --- ### ChatGPT Agent – OpenAI推出的通用智能AI Agent - Published: 2025-07-18 - Modified: 2025-07-18 - URL: https://aisharenet.com/chatgpt-agent/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ChatGPT Agent是什么 ChatGPT Agent 是 OpenAI 推出的通用AI Agent,融合多种能力,能自主完成复杂任务。用户只需用自然语言描述需求,Agent 能自动选择合适工具,比如浏览网页、提取信息、运行代码,甚至生成 PPT 或表格。ChatGPT Agent 支持任务中断与修改,用户neng 随时调整指令或手动接管操作。Agent 具备强大的安全防护功能,确保用户数据安全。ChatGPT Agent 与 Manus 界面相似,但将 Agent 能力内化于模型,实现更... --- ### GLM-Experimental - 智谱AI推出的实验性模型 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/glm-experimental/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 GLM-Experimental是什么 GLM-Experimental 是智谱 AI 推出的实验性大语言模型,已在 Z. ai 平台上线。模型具备自动生成 PPT 的能力,用户输入主题或要点后,模型能快速生成结构清晰、格式规范的演示文稿,将文字内容或网络搜索结果转换为可视化图表。模型延续 GLM 系列的自然语言理解与生成优势,能准确理解需求并生成高质量内容。GLM-Experimental 目前处于实验阶段,不断探索新功能,未来有望拓展至更多办公自动化和内容创作场景,助力提升办公效率和内容创作... --- ### PromptForge - AI 提示词生成与优化工作台 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/promptforge/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 PromptForge是什么 PromptForge 是强大的 AI提示工程工作台,能帮助用户高效地创建、测试和优化 AI 提示词。PromptForge通过智能生成功能提供优化建议,支持多模型比较和动态参数调整,让用户灵活对比不同模型的效果。PromptForge 配备系统性评估引擎,自动生成全面的测试套件,涵盖鲁棒性、安全性、准确性和创造性等多个维度。平台具备完善的提示管理功能,支持搜索、标签、历史记录和导出导入,确保用户不会丢失已验证有效的提示。PromptForge 适合专业用户和开发者... --- ### VikingDB - 火山引擎推出的高性能云原生向量数据库 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/vikingdb/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 VikingDB是什么 VikingDB 是火山引擎推出的高性能云原生向量数据库,专为处理海量高维向量数据而设计。VikingDB 具备多种数据写入方式,包括实时同步、异步写入等,满足不同场景下的数据处理需求。VikingDB 基于自研的高效索引算法,如 HNSW 和 IVF,实现百亿级向量的毫秒级检索,同时兼容稠密与稀疏向量检索。VikingDB 提供 SaaS 控制台、API 和多种语言的 SDK,支持自动弹性扩容,能有效降低存储成本。VikingDB 广泛应用在多模态搜索、智能推荐、RAG... --- ### RoboBrain 2.0 - 智谱开源的通用具身大脑模型 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/robobrain-20/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 RoboBrain 2. 0是什么 RoboBrain 2. 0 是智谱开源的先进具身大脑模型,为机器人提供强大的感知、推理和规划能力。RoboBrain 2. 0包含 7B 和 32B 两个版本,采用异构架构,融合视觉编码器和语言模型,支持高分辨率图像、视频、语言指令等多模态输入。模型具备出色的空间理解、时间建模和复杂推理能力,能应对动态环境中的连续决策任务。模型基于分阶段训练策略逐步提升性能,适用工业自动化、物流仓储、智能家居、医疗康复和农业自动化等多种场景,助力具身智能从实验室走向真实世界... --- ### RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/roboos-20/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 RoboOS 2. 0是什么 RoboOS 2. 0 是智谱开源的跨本体大小脑协同框架,推动机器人从单一智能向群体协作智能转变。框架用“大小脑”架构实现高效分工,云端大脑负责复杂决策与协同,小脑模块专注于执行具体技能。框架支持多机器人协作,具备轻量化部署、标准化接口和实时感知能力,能快速适配不同硬件与任务需求。框架优化的端云协同机制和多模态数据处理能力,进一步提升机器人在动态环境中的适应性和执行效率,广泛适用物流、家庭服务、工业生产等场景。 RoboOS 2. 0的主要功能 多机器人协同作战:能... --- ### EXAONE 4.0 - LG推出的混合推理模型 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/exaone-40/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 EXAONE 4. 0是什么 EXAONE 4. 0是韩国LG AI Research推出的混合推理大模型,融合通用自然语言处理和高级推理能力。模型支持韩语、英语和西班牙语,分为32B的专业版和1. 2B的端侧版。专业版适用法律、会计、医学等高专业领域,端侧版体积小、性能优,适合隐私和安全要求高的本地运行场景。模型在复杂任务处理上表现出色,如在MMLU-Pro中得分81. 8,在AIME 2025中得分85. 3,展现强大的复杂任务处理能力,支持函数调用和MCP接口,便于与其他系统集成。EXAO... --- ### Tizzy.ai - 百度推出的AI搜索应用 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/tizzyai/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Tizzy. ai是什么 Tizzy. ai 是百度推出的 AI 智能搜索应用。Tizzy. ai 基于百度的大模型技术,具备强大的智能搜索功能,能快速回答问题、深度思考和辅助决策。Tizzy. ai 界面简洁,无广告和弹窗,底部导航栏仅有“搜索”和“资源库”两个核心入口。Tizzy. ai 能提供海量影视资源,且通过 AI 整合全网播放源,方便用户查找和播放。Tizzy. ai 支持自动模式和深度模式,自动模式下能快速给出答案,深度模式强化推理和深入思考,适合需要更精准信息的场景。 Tizzy... --- ### Voxtral - Mistral AI推出的开源语音模型 - Published: 2025-07-17 - Modified: 2025-07-17 - URL: https://aisharenet.com/voxtral/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Voxtral是什么 Voxtral 是 Mistral AI 推出的先进开源语音模型,支持通过强大的语音转录和理解能力推动自然人机交互。模型提供两个版本,24B 适用于大规模生产,3B 适合本地部署。Voxtral 支持多语言,能自动检测语言,支持处理长达 30 分钟的音频转录和 40 分钟的音频理解。模型具备内置问答和总结功能,无需额外语言模型直接生成结构化内容。Voxtral 能直接触发后端功能调用,优化语音交互的效率和成本。Voxtral 结合深度学习技术,将语音识别与自然语言理解集成于... --- ### k2 – 月之暗面Kimi最新推出的MoE架构基础模型 - Published: 2025-07-11 - Modified: 2025-07-11 - URL: https://aisharenet.com/k2/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 k2是什么 k2是Moonshot AI推出的具备超强代码和 Agent 能力的 MoE 架构基础模型,总参数 1T,激活参数 32B。在通用知识推理、编程、数学、Agent 等主要类别的基准性能测试中,K2 模型的性能超过其他主流开源模型。k2 模型上下文长度为 128k,不支持视觉功能,支持 ToolCalls、JSON Mode、Partial Mode、联网搜索功能等。 k2的主要功能 超强代码能力:专为编程任务优化,支持复杂代码生成、调试、解释和跨语言转换。 Agent 能力:支持多步... --- ### Grok 4 – 马斯克旗下xAI推出的最新大模型 - Published: 2025-07-11 - Modified: 2025-07-11 - URL: https://aisharenet.com/grok-4/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Grok 4是什么 Grok 4 是 xAI 推出的最新AI大模型,Grok 4 的推理能力相较于前代提升 10 倍。模型具备卓越的推理能力,能在 SAT、GRE 等高难度考试中接近满分,在多项基准测试中超越其他前沿模型。Grok 4 支持多模态功能,能理解主观概念、生成代码和可视化内容,在语音交互上进行重大改进。Grok 4分为两个版本,Grok 4 是单代理(single agent)版本, Grok 4 Heavy 是多代理版本(multi agents),支持四个代理同时工作,上下文窗口... --- ### GenFlow超能搭子 – 百度文库推出的通用AI Agent - Published: 2025-07-11 - Modified: 2025-07-11 - URL: https://aisharenet.com/genflow/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 GenFlow超能搭子是什么 GenFlow超能搭子是百度文库推出的通用AI Agent,用户只需输入自然语言指令,可自主拆解任务、调用百度文库14亿文档库及网盘资源,极速生成PPT、报告、图表、海报等全模态内容。3分钟级交付、内容扎实可用(如30页PPT+万字报告)、格式完美适配(16:9比例、在线编辑),支持复杂任务调度(如实时成本计算器)。升级版2. 0实现多Agent并发协作、个性化记忆,打通从“找资料”到“出成品”的全流程。 GenFlow超能搭子的主要功能 极速生成:3分钟生成30页... --- ### TRAE Agent - 字节跳动开源的软件工程任务助手 - Published: 2025-07-08 - Modified: 2025-07-08 - URL: https://aisharenet.com/trae-agent/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 TRAE Agent是什么 TRAE Agent 是字节跳动开源的智能软件工程助手,基于先进的大语言模型(LLM)构建。TRAE Agent能高效处理复杂的软件开发任务,包括代码库探索、问题复现、修复方案制定以及高质量代码生成等。工具支持多种主流语言模型,如 OpenAI 和 Anthropic,支持基于统一接口灵活调用,满足不同开发需求。TRAE Agent具备强大的工具集成能力,内置文件编辑和脚本执行等功能,支持多轮交互,能将复杂任务拆分为可执行步骤,逐步推理并执行。TRAE Agent 提... --- ### Higress MCP - 今日投资推出的MCP服务平台 - Published: 2025-07-08 - Modified: 2025-07-08 - URL: https://aisharenet.com/higress-mcp/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Higress MCP是什么 Higress MCP 是今日投资推出的创新型平台,支持将传统金融数据API快速转化为现代化的MCP服务。Higress MCP基于简单配置即可实现REST API到MCP Server的转换,无需编写代码,极大地降低开发门槛和成本。平台具备强大的企业级功能,如统一认证授权、精细化流量控制和全链路可观测性,确保服务的安全性与稳定性。Higress MCP提供托管服务,支持弹性伸缩和灰度发布,有效降低运维负担。Higress MCP 支持多版本MCP协议和多种客户端接... --- ### CodeBuddy IDE - 腾讯推出的AI全栈开发助手 - Published: 2025-07-07 - Modified: 2025-07-07 - URL: https://aisharenet.com/codebuddy-ide/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 CodeBuddy IDE是什么 CodeBuddy IDE 是腾讯推出的AI 驱动的全栈开发助手,基于智能化手段提升开发效率。CodeBuddy IDE具备强大的 AI 代码补全功能,支持实时预测并自动补全代码片段,减少重复劳动。CodeBuddy IDE支持将 Figma 设计稿一键转换为高质量的生产级代码,转换准确率极高,大大减轻前端开发的工作量。平台内置 Supabase 后端服务,提供即时数据库和用户认证功能,简化后端开发流程。CodeBuddy IDE支持一键部署,能快速将项目部署到... --- ### 宠TA - 京东推出的AI宠物互动产品 - Published: 2025-07-04 - Modified: 2025-07-04 - URL: https://aisharenet.com/chongta/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 宠TA是什么 宠TA是京东推出的AIGC宠物互动产品,能为宠物爱好者提供充满乐趣和温馨的在线互动平台。支持用户为自己的宠物选择各种可爱的服装和配饰,进行个性化装扮,且能创建宠物的数字形象,与之进行丰富互动。平台提供宠物健康咨询、医疗建议、成长记录等功能,帮助主人更好地照顾宠物。宠TA设有颜值打分、专业起名、动物乐园等趣味板块,及签到领钱、零食专场等福利活动。基于京东APP能轻松访问,满足宠物主人的互动、娱乐、健康管理等多重需求,是宠物爱好者的线上互动新选择。 宠TA的主要功能 宠物个性化定制:用... --- ### 聊愈小宇宙 - 京东健康推出的AI心理陪伴产品 - Published: 2025-07-04 - Modified: 2025-07-04 - URL: https://aisharenet.com/chat-healing/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 聊愈小宇宙是什么 聊愈小宇宙是京东健康推出的AI心理陪伴产品。聊愈小宇宙基于京医千询医疗大模型推出,能模拟人类交流过程和共情能力,为用户提供7×24小时的心理健康支持。用户基于文字、表情或语音与AI角色小鱼互动,分享情绪获得心理治愈建议。产品具备情绪识别、情绪记录、心理解压游戏、心理健康报告等功能,帮助用户更好地管理情绪、缓解压力,提升心理健康意识。聊愈小宇宙能用在日常情绪管理,为遇到心理困扰的用户提供即时支持,是现代人心理健康的好帮手。 聊愈小宇宙的主要功能 情绪识别与分析:聊愈小宇宙精准识别... --- ### Shortcut - AI Excel Agent,一键完成复杂Excel任务 - Published: 2025-07-04 - Modified: 2025-07-04 - URL: https://aisharenet.com/shortcut/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Shortcut是什么 Shortcut 是创新的 AI 驱动的 Excel 辅助工具。基于智能算法,能快速完成各种复杂的 Excel 任务,包括数据输入、编辑、计算和整理。Shortcut 能处理基础操作,支持应对高级的金融建模和数据分析,生成直观的图表和报告。Shortcut 具备趣味性的像素画创作功能,根据用户输入生成有趣的像素画作品。Shortcut 目前处于早期预览阶段,用户基于谷歌邮箱登录,可免费体验3次。Shortcut 适用多种场景,如数据分析、金融建模、项目管理、教育和日常办公... --- ### 星流Agent - Liblib推出的AI一站式设计Agent - Published: 2025-07-03 - Modified: 2025-07-03 - URL: https://aisharenet.com/xingliu-art-agent/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 星流Agent是什么 星流Agent是Liblib推出的专为中文用户设计的一站式创意设计Agent。星流Agent延续Lovart的全栈式智能设计能力,全面适配中文语义、东方美学和本地场景。用户只需输入一句话,星流Agent能自动拆解任务、分析风格、布局视觉重点,生成主图、延展图、社媒封面等一整套视觉方案。星流Agent支持无边画布智能编辑、多种模型组合调用及丰富的输出格式,如图像、视频、声音、3D等。星流Agent强大的中文理解能力使其能够精准生成符合用户需求的设计作品,让设计变得简单高效,适... --- ### Step-Audio-AQAA – StepFun推出的端到端大音频语言模型 - Published: 2025-07-03 - Modified: 2025-07-03 - URL: https://aisharenet.com/step-audio-aqaa/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Step-Audio-AQAA是什么 Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无需依赖传统的自动语音识别(ASR)和文本到语音(TTS)模块,简化了系统架构并消除了级联错误。Step-Audio-AQAA 的训练过程包括多模态预训练、监督微调(SFT)、直接偏好优化(DPO)以及模型合并。通过这些方法,模型在语音情感控制、角色扮演、逻辑推理等复杂任务中表现出色。在 S... --- ### MuseSteamer - 百度推出的视频生成大模型 - Published: 2025-07-03 - Modified: 2025-07-03 - URL: https://aisharenet.com/musesteamer/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MuseSteamer是什么 MuseSteamer是百度推出的多模态视频生成大模型。模型能根据用户提供的文字描述或图片,快速生成高质量的动态视频内容,支持多种清晰度和功能版本,满足不同场景下的创作需求。模型具备出色的中文语义理解能力,支持精准控制视频的场景、动作和镜头切换,生成的视频画面流畅自然,符合物理运动规律。模型能同步生成与画面匹配的音效和台词,进一步提升视频的完整性和吸引力。模型适用专业影视制作、广告创作和个人视频记录,为创作者提供高效、便捷的视频生成解决方案,激发无限创意。 Muse... --- ### 绘想 - 百度推出的AI视频生成平台 - Published: 2025-07-03 - Modified: 2025-07-03 - URL: https://aisharenet.com/huixiang/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 绘想是什么 绘想是百度推出的 AI 视频生成平台,基于 AI 技术助力用户轻松打造个性化视频。绘想界面直观,工具强大,具备灵感推荐功能,能为创作者提供创意启发,支持一键同款操作,能快速生成相似视频,简化创作流程。用户在遵守相关协议和政策的基础上,在平台上尽情发挥创意,制作出生动鲜活的作品,适用社交媒体营销、在线教育、企业宣传,和个人娱乐创作等场景,让创作变得简单高效。 绘想的主要功能 视频生成:用户借助平台强大的 AI 能力,生成多种类型的视频,包括宣传视频、教育视频和个人创意短片等,满足不同场... --- ### 羚珑 - 京东推出的AI商品图设计工具 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/linglong-jd/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 羚珑是什么 羚珑是京东推出的智能设计工具,为电商商家和个人提供高效便捷的设计解决方案。通过智能抠图、智能排版、智能配色等功能,帮助用户快速生成高质量的设计作品,满足商品主图、广告Banner、店铺页面等多种电商场景需求。羚珑提供丰富的模板资源和视频剪辑功能,支持一键生成商品视频广告,适配多平台投放。为企事业单位提供素材管理、标准化合图等SAAS服务。 羚珑的主要功能 智能抠图:基于机器学习和图像识别技术,能快速精准地提取图片主体,支持手动微调,在处理人像复杂背景时表现出色。 智能配色:通过图像色... --- ### 腾讯广告妙思 - 腾讯广告推出的一站式AI广告创意平台 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/admuse/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 腾讯广告妙思是什么 腾讯广告妙思是腾讯广告推出的一站式AI广告创意平台,基于腾讯混元大模型,为广告主提供高效、智能的创意生成与优化服务。支持文生图、图生图、文生视频等多种创意工具,用户只需输入简单的自然语言描述或上传素材,一键生成多种创意图片、视频等广告素材。妙思具备商品背景合成、照片数字人等特色功能,可快速为商品图片添加背景或生成适合不同行业的爆款人像素材。平台提供创意内容热榜,帮助用户获取行业灵感,提升创意洞察效率。妙思支持素材合成与优化,实现素材的1生N变形,满足多版位通投需求。 腾讯广告... --- ### 图可丽 - AI图像处理工具,一键图像和视频抠图神器 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/tukeli/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 图可丽是什么 图可丽是AI图像处理工具,专注于提供高效便捷的图片和视频编辑服务。基于先进的人工智能技术,能快速实现一键抠图、视频处理、照片修复与美化、AI绘画以及背景更换等多种功能。图可丽支持多种对象的自动抠图,处理速度快,效果精准,具备批量处理能力,适合电商、设计等行业以及个人用户的多样化需求。 图可丽的主要功能 一键抠图:支持人像、宠物、商品、卡通等多种对象的自动抠图,平均处理时间仅300毫秒。 视频处理:包括视频抠图和视频动漫化,可将视频中的特定元素抠取出来,支持一键将视频或图片转换为动漫... --- ### 圆周旅迹 – AI旅行规划应用,自动生成个性化行程 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/pitravel/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 圆周旅迹是什么 圆周旅迹是AI旅行规划应用,帮助用户高效、便捷地安排旅行行程。用户能快速输入目的地、时间等信息,自动生成合理且个性化的行程安排。支持从社交平台一键导入链接、文字或图片,快速生成同款行程;提供3D全景地图导航和路径拖拽功能,帮助用户直观规划路线;方便旅行伙伴共同编辑行程并实时更新。圆周旅迹整合了实时交通数据,支持离线地图缓存,用户在无网络环境下也能正常使用。 圆周旅迹的主要功能 行程复制:支持从社交平台(如小红书、微信公众号等)一键复制链接、文字或图片,快速生成同款行程。 智能行程... --- ### ML-Master – 上海交大推出的AI专家Agent - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/ml-master/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ML-Master是什么 ML-Master是上海交通大学人工智能学院Agents团队推出AI专家智能体。在OpenAI的权威基准测试MLE-bench中表现出色,以29. 3%的平均奖牌率位居榜首,超越了微软的RD-Agent和OpenAI的AIDE等竞争对手。ML-Master通过“探索-推理深度融合”的创新范式,模拟人类专家的认知策略,整合广泛探索与深度推理,显著提升了AI在机器学习工程中的表现。采用平衡多轨迹探索和可控推理两大模块,通过自适应记忆机制实现两者的高效协同。 ML-Maste... --- ### Paperpal - AI学术写作工具,全面覆盖写作全流程 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/paperpal/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Paperpal是什么 Paperpal是专注于学术写作的AI辅助工具,帮助研究人员、学生和专业人士提升写作质量和效率。通过强大的语言润色功能,提供语法检查、拼写纠正和用词建议,确保文本准确流畅。Paperpal支持学术翻译,能将中英文内容精准转换,帮助打破语言障碍。具备句段改写、AI助写、论文查重、投稿完备度检查等功能,能生成文章大纲、总结研究亮点,撰写投稿信,全方位助力学术写作。 Paperpal的主要功能 语言润色:提供语法检查、用词建议、拼写纠正等,确保语言表达准确无误。 学术翻译:支持... --- ### GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/glm-41v-thinking/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 GLM-4. 1V-Thinking是什么 GLM-4. 1V-Thinking是智谱AI推出的开源视觉语言模型,专为复杂认知任务设计,GLM-4. 1V-Thinking支持多模态输入,涵盖图像、视频和文档等。基于GLM-4V架构,模型引入思维链推理机制,用课程采样强化学习策略,显著增强跨模态因果推理能力和稳定性。轻量版GLM-4. 1V-9B-Thinking(GLM-4. 1V-9B-Base基座模型和GLM-4. 1V-9B-Thinking具备深度思考和推理能力)拥有10B参数量,在2... --- ### ThinkSound - 阿里通义推出的音频生成模型 - Published: 2025-07-02 - Modified: 2025-07-02 - URL: https://aisharenet.com/thinksound/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 ThinkSound是什么 ThinkSound是阿里通义语音团队推出的首个CoT(链式思考)音频生成模型。模型能为视频画面生成精准匹配的音效,基于引入CoT推理,解决传统技术难以捕捉画面动态细节和空间关系的问题。模型基于三阶思维链驱动音频生成,包括基础音效推理、对象级交互和指令编辑。模型配备AudioCoT数据集,包含带思维链标注的音频数据,在VGGSound数据集上性能卓越。ThinkSound支持用在影视制作、游戏开发、广告营销及虚拟现实(VR)和增强现实(AR)等领域,提升音画同步的真实... --- ### Mapify - XMind推出的AI思维导图生成工具 - Published: 2025-07-01 - Modified: 2025-07-01 - URL: https://aisharenet.com/mapify/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Mapify是什么 Mapify 是 XMind 团队推出的 AI 思维导图生成工具。能将文本、PDF、网页、视频、音频等多种格式的内容快速转换为结构化的思维导图,帮助用户高效提取和整理关键信息。核心功能包括一键生成思维导图、AI 对话修改、实时网络访问、多语言支持以及文本到图像转换等。用户可以轻松将复杂内容转化为清晰的结构化形式,方便学习、工作和个人管理。Mapify支持网页版、iOS、Android 平台及浏览器扩展。 Mapify的主要功能 多格式内容转换:支持将文本、PDF 文档、网页、... --- ### CodeArts Doer - 华为云推出的AI智能开发助手 - Published: 2025-07-01 - Modified: 2025-07-01 - URL: https://aisharenet.com/codearts-doer/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 CodeArts Doer是什么 CodeArts Doer 是华为云推出的AI智能开发助手,通过 AI 技术提升开发效率和软件质量。基于 6 大 Agent 智能体(团队、项目、产品、开发、测试、Committer 助手),覆盖从需求管理到运维部署的全流程。Agent 协同工作,打破沟通障碍,实现需求规划、代码生成、测试用例生成、代码评审和自动化部署等功能。 CodeArts Doer的主要功能 全流程自动化协作:CodeArts Doer 基于 6 大 Agent 智能体(团队助手、项目助手... --- ### Qwen-TTS - 阿里通义千问推出的语音合成模型 - Published: 2025-07-01 - Modified: 2025-07-01 - URL: https://aisharenet.com/qwen-tts/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen-TTS是什么 Qwen-TTS是阿里通义推出的先进语音合成模型。模型能将文本高效转化为自然流畅的语音,支持多种语言和方言,如普通话、英语、北京话等,满足不同地域和场景需求。依托海量语料训练,模型语音输出质量高,韵律自然,可媲美真人。Qwen-TTS具备流式输出功能,能实现边接收文本边播放语音,极大提升交互效率,适用智能客服、在线教育、智能导航等多种场景。 Qwen-TTS的主要功能 多语种与方言合成:模型支持中文和英文,支持合成多种方言,像北京话、上海话、四川话等,满足不同地域和场景下... --- ### MultiAgentPPT - 开源的AI演示文稿生成系统 - Published: 2025-06-30 - Modified: 2025-06-30 - URL: https://aisharenet.com/multiagentppt/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 MultiAgentPPT是什么 MultiAgentPPT 是开源的多智能体 AI 演示文稿生成系统。用户只需输入主题,系统基于多智能体协作,自动完成大纲生成、主题拆分、并行调研及内容汇总等步骤,快速生成高质量 PPT。系统基于流式并发机制,多个智能体并行工作,能实时流式返回生成进度,让用户随时掌握情况并及时调整。MultiAgentPPT 具备外部检索与数据整合能力,确保内容的深度、广度与时效性。系统基于模块化设计,易于扩展新智能体和功能模块。MultiAgentPPT 适用教育、企业培训、... --- ### Ovis-U1 - 阿里推出的多模态统一AI模型 - Published: 2025-06-30 - Modified: 2025-06-30 - URL: https://aisharenet.com/ovis-u1/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Ovis-U1是什么 Ovis-U1是阿里巴巴集团Ovis团队推出的多模态统一模型,参数规模达到30亿。模型具备多模态理解、文本到图像生成以及图像编辑等三大核心能力,凭借先进的架构设计和协同统一训练方法,支持实现高保真图像合成及高效的文本视觉交互。在多模态理解、生成和编辑等多个领域的学术基准测试中,Ovis-U1均取得优异的成绩,展现出卓越的泛化能力和出色的性能表现。 Ovis-U1的主要功能 多模态理解:可精准解析复杂视觉场景与文本内容,完成视觉问答(VQA),生成贴合图像的描述文本。 文本到... --- ### 袋鼠参谋 – 美团推出的商家AI智能决策应用 - Published: 2025-06-29 - Modified: 2025-06-29 - URL: https://aisharenet.com/kangaroo-advisor/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 袋鼠参谋是什么 袋鼠参谋是美团推出的面向商家的AI智能决策应用,帮助商家解决开店、运营中的难题。基于美团海量的餐饮数据和10多年线上运营经验,通过对话式交互,为商家提供赛道选择、开店选址、菜品研发、门店运营等场景的精准分析和建议。例如,商家可以询问“在某地开一家特色餐厅如何”,袋鼠参谋会结合美团数据库,提供需求规模、竞争格局、消费者洞察等关键数据。是通用AI的升级版,更是美团将本地生活数据库转化为“可供问答”的决策服务工具,帮助商家在信息不对称的条件下做出更理性的判断。 袋鼠参谋的主要功能 菜品... --- ### AI抖音 - 抖音推出的智能深度思考与搜索应用 - Published: 2025-06-29 - Modified: 2025-06-29 - URL: https://aisharenet.com/aidouyin/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 AI抖音是什么 AI抖音是抖音推出的智能深度思考与搜索应用,为用户提供更高效、更智能的内容获取体验。基于抖音的强大内容生态和AI技术,通过联网搜索和推理能力,为用户提供更全面、更详细的答案。用户可以通过文字、语音或图片输入问题,AI会结合全网信息,快速生成答案,以视频和图文的双列形式展示,方便用户快速获取所需内容。AI抖音支持边刷边搜功能,用户在浏览视频时可以直接发起搜索,无需切换页面,搜索结果会无缝嵌入当前页面。为创作者提供了灵感推荐、作品分析和对话式创作问题答疑等功能,帮助创作者更高效地进行... --- ### Qwen VLo – 通义千问推出的多模态统一理解与生成模型 - Published: 2025-06-28 - Modified: 2025-06-28 - URL: https://aisharenet.com/qwen-vlo/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Qwen VLo是什么 Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。能“看懂”世界,能基于理解进行高质量的再创造,实现了从感知到生成的跨越。能精准理解图像内容,在此基础上进行一致性和高质量的生成。用户可以通过自然语言指令要求模型对图像进行风格转换、场景重构或细节修饰,模型能灵活响应并生成符合预期的结果。Qwen VLo 支持多语言指令,打破语言壁垒,为全球用户提供便捷的交互体验。具备动态分辨率训练与生成的能力,支持任意分辨率和长宽比的图像生成,适用于多种场景。 Qwen VL... --- ### AiBiao – AI图表处理工具,对话式进行数据查询、清洗、分析 - Published: 2025-06-27 - Modified: 2025-06-27 - URL: https://aisharenet.com/aibiao/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 AiBiao是什么 AiBiao 是AI图表处理工具,通过自然语言交互帮助用户高效完成数据处理和分析工作。支持用户通过对话的方式进行数据查询、清洗、合并、计算和分析,无需复杂的公式或代码,降低了数据处理的门槛。AiBiao 具备“一句话生成图表”的功能,只需简单描述需求,可快速生成多种类型的图表,可以智能联网搜索数据填充表格。 AiBiao的主要功能 智能数据对话:用户可以通过自然语言与 AI 进行交互,无需复杂的公式和函数,可完成数据查询、清洗、合并、计算和分析等操作。AI 能智能理解查询意图... --- ### Doppl - 谷歌推出的AI虚拟试衣应用 - Published: 2025-06-27 - Modified: 2025-06-27 - URL: https://aisharenet.com/doppl/ - 分类目录: 最新AI资源 - 内容可见性: 所有人可见 Doppl是什么 Doppl是谷歌推出的AI虚拟试衣应用。用户上传全身照片后,应用支持将服装图片或截图“穿”在数字版自己身上,且能将静态图片转换为AI生成的视频,让用户更真切地感受服装上身效果。应用已在美国地区的iOS和安卓平台上线,主要功能包括虚拟试穿、生成效果图和视频及保存和分享造型。Doppl能用在在线购物减少退货风险、探索时尚风格、社交分享、二手交易预览效果及个人形象管理等多种场景。 Doppl的主要功能 虚拟试穿:用户上传全身照,将服装图片或截图映射到自己的数字形象上,实现虚拟试穿。 ... --- ---