“agent”一词令人沮丧,GPT-4级模型已不值一提,大神程序员盘点「大模型的2024」
专家普遍认为,2024 年是“AGI 元年。这一年,大模型行业发生了翻天覆地的变化: OpenAI 的 GPT-4 已不再望尘莫及;图像、视频生成模型的作品愈发逼真;多模态大语言模型、推理模型、智能体(agent)取得突...
专家普遍认为,2024 年是“AGI 元年。这一年,大模型行业发生了翻天覆地的变化: OpenAI 的 GPT-4 已不再望尘莫及;图像、视频生成模型的作品愈发逼真;多模态大语言模型、推理模型、智能体(agent)取得突...
发现大家对数字人的兴趣和需求挺大的。 最近非常多的小伙伴,因为之前写的数字人文章,私信我聊到数字人的问题。 这里,再盘一下,挑选 4 款,分享给你们。 这 5 款,主要是公模数字人为主(公共形象)。如果你需...
综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统,基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统,其最大特点是采用创新的无语义标记架构设计,无需依赖Whisper...
文档图像理解技术旨在让计算机能够像人类一样理解文档图像中的内容。它主要涉及对扫描或拍摄得到的文档图像(如纸质合同、书籍页面、发票等)进行分析、处理和理解,提取其中有价值的信息,如文字、表格、图表等...
最近接手了一个需要使用 Stable Diffusion 的项目,需要重新部署一套 SD 环境。这跟我之前的SD部署又不太一样,部署过程中遇到一些问题,总结出一个比较完美的安装方案,在这里和大家分享一下。 项目地址:https:...
冬天来了,家里下雪了吗? 没下也没关系,现在下了——点击这里 怎么做的 答:通过 GLM-Zero,也就是智谱前两天发的。看起来像智谱广告一样...同样推荐试试 DeepSeek Chat 的“深度思考”。 我用的 Pro...
每一个知识点都有面向教师和学生的不同内容。 2024年,麻省理工学院(Massachusetts Institute of Technology,MIT)推出的Day of AI项目火爆全球,这是一个针对K12的免费学习平台,有AI课程、教程...
综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语音内容并转换为文字。特别之处...
综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支持文档导入和语义检索。D...
FaceFusion 更新到了3.1.1版本。本次更新增加了批量功能、换脸模型、以及全新的UI界面,这次的批量跟上个版本的job工作流形式不同,操作更方便简单。 本文使用 FaceFusion 某个封装客户端讲解,获取更多封装好的...