
Second Me:本地训练拥有个人记忆和习惯的AI分身
综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智能助手。它最大的特点是所有数...
综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智能助手。它最大的特点是所有数...
综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合微调的结构化数据集。开...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心目标是提...
综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托管于GitHub,旨在为研究者和开发者提供灵活的模型微...
综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于构建...
综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepseek-R1、QwQ-32B...
综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Prompt Optimization)框架,彻底告别传统微调的繁琐流程,...
综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训练框架,加速人工智能领域的研究进程,特别是向通...
综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型数据,如逻辑推理...
综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI能够显著减少模型训练和推理...
综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyuan Video 、 FLUX 和 SDXL 等多种模...
综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Llama、GPT4o和Mixtral等模型...
综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 Florence-2、PaliGemma ...
综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运行LLM推理应用程序。LlamaE...
综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的主要特点是能够显著减少内存使用和加快训练速...
综合介绍 Bakery是一个专为AI初创公司、机器学习工程师和研究人员设计的平台,提供简单高效的AI模型微调和货币化服务。用户可以通过Bakery访问社区驱动的数据集,创建或上传自己的数据集,微调模型设置,并在市场...
综合介绍 NVIDIA Garak 是一款开源工具,专门用于检测大型语言模型(LLM)的漏洞。它通过静态、动态和自适应探测,检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱点。Garak 类似...
综合介绍 ModelScope Swift(简称MS-Swift)是一个高效的轻量级基础设施,专为大模型(LLM)和多模态大模型(MLLM)的微调、推理、评估和部署而设计。该框架支持超过400种LLM和100多种MLLM,提供了从模型训练、评...
综合介绍 LLaMA-Factory 是一个统一的高效微调框架,支持对100多种大型语言模型(LLMs)进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面,用户无需编写代码即可完成模型微调。该框架集成了多种先进的训...