
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集
综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型数据,如逻辑推理...
综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型数据,如逻辑推理...
综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI能够显著减少模型训练和推理...
中国的 Cursor ! 字节跳动推出 Trae ,内置 Claude 3.5 Sonnet 和 GPT-4o 等强大AI模型! 想一键批量给图片加水印? 想定制专属Excel 自动化脚本? 想十分钟搭建一个在线简历网站? 这些,Trae AI 都能帮你免费实现! 无需任何编程基础,立刻体验 Trae AI,让 AI 助你轻松开发实用工具,效率提升 10 倍! 点击免费试用,告别重复劳动,迎接效率爆发,让你的能力,即刻变现!
综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyuan Video 、 FLUX 和 SDXL 等多种模...
综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Llama、GPT4o和Mixtral等模型...
综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 Florence-2、PaliGemma ...
综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运行LLM推理应用程序。LlamaE...
综合介绍 Unsloth 是一个开源项目,旨在提供高效的微调和训练大语言模型(LLMs)的工具。该项目支持多种知名模型,包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的主要特点是能够显著减少内存使用和加快训练速...
综合介绍 Bakery是一个专为AI初创公司、机器学习工程师和研究人员设计的平台,提供简单高效的AI模型微调和货币化服务。用户可以通过Bakery访问社区驱动的数据集,创建或上传自己的数据集,微调模型设置,并在市场...
综合介绍 NVIDIA Garak 是一款开源工具,专门用于检测大型语言模型(LLM)的漏洞。它通过静态、动态和自适应探测,检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱点。Garak 类似...
综合介绍 ModelScope Swift(简称MS-Swift)是一个高效的轻量级基础设施,专为大模型(LLM)和多模态大模型(MLLM)的微调、推理、评估和部署而设计。该框架支持超过400种LLM和100多种MLLM,提供了从模型训练、评...
综合介绍 LLaMA-Factory 是一个统一的高效微调框架,支持对100多种大型语言模型(LLMs)进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面,用户无需编写代码即可完成模型微调。该框架集成了多种先进的训...
综合介绍 Petals 是一个由 BigScience Workshop 开发的开源项目,旨在通过分布式计算的方式运行大型语言模型(LLMs)。用户可以在家中使用消费级 GPU 或 Google Colab 运行和微调 LLMs,如 Llama 3.1、Mixtral、F...