Tifa-Deepsex-14b-CoT：擅长角色扮演与超长小说生成的大模型

4.8K 00

综合介绍

Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型，专注于角色扮演、小说文本生成以及思维链（Chain of Thought, CoT）推理能力的提升。该模型通过多阶段训练和优化，解决了原始模型在长文本生成连贯性不足和角色扮演能力较弱的问题，特别适合需要长程上下文关联的创作场景。模型通过融合高质量数据集和增量预训练，显著增强了上下文关联能力，减少答非所问的情况，并消除了中英混杂现象，增加了特定领域的词汇量，使其在角色扮演和小说生成中表现更出色。此外，模型支持128k超长上下文，适用于需要深度对话和复杂创作的场景。

这是一个针对长篇小说和角色扮演场景深度优化的 Deepseek-R1-14B 版本，并且拥有一个简单的安卓客户端提供下载。目前升级 Deepsex2 版。

功能列表

支持角色扮演场景的深度对话，生成符合角色性格和背景的回应。
提供小说文本生成能力，能够创作连贯的长篇故事或情节。
具备思维链（CoT）推理能力，适合需要逻辑推导和复杂问题解决的场景。
支持128k超长上下文，确保长文本生成的高连贯性和一致性。
优化后的模型减少了拒绝回答现象，安全性适度保留，适用于多样化的创作需求。
提供多种量化版本（如F16、Q8、Q4），适配不同硬件环境，方便用户部署和使用。

使用帮助

安装与部署

Tifa-Deepsex-14b-CoT 模型托管在 Hugging Face 平台上，用户需要根据自己的硬件环境和需求选择合适的模型版本（例如 F16、Q8、Q4）。以下是详细的安装和部署流程：

1. 下载模型

访问 Hugging Face 模型页面：https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT。
根据硬件支持选择合适的量化版本（如 Q4_K_M.gguf）。点击对应文件，下载模型权重。
如果需要使用 Demo APK，可以直接下载官方提供的演示程序（需要手动导入角色卡并选择自定义 API）。

2. 环境准备

确保已安装 Python 环境（推荐 Python 3.8 或以上）。
安装必要的依赖库，例如 transformers、huggingface_hub 等。可以通过以下命令安装：
```
pip install transformers huggingface-hub
```
如果使用 GGUF 格式模型，建议安装 llama.cpp 或相关支持库。可以通过以下命令克隆并编译：
```
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make
```

3. 模型加载

使用 transformers 加载模型：

from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "ValueFX9507/Tifa-Deepsex-14b-CoT"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

如果使用 GGUF 格式，可以通过 llama.cpp 运行：
```
./main -m Tifa-Deepsex-14b-CoT-Q4_K_M.gguf --color -c 4096 --temp 0.7 --repeat_penalty 1.1 -n -1 -p "你的提示词"
```
其中，-c 4096 可根据需要调整为更大的上下文长度（如 128k），但需注意硬件限制。

4. 配置与优化

确保返回的上下文去除思考标签（如），以避免影响模型输出。可以通过以下代码实现：
```
content = msg.content.replace(/<think>[\s\S]*?<\/think>/gi, '')
```
如果使用前端界面，需手动修改前端代码以适配上下文处理，具体参考官方示例模板。

功能操作流程

角色扮演功能

输入角色设定：在提示词中明确角色背景、性格、对话场景等。例如：

你是一个勇敢的冒险者，名叫蒂法，正在探索一座神秘的古城。请描述你的冒险经历，并与遇到的 NPC 进行对话。

生成回应：模型会根据角色设定生成符合性格的对话或叙述。用户可以持续输入，模型会保持上下文连贯性。
调整参数：通过调整 temperature（控制生成文本的随机性）和 repeat_penalty（控制重复内容）来优化输出效果。

小说生成功能

设定故事背景：提供故事的开头或大纲，例如：

在一个遥远的王国，有一位年轻的法师试图解开时间的秘密。请续写这个故事。

生成故事：模型会根据提示生成连贯的长篇故事，支持多段落输出。
长上下文支持：得益于128k上下文支持，用户可以输入较长的故事背景，模型仍能保持情节一致性。

思维链（CoT）推理

输入复杂问题：例如：

如果一个城市每天产生100吨垃圾，其中60%可回收，40%不可回收，但回收设施每天只能处理30吨可回收垃圾，剩余的可回收垃圾如何处理？

生成推理过程：模型会逐步分析问题，提供逻辑清晰的解答，并支持长程推理。

注意事项

硬件要求：模型运行需要较高的显存支持，建议使用至少 16GB 显存的 GPU 或高性能 CPU。
安全性与合规性：模型在训练时保留了一定的安全性设置，用户需确保使用场景符合相关法律法规。
上下文管理：在使用超长上下文时，建议分段输入提示词，以避免超出硬件限制。

通过以上步骤，用户可以轻松上手 Tifa-Deepsex-14b-CoT 模型，无论是进行角色扮演、小说创作还是复杂推理，都能获得高质量的生成结果。

Tifa-Deepsex-14b-CoT 版本区别

Tifa-Deepsex-14b-CoT

验证模型，测试RL奖励算法对角色扮演数据的影响，初版输出灵活但不受控制，仅供研究使用。

Tifa-Deepsex-14b-CoT-Chat

采用标准数据训练，使用成熟RL策略，附加防重复强化学习，适合正常使用。输出文本质量正常，少数情况下思维发散。
增量训练0.4T小说内容，100K由TifaMax生成的SFT数据，10K由DeepseekR1生成的SFT数据，2K高质量人工数据。
30K由TifaMax生成的DPO强化学习数据，用于防止重复，增强上下文关联，提升政治安全性。

Tifa-Deepsex-14b-CoT-Crazy

大量使用RL策略，主要采用671B满血R1蒸馏的数据，输出发散性高，继承R1优点，也继承了R1的危害性，文学性能佳。
增量训练0.4T小说内容，40K由TifaMax生成的SFT数据，60K由DeepseekR1生成的SFT数据，2K高质量人工数据。
30K由TifaMax生成的DPO强化学习数据，用于防止重复，增强上下文关联，提升政治安全性。10K由TifaMax生成PPO数据，10K由DeepseekR1生成PPO数据。