让 ChatGPT 解释 LoRA 所有参数

1.8K 00

设置	选项	描述	缺点
base_model	基本模型文件的字符串路径	此选项指定基本模型文件的路径，用作训练新模型的起点。模型将在提供的新数据上进行微调。	选择与任务和数据相关的基本模型非常重要，否则微调过程可能不会提高性能。
img_folder	包含训练图像的文件夹的字符串路径	此选项指定包含用于训练模型的训练图像的文件夹路径。	训练图像的质量和数量可以极大地影响模型的性能。拥有足够多样化、高质量的图像对模型的学习至关重要。
output_folder	保存输出模型的文件夹的字符串路径	此选项指定训练后保存输出模型的文件夹路径。	输出文件夹应有足够的存储空间来保存模型文件。定期备份模型文件以防数据丢失导致工作丢失非常重要。
change_output_name	布尔值	指定是否更改训练模型的输出名称。如果设置为 True，则输出名称将更改，否则将保持不变。	N/A
save_json_folder	字符串	训练模型的 json 文件将被保存的文件夹路径。	N/A
load_json_path	字符串	将用于加载模型参数的 json 文件的路径。这对于从先前的检查点继续训练很有用。	load_json_path 指定的文件必须存在且为有效的 json 文件。
json_load_skip_list	字符串列表	指定不在保存的 .json 文件中加载的模型配置中的键的字符串列表。	如果不小心将所需的键包含在 json_load_skip_list 中，模型可能无法按预期工作。
multi_run_folder	字符串	存储多次训练运行结果的文件夹名称，格式为 {multirun_folder}/run{run_number}/。	如果多次运行时不更改 multi_run_folder 名称，先前的结果将被覆盖。
save_json_only	布尔值	如果设置为 True，则仅保存模型配置文件（.json 格式），而不是完整的模型检查点。	仅靠 .json 文件无法恢复模型，如果 save_json_only 设置为 True，则必须从头开始训练。
caption_dropout_rate	0 到 1 之间的浮点数	指定训练期间标题的随机丢弃率。	如果此值设置得太高，标题中的重要信息可能会丢失，导致结果质量降低。
caption_dropout_every_n_epochs	整数	指定训练期间执行标题丢弃的频率（以轮数计）。	如果此值设置得太高，模型在训练期间可能无法接触到足够的标题多样性，导致过拟合。如果设置得太低，模型可能没有足够的时间从标题中学习就被丢弃了。
caption_tag_dropout_rate	0 到 1 之间的浮点数	控制训练模型时标题的随机丢弃率。高值意味着更多标题将被丢弃，而低值意味着较少标题将被丢弃。	设置高值可能导致标题中的重要信息丢失，导致结果质量降低。
net_dim	整数	此设置确定模型网络架构中隐藏单元的数量。较大的 net_dim 值会导致模型更复杂、容量更大，但也需要更多的计算资源，并可能导致过拟合，如果模型过大而训练数据不足。	过拟合，增加计算资源
alpha	浮点数	此设置确定训练期间使用的学习能力。较大的 alpha 值可以导致更快的收敛，但如果设置得太高，也可能导致模型过度拟合或收敛到次优解。较小的 alpha 值可能导致收敛速度慢或根本无法收敛。	次优解，收敛速度慢
scheduler	字符串	此设置确定训练期间使用的学习率计划。常见选择包括 "step"、"cosine" 和 "plateau"。步进计划在指定的迭代次数后按固定因子减少学习率，而余弦计划则按余弦函数减少学习率。高原计划在验证损失停止改善时降低学习率。	次优解，收敛速度慢，选择适当的计划难度大
cosine_restarts	整数	余弦退火计划应该重启的次数。更多的重启次数允许学习率更频繁地变化，减少了陷入次优学习率的风险。	增加重启次数可能导致学习率变化更频繁，这可能使训练过程更不稳定，更难以调整。
scheduler_power	浮点数	调度器的幂参数。较大的幂值意味着学习率变化更慢。	设置较高的幂值可能导致学习率太慢而无法在合理的时间内收敛。另一方面，设置较低的幂值可能导致学习率过于激进，导致模型过拟合训练数据。
warmup_lr_ratio	浮点数	在热身期间，最大学习率与初始学习率的比率。学习率从初始值逐渐增加到最大值。	高热身学习率比率可能导致模型收敛缓慢或根本无法收敛。另一方面，低热身学习率比率可能导致学习率太低而无法有效训练模型。
learning_rate	浮点数	此选项设置用于训练模型的优化器的学习率。它决定了优化器更新模型参数的步长。默认值为 0.0001。	高学习率可能导致模型过快收敛到次优解，而低学习率可能导致训练过程缓慢，可能收敛到较差的解。学习率必须仔细设置以平衡这些权衡。
text_encoder_lr	浮点数	此选项特别设置模型文本编码器组件的学习率。如果此值设置为与 learning_rate 不同的值，它允许特别微调文本编码器。	将 text_encoder_lr 设置为与 learning_rate 不同的值可能导致过拟合到文本编码器，可能无法很好地泛化到新数据。
unet_lr	浮点数	此选项特别设置模型 UNet 组件的学习率。如果此值设置为与 learning_rate 不同的值，它允许特别微调 UNet。	将 unet_lr 设置为与 learning_rate 不同的值可能导致过拟合到 UNet，可能无法很好地泛化到新数据。
num_workers	整数	指定加载数据的工作线程数。增加工作线程数可以加快数据加载和训练速度，但也可能增加内存使用。	太多工作线程可能导致内存溢出并减慢训练过程。
persistent_workers	布尔值	确定是否使用持久工作线程。持久工作线程维护数据样本队列，允许更有效地加载数据。	可能导致系统性能下降，特别是在内存或磁盘 I/O 等资源有限的系统上。
batch_size	整数	指定每个批次中包含的样本数量。较大的批次大小可以导致更有效的训练，但也可能增加内存使用并减慢收敛速度。	太大的批次大小可能导致内存溢出并减慢训练过程，而太小的批次大小可能导致收敛缓慢。
num_epochs	整数	指定应该对训练数据进行多少次完整的遍历。更多的轮数将导致更准确的模型，但也需要更多时间来运行。	更长的培训时间，如果使用太多轮次，可能会过度拟合数据。
save_every_n_epochs	整数	指定训练期间模型应该保存的频率。例如，将此设置为 5 意味着每 5 轮保存一次模型。	占用更多存储空间，因为模型将更频繁地保存。
shuffle_captions	布尔值	指定训练数据是否应该在轮次之间进行洗牌。洗牌可以帮助防止模型陷入局部最小值，但也可能使训练变得不一致。	如果训练数据的顺序具有重要意义，可能导致训练不一致。
keep_tokens	整数	文本语料库中用于训练的最频繁的 Token 数量。出现频率低于 keep_tokens 的 Token 将被替换为未知 Token ("")。较小的值将导致词汇表大小减小，可能减少模型的内存需求，但也可能导致信息丢失。	如果 keep_tokens 设置得太低，可能会导致信息丢失。
max_steps	整数	训练期间要采取的最大步骤数。一旦模型看到 max_steps 批次的数据，训练将停止。	如果 max_steps 设置得太低，模型可能没有完全训练。如果设置得太高，训练可能需要很长时间。
tag_occurrence_txt_file	字符串	包含标签出现信息的文本文件路径。标签出现信息用于在训练期间加权损失函数。	如果标签出现信息不可用或未正确指定，模型可能无法正确训练。
sort_tag_occurrence_alphabetically	真或假	如果设置为真，tag_occurrence_txt_file 中的标签将按字母顺序排序。此选项可以用于保持标签顺序的一致性，并确保相似的标签被分组在一起。	N/A
train_resolution	整数值	此值确定训练图像的分辨率。更高的分辨率将产生更详细的图像，但也需要更多的内存和计算资源。	提高分辨率可以显著增加训练时间和内存需求，特别是如果训练数据很大。
min_bucket_resolution	整数值	此值确定用于训练的桶的最小大小。较小的桶大小可以导致更快的训练过程，但也可能引起过拟合或降低结果质量。	过度降低桶大小可能导致训练效率降低和结果质量降低。
max_bucket_resolution	整数	指定训练数据的最大图像分辨率。如果训练数据的分辨率大于 max_bucket_resolution，则会对其进行下采样。	max_bucket_resolution 的值过高可能导致训练时间更长和内存使用更高，而值过低可能会降低生成图像的质量。
lora_model_for_resume	字符串	指定一个预训练的 LoRA 模型的路径，该模型将被用来从先前的检查点恢复训练。	从预训练模型恢复训练可能会导致过拟合，如果新训练数据与原始训练数据明显不同。
save_state	布尔值	指定是否在每个轮次后保存训练状态。如果设置为 True，则训练状态将保存在 lora_model_for_resume 文件中。	频繁保存训练状态可能导致训练时间更长和磁盘使用更高。
load_previous_save_state	真或假	指定在训练期间是否加载模型的先前保存状态。如果设置为 True，则训练将从先前保存的状态恢复。如果设置为 False，则训练将从头开始。	如果先前保存的状态不可用或已损坏，训练将无法恢复，训练将从头开始，这可能导致更长的训练时间和性能下降。
training_comment	字符串	指定将添加到保存模型名称中的注释。这可以用来区分用不同设置或参数训练的不同模型。	无
unet_only	真或假	指定是否仅训练模型的 UNet 组件。如果设置为 True，则仅训练模型的 UNet 组件，文本编码器组件将不会被训练。如果设置为 False，则模型的 UNet 和文本编码器组件都将被训练。	仅训练模型的 UNet 组件可能导致性能低于同时训练两个组件，因为文本编码器组件是模型的重要组成部分，有助于将文本信息编码到训练过程中。
text_only	真或假	确定是否仅在文本上训练模型或在文本和图像上训练。将此设置为 True 将导致训练更快但图像生成质量较低。将此设置为 False 将导致训练更慢但图像生成质量更高。	如果设置为 True，生成的图像将不如设置为 False 时准确或详细。
reg_img_folder	字符串	用于训练的图像目录的路径。	此选项仅在 text_only 设置为 False 时相关。如果没有提供图像，模型将仅在文本上训练，并且无法生成图像。
clip_skip	真或假	确定模型是否应该在训练数据中跳过剪辑过的图像。剪辑过的图像是那些在尺寸上要么太小要么太大，与 train_resolution 相比。	如果设置为 True，模型可能无法从训练数据中的某些图像中学习。如果设置为 False，训练可能需要更长时间，因为模型需要处理所有图像，即使是剪辑过的图像。
test_seed	整数	指定测试数据生成和评估的随机种子。设置种子确保每次运行脚本时都会生成相同的测试数据。	不同的种子可能导致不同的测试数据和评估结果，使得跨运行比较性能变得困难。
prior_loss_weight	浮点数	指定先前损失项在总体损失计算中的权重。先前损失项用于鼓励模型生成与训练数据的先前分布相似的输出。	将权重设置得太高可能导致输出与先前过于相似，降低模型的创造力。将权重设置得太低可能导致输出与先前相去甚远，不够连贯。
gradient_checkpointing	布尔值	指定是否使用梯度检查点来减少训练期间的内存使用。梯度检查点涉及在反向传播期间选择性地保存和重新加载激活，这减少了内存使用，但以增加计算时间为代价。	使用梯度检查点可能会减慢训练过程，对于小型模型或具有足够内存的设备可能不必要。
gradient_acc_steps	整数	指定训练期间梯度累积的步数。增加此值可以减少内存使用并帮助训练稳定性。	梯度_acc_steps 的较高值增加了操作数量，可能会减慢训练过程。
mixed_precision	布尔值	指定是否使用混合精度训练，使用低精度数据类型来加速训练。	使用混合精度训练可能导致准确性降低并可能导致训练不稳定。
save_precision	浮点数	指定保存模型权重时使用的精度。通常根据训练期间使用的精度设置为 32 或 16。	较低的精度值在保存模型权重时可能会导致信息丢失，导致准确性降低。
save_as	字符串	指定保存训练模型的文件格式。支持的格式有：ckpt、safetensors、pt、bin。	文件格式应与 LoRA 模型将用于的 Stable Diffusion AI 艺术模型类型相匹配。
caption_extension	字符串	指定包含训练数据标题的文本文件的扩展名。	扩展名必须与标题文件的实际文件扩展名匹配。
max_clip_token_length	整数	指定单个标题中允许的最大 Token 数量。超出此长度的标题将在训练期间被跳过。	设置较高值可能会增加训练期间的内存使用。设置较低值可能会导致标题中的重要信息丢失。
buckets	整数列表	指定桶算法的大小。例如，如果 buckets 设置为 [5,10,15]，则数据将被分为三个桶，长度为 5 Token 的数据在一个桶中，长度为 10 Token 的数据在另一个桶中，长度为 15 Token 的数据在第三个桶中。	桶的数量和桶的大小必须仔细选择以取得良好结果。如果桶的数量太小，模型可能表现不佳，而如果桶的数量太大，模型可能会过拟合。
xformers	字符串列表	指定训练期间使用的变换器。变换器可以用来应用数据增强技术，如随机裁剪、翻转、旋转等。	变换器的选择可以极大地影响模型的性能，因此选择最适合特定任务的变换器非常重要。
use_8bit_adam	布尔值	指定是否使用 8 位 Adam 优化器。此选项可以用来减少训练过程的内存需求。	如果此选项设置为 True，训练过程的内存需求将减少，但训练可能会变慢，模型可能准确性较低。
cache_latents	布尔值	如果设置为 True，则训练数据的潜在值将被缓存以加快训练速度。这可以减少训练模型的时间，但也可能使用更多内存并增加开始训练的时间。	增加内存使用和启动时间变慢。
color_aug	布尔值	如果设置为 True，则在训练期间执行颜色增强。这可以增加训练数据的多样性，但也可能减慢训练速度。	训练时间变慢。
flip_aug	布尔值	如果设置为 True，则在训练期间执行翻转增强。这可以增加训练数据的多样性，但也可能减慢训练速度。	训练时间变慢。
random_crop	真/假	指定是否对训练图像应用随机裁剪。如果设置为 True，则训练图像将在输入模型之前随机裁剪到指定大小。	使用随机裁剪可以增加训练数据的多样性，但它也增加了训练的计算成本，并可能减慢训练过程。
vae	真/假	指定是否使用变分自编码器（VAE）作为模型的主干。如果设置为 True，则模型将作为 VAE 进行训练。	使用 VAE 可以提供数据的更灵活表示，但它也可以增加训练的难度并可能需要更多的微调。
no_meta	真/假	指定是否从训练过程中排除元数据（例如，类别标签、属性等）。如果设置为 True，则模型在训练期间将无法访问任何元数据。	排除元数据可以简化训练过程，但它可能导致模型质量降低，无法利用元数据提供的额外信息。
log_dir	字符串	存储训练日志文件的目录路径。	如果目录已存在且不为空，训练可能会覆盖存储在该目录中的先前日志，导致数据丢失。
bucket_reso_steps	整数	增加图像分辨率的步数。图像分辨率从 max_bucket_resolution 开始，并在每个步骤后增加 2 的因子。	将此值设置得太高可能导致内存错误和训练时间更长，因为图像大小在每个步骤中增加。将此值设置得太低可能导致图像质量降低。
bucket_no_upscale	布尔值	表示是否限制图像分辨率增加超过其原始大小。	如果设置为 True，则图像分辨率不会增加超过其原始大小，这可能导致图像质量降低。
v2	真或假	此设置指定是否使用模型架构的版本 2。	使用不同版本的模型架构可能会改变生成艺术的质量和性能，因此很重要进行实验和比较结果，以确定给定任务的最佳选项。
v_parameterization	spectral_norm"、"instance_norm" 或 "batch_norm"	此设置确定如何在训练期间对模型的参数进行规范化。谱规范化、实例规范化和批量规范化是防止过拟合的不同方法，每种方法在计算成本和性能方面都有自己的权衡。	选择错误的规范化方法可能会对模型的性能产生负面影响，因此很重要尝试不同的选项，以确定哪个最适合给定任务。