Позвольте ChatGPT интерпретировать все параметры LoRA

устанавливатьопции (как в настройках компьютерного программного обеспечения)описаниянедостатки
базовая_модельСтроковый путь к файлу базовой моделиЭта опция указывает путь к файлу базовой модели, который будет использоваться в качестве отправной точки для обучения новой модели. Модель будет точно настроена на новых данных.Важно выбрать базовую модель, соответствующую задаче и данным, иначе процесс тонкой настройки может не улучшить производительность.
папка img_folderСтроковый путь к папке, содержащей учебные изображенияЭтот параметр указывает путь к папке, содержащей тренировочные изображения, используемые для обучения модели.Качество и количество обучающих изображений может значительно повлиять на производительность модели. Наличие достаточно разнообразных и качественных изображений имеет решающее значение для обучения модели.
папка_выводаСтроковый путь к папке, в которой хранится выходная модельЭтот параметр задает путь к папке, в которую сохраняется выходная модель после обучения.В выходной папке должно быть достаточно места для сохранения файлов модели. Важно регулярно создавать резервные копии файлов модели, чтобы предотвратить потерю данных, которая может привести к потере работы.
change_output_nameбулевоУказывает, следует ли изменять выходное имя обучающей модели. Если установлено значение True, выходное имя будет изменено, в противном случае оно останется неизменным.Н/Д
save_json_folderстрока (информатика)Путь к папке, в которой будут сохранены json-файлы обучающей модели.Н/Д
load_json_pathстрока (информатика)Путь к json-файлу, который будет использоваться для загрузки параметров модели. Это полезно для продолжения обучения с предыдущей контрольной точки.Файл, указанный load_json_path, должен существовать и быть правильным json-файлом.
json_load_skip_listсписок строкУказывает список строк для ключей в конфигурации модели, которые не загружаются в сохраненный .json-файл.Если вы случайно включите необходимые ключи в json_load_skip_list, модель может работать не так, как ожидалось.
multi_run_folderстрока (информатика)Имя папки, в которой хранятся результаты нескольких тренировок, в формате {multirun_folder}/run{run_number}/.Если выполнить несколько запусков без изменения имени папки multi_run_folder, предыдущие результаты будут перезаписаны.
сохранять_json_onlyбулевоЕсли установлено значение True, сохраняется только файл конфигурации модели (формат .json), а не все контрольные точки модели.Сам по себе файл .json не восстановит модель, и если для параметра save_json_only установлено значение True, вам придется начать обучение с нуля.
caption_dropout_rateЧисла с плавающей точкой от 0 до 1Задает частоту случайного отбрасывания названий во время обучения.Если это значение слишком велико, важная информация в заголовке может быть потеряна, что приведет к снижению качества результатов.
caption_dropout_every_n_epochsцелое число (матем.)Укажите частоту (в раундах), с которой происходит сброс титулов во время обучения.Если установить слишком высокое значение, модель может не получить достаточного разнообразия заголовков во время обучения, что приведет к перестройке. Если установить слишком низкое значение, модель может не успеть обучиться на заголовках, прежде чем будет отброшена.
caption_tag_dropout_rateЧисла с плавающей точкой от 0 до 1Управляет частотой случайного отбрасывания названий при обучении модели. Высокое значение означает, что будет отброшено больше названий, а низкое - меньше.Установка высоких значений может привести к потере важной информации в заголовке, что приведет к снижению качества результатов.
net_dimцелое число (матем.)Этот параметр определяет количество скрытых блоков в сетевой архитектуре модели. Большие значения net_dim приводят к созданию более сложной и крупной модели, но также требуют больше вычислительных ресурсов и могут привести к перестройке модели, если она слишком велика, а обучающих данных недостаточно.Переоценка, увеличение вычислительных ресурсов
альфаплавающая точкаЭта настройка определяет способность к обучению, используемую во время тренировки. Большие значения альфа могут привести к ускорению сходимости, но если установить их слишком высокими, то это может привести к чрезмерной подгонке модели или сходимости к неоптимальным решениям. Меньшие значения альфа могут привести к медленной сходимости или вообще не сходиться.Субоптимальное решение, медленная сходимость
планировщикстрока (информатика)Этот параметр определяет график скорости обучения, используемый во время тренировки. Обычно выбираются следующие варианты: "шаг", "косинус" и "плато". План "шаг" уменьшает скорость обучения на фиксированный коэффициент после определенного количества итераций, а план "косинус" уменьшает скорость обучения на косинусную функцию. План "плато" снижает скорость обучения, когда потери при валидации перестают улучшаться.Субоптимальное решение, медленная сходимость, трудности с выбором подходящего плана
cosine_restartsцелое число (матем.)Количество перезапусков схемы косинусного отжига. Большее число перезапусков позволяет чаще менять скорость обучения, снижая риск попадания в неоптимальную скорость обучения.Увеличение числа перезапусков может привести к более частым изменениям скорости обучения, что сделает процесс обучения более нестабильным и трудно корректируемым.
мощность планировщикаплавающая точкаПараметр мощности планировщика. Большие значения мощности означают, что скорость обучения изменяется медленнее.Установка более высоких значений мощности может привести к тому, что скорость обучения будет слишком медленной, чтобы сходиться за разумное время. С другой стороны, установка более низких значений мощности может привести к слишком агрессивной скорости обучения, в результате чего модель будет чрезмерно соответствовать обучающим данным.
прогрев_lr_ratioплавающая точкаОтношение максимальной скорости обучения к начальной скорости обучения в период прогрева. Скорость обучения постепенно увеличивается от начального значения до максимального.Высокий коэффициент скорости обучения при разминке может привести к тому, что модель будет сходиться медленно или не сходиться вообще. С другой стороны, низкий коэффициент скорости обучения при прогреве может привести к тому, что скорость обучения будет слишком низкой для эффективного обучения модели.
скорость обученияплавающая точкаЭта опция задает скорость обучения оптимизатора, используемого для обучения модели. Она определяет размер шага, с которым оптимизатор обновляет параметры модели. Значение по умолчанию - 0,0001.Высокая скорость обучения может привести к тому, что модель слишком быстро сходится к неоптимальному решению, в то время как низкая скорость обучения может привести к медленному процессу обучения, в результате которого модель сходится к плохому решению. Скорость обучения должна быть тщательно настроена, чтобы сбалансировать эти компромиссы.
text_encoder_lrплавающая точкаЭта опция задает скорость обучения компонента текстового кодировщика модели. Если это значение отличается от параметра learning_rate, это позволяет произвести специальную тонкую настройку кодировщика текста.Установка значения text_encoder_lr, отличного от learning_rate, может привести к чрезмерной подгонке кодировщика текста и плохому обобщению на новые данные.
unet_lrплавающая точкаЭта опция задает скорость обучения компонента UNet в модели. Если это значение отличается от значения learning_rate, это позволяет более точно настроить UNet.Установка unet_lr в значение, отличное от learning_rate, может привести к чрезмерной подгонке UNet и плохому обобщению на новые данные.
num_workersцелое число (матем.)Указывает количество рабочих потоков для загрузки данных. Увеличение числа рабочих потоков может ускорить загрузку данных и обучение, но при этом может увеличить расход памяти.Слишком большое количество рабочих потоков может привести к переполнению памяти и замедлить процесс обучения.
постоянные_работникибулевоОпределите, нужно ли использовать постоянные рабочие потоки. Постоянные рабочие потоки поддерживают очередь образцов данных, что позволяет загружать данные более эффективно.Может привести к снижению производительности системы, особенно в системах с ограниченными ресурсами, такими как память или дисковый ввод-вывод.
размер партиицелое число (матем.)Определяет количество образцов, включаемых в каждую партию. Большие размеры партии могут привести к более эффективному обучению, но могут также увеличить объем памяти и замедлить сходимость.Слишком большой размер партии может привести к переполнению памяти и замедлить процесс обучения, а слишком маленький размер партии может привести к медленной сходимости.
num_epochsцелое число (матем.)Указывает, сколько полных обходов должно быть выполнено для обучающих данных. Большее количество обходов приведет к созданию более точной модели, но также потребует больше времени на выполнение.Более длительное время обучения может привести к чрезмерной подгонке данных, если используется слишком много раундов.
сохранять_каждое_несколько_эпохцелое число (матем.)Укажите, как часто модель должна сохраняться во время обучения. Например, значение 5 означает, что модель будет сохраняться каждые 5 раундов.занимают больше места в памяти, поскольку модели сохраняются чаще.
shuffle_captionsбулевоУказывает, следует ли перемешивать обучающие данные между раундами. Перемешивание может помочь предотвратить попадание модели в локальные минимумы, но также может сделать обучение непоследовательным.Если порядок обучающих данных значителен, это может привести к непоследовательности обучения.
keep_tokensцелое число (матем.)Корпус текстов, используемый для обучения наиболее частому Токен Количество. Токен с частотой встречаемости меньше keep_tokens будет заменен на неизвестный токен (""). Меньшее значение приводит к уменьшению объема словаря, что может снизить требования к памяти модели, но также может привести к потере информации.Если значение keep_tokens слишком мало, информация может быть потеряна.
max_stepsцелое число (матем.)Максимальное количество шагов, которое будет сделано во время обучения. Как только модель увидит пакет данных max_steps, обучение прекратится.Если значение max_steps слишком мало, модель может быть обучена не полностью. При слишком высоком значении обучение может занять много времени.
tag_occurrence_txt_fileстрока (информатика)Путь к текстовому файлу, содержащему информацию о встречаемости меток. Информация о встречаемости меток используется для взвешивания функции потерь во время обучения.Если метки содержат недоступную информацию или заданы неверно, возможно, модель обучена неправильно.
сортировать_теги_по_алфавитуистинный или ложныйЕсли установлено значение true, теги в файле tag_occurrence_txt_file будут отсортированы в алфавитном порядке. Эта опция может быть использована для сохранения последовательности тегов и обеспечения того, чтобы похожие теги были сгруппированы вместе.Н/Д
train_resolutionцелое значениеЭто значение определяет разрешение учебного изображения. Более высокое разрешение позволяет получить более детальные изображения, но также требует больше памяти и вычислительных ресурсов.Увеличение разрешения может значительно увеличить время обучения и требования к памяти, особенно если объем обучающих данных велик.
min_bucket_resolutionцелое значениеЭто значение определяет минимальный размер ведра, используемого для обучения. Меньший размер ведра может привести к ускорению процесса обучения, но также может вызвать перебор с подгонкой или снизить качество результатов.Чрезмерное уменьшение размера ковша может привести к снижению эффективности обучения и качества результатов.
максимальное_разрешение_ковшацелое число (матем.)Задает максимальное разрешение изображения в обучающих данных. Если разрешение обучающих данных больше, чем max_bucket_resolution, они будут уменьшены.Высокое значение max_bucket_resolution может привести к увеличению времени обучения и потреблению памяти, а низкое значение может снизить качество генерируемого изображения.
lora_model_for_resumeстрока (информатика)Указывает путь к предварительно обученной модели LoRA, которая будет использоваться для возобновления обучения с предыдущей контрольной точки.Возобновление обучения на основе предварительно обученной модели может привести к чрезмерной подгонке, если новые обучающие данные значительно отличаются от исходных.
сохранить_состояниебулевоУказывает, сохранять ли состояние обучения после каждого раунда. Если установлено значение True, состояние обучения будет сохранено в файле lora_model_for_resume.Частое сохранение состояний обучения может привести к увеличению времени обучения и повышению нагрузки на диск.
load_previous_save_stateистинный или ложныйУказывает, загружать ли ранее сохраненное состояние модели во время обучения. Если установлено значение True, обучение будет возобновлено с ранее сохраненного состояния. Если установлено значение False, обучение начнется с нуля.Если ранее сохраненное состояние недоступно или повреждено, обучение не будет восстановлено, и оно начнется с нуля, что может привести к увеличению времени обучения и снижению производительности.
учебный_комментарийстрока (информатика)Указывает комментарий, который будет добавлен к имени сохраненной модели. Это можно использовать для различения разных моделей, созданных с разными настройками или параметрами.не иметь
unet_onlyистинный или ложныйУказывает, следует ли обучать только компоненты UNet модели. Если установлено значение True, будет обучен только компонент UNet модели, а компонент кодировщика текста обучен не будет. Если установлено значение False, будут обучены оба компонента модели - UNet и кодировщик текста.Обучение только компонента UNet модели может привести к снижению производительности по сравнению с одновременным обучением обоих компонентов, поскольку компонент кодировщика текста является важной частью модели и помогает кодировать текстовую информацию в процессе обучения.
только текстистинный или ложныйОпределяет, обучать ли модель только на тексте или и на тексте, и на изображениях. Если установить значение True, обучение будет проходить быстрее, но качество изображения будет ниже. Установка значения False приведет к более медленному обучению, но более качественной генерации изображений.Если установить значение True, полученное изображение будет не таким точным и детализированным, как при значении False.
reg_img_folderстрока (информатика)Путь к каталогу изображений, используемых для обучения.Эта опция актуальна только в том случае, если для параметра text_only установлено значение False. Если изображения не указаны, модель будет обучаться только на тексте, и изображения генерироваться не будут.
clip_skipистинный или ложныйОпределяет, должна ли модель пропускать обрезанные изображения в обучающих данных. Обрезанные изображения - это те, размер которых либо слишком мал, либо слишком велик по сравнению с разрешением train_resolution.Если установлено значение True, модель может не обучаться на некоторых изображениях в обучающих данных. Если установить значение False, обучение может занять больше времени, поскольку модель должна обработать все изображения, даже отредактированные.
тестовое_семяцелое число (матем.)Задайте случайное зерно для генерации и оценки тестовых данных. Задание семени гарантирует, что при каждом запуске сценария будут генерироваться одни и те же тестовые данные.Разные семена могут приводить к разным тестовым данным и результатам оценки, что затрудняет сравнение производительности в разных прогонах.
предыдущий_потерянный_весплавающая точкаУкажите вес члена предварительных потерь в общем расчете потерь. Член предшествующих потерь используется для того, чтобы побудить модель генерировать результаты, схожие с предшествующим распределением обучающих данных.Слишком высокие значения весов могут привести к получению результатов, слишком похожих на предыдущие, что снизит творческий потенциал модели. Слишком низкое значение весов может привести к тому, что результат будет слишком далек от предыдущего и недостаточно целостен.
градиентное_определениебулевоУказывает, использовать ли градиентные контрольные точки для уменьшения использования памяти во время обучения. Градиентные контрольные точки включают выборочное сохранение и перезагрузку активаций во время обратного распространения, что сокращает использование памяти ценой увеличения времени вычислений.Использование градиентных контрольных точек может замедлить процесс обучения и может быть необязательным для небольших моделей или устройств с достаточным объемом памяти.
gradient_acc_stepsцелое число (матем.)Определяет количество шагов для накопления градиента во время обучения. Увеличение этого значения снижает потребление памяти и повышает стабильность обучения.Большие значения gradient_acc_steps увеличивают количество операций и могут замедлить процесс обучения.
смешанная точностьбулевоУказывает, следует ли использовать обучение со смешанной точностью, которое использует типы данных с низкой точностью для ускорения обучения.Обучение со смешанной точностью может привести к снижению точности и нестабильному обучению.
сохранять_точностьплавающая точкаУказывает точность, которую следует использовать при сохранении весов модели. Обычно устанавливается на 32 или 16 в зависимости от точности, используемой во время обучения.Более низкие значения точности могут привести к потере информации при сохранении весов модели, что приведет к снижению точности.
save_asстрока (информатика)Указывает формат файла, в котором будет сохранена обучающая модель. Поддерживаются следующие форматы: ckpt, safetensors, pt, bin.Формат файла должен соответствовать типу художественной модели Stable Diffusion AI, для которой будет использоваться модель LoRA.
caption_extensionстрока (информатика)Указывает расширение текстового файла, содержащего заголовки обучающих данных.Расширение должно соответствовать реальному расширению файла заголовка.
max_clip_token_lengthцелое число (матем.)Укажите максимальное количество Token, допустимое в одном заголовке. Заголовки, превышающие эту длину, будут пропускаться во время обучения.Установка больших значений может увеличить расход памяти во время обучения. Установка меньшего значения может привести к потере важной информации в заголовке.
ведрасписок целых чиселУкажите размер алгоритма buckets. Например, если для buckets установлено значение [5,10,15], данные будут разделены на три ведра, данные длиной 5 Token будут находиться в одном ведре, данные длиной 10 Token - в другом, а данные длиной 15 Token - в третьем.Для достижения хороших результатов необходимо тщательно выбирать количество ведер и их размер. Если количество ведер слишком мало, модель может работать плохо, а если количество ведер слишком велико, модель может быть перекорректирована.
xformersсписок строкУкажите трансформатор, который будет использоваться во время обучения. Трансформатор может быть использован для применения таких методов улучшения данных, как произвольное обрезание, переворачивание, вращение и т. д.Выбор трансформатора может значительно повлиять на производительность модели, поэтому важно выбрать трансформатор, который лучше всего подходит для конкретной задачи.
use_8bit_adamбулевоУказывает, использовать ли 8-битный оптимизатор Адама. Эта опция может быть использована для снижения требований к памяти для процесса обучения.Если установить значение True, требования к памяти для процесса обучения уменьшатся, но обучение может проходить медленнее, а модель может быть менее точной.
кэш_латентыбулевоЕсли установлено значение True, потенциальные значения обучающих данных кэшируются для ускорения обучения. Это может сократить время обучения модели, но может также использовать больше памяти и увеличить время начала обучения.Повышенное потребление памяти и замедленное время запуска.
цвет_угбулевоЕсли установлено значение True, во время обучения выполняется улучшение цвета. Это может увеличить разнообразие обучающих данных, но может и замедлить обучение.Время тренировок замедляется.
flip_augбулевоЕсли установлено значение True, то во время обучения выполняется усиление флипа. Это может увеличить разнообразие обучающих данных, но может и замедлить обучение.Время тренировок замедляется.
случайная_урожайностьПравда/ЛожьУказывает, следует ли применять случайную обрезку к обучающему изображению. Если установлено значение True, то перед вводом в модель обучающее изображение будет случайным образом обрезано до указанного размера.Использование случайной обрезки повышает разнообразие обучающих данных, но при этом увеличивает вычислительные затраты на обучение и может замедлить процесс обучения.
vaeПравда/ЛожьУказывает, использовать ли вариационный автокодер (VAE) в качестве основы модели. Если установлено значение True, модель будет обучаться как VAE.Использование VAE может обеспечить более гибкое представление данных, но оно также может усложнить обучение и потребовать более тонкой настройки.
no_metaПравда/ЛожьУказывает, следует ли исключить метаданные (например, теги категорий, атрибуты и т. д.) из процесса обучения. Если установлено значение True, модель не будет иметь доступа к метаданным во время обучения.Исключение метаданных может упростить процесс обучения, но это может привести к созданию модели более низкого качества, не использующей дополнительную информацию, предоставляемую метаданными.
log_dirстрока (информатика)Путь к каталогу, в котором хранятся файлы журнала обучения.Если каталог уже существует и не является пустым, обучение может перезаписать предыдущие журналы, хранящиеся в этом каталоге, что приведет к потере данных.
bucket_reso_stepsцелое число (матем.)Увеличьте количество шагов для разрешения изображения. Разрешение изображения начинается с max_bucket_resolution и увеличивается в 2 раза после каждого шага.Слишком высокое значение может привести к ошибкам памяти и увеличению времени обучения, поскольку размер изображения увеличивается на каждом шаге. Слишком низкое значение может привести к снижению качества изображения.
bucket_no_upscaleбулевоУказывает, следует ли ограничить увеличение разрешения изображения сверх его исходного размера.Если установлено значение True, разрешение изображения не будет увеличиваться сверх исходного размера, что может привести к снижению качества изображения.
v2истинный или ложныйЭтот параметр определяет, используется ли версия 2 архитектуры модели.Использование различных версий архитектуры модели может изменить качество и производительность генерируемого искусства, поэтому важно экспериментировать и сравнивать результаты, чтобы определить наилучший вариант для конкретной задачи.
v_параметризацияspectral_norm", "instance_norm" или "batch_norm".Эта настройка определяет, как нормализуются параметры модели во время обучения. Спектральная нормализация, нормализация экземпляра и пакетная нормализация - это различные подходы к предотвращению перебора, каждый из которых имеет свои компромиссы с точки зрения вычислительных затрат и производительности.Выбор неправильного метода нормализации может негативно сказаться на производительности модели, поэтому важно опробовать различные варианты, чтобы определить, какой из них лучше всего подходит для конкретной задачи.
© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...