Позвольте ChatGPT интерпретировать все параметры LoRA
устанавливать | опции (как в настройках компьютерного программного обеспечения) | описания | недостатки |
---|---|---|---|
базовая_модель | Строковый путь к файлу базовой модели | Эта опция указывает путь к файлу базовой модели, который будет использоваться в качестве отправной точки для обучения новой модели. Модель будет точно настроена на новых данных. | Важно выбрать базовую модель, соответствующую задаче и данным, иначе процесс тонкой настройки может не улучшить производительность. |
папка img_folder | Строковый путь к папке, содержащей учебные изображения | Этот параметр указывает путь к папке, содержащей тренировочные изображения, используемые для обучения модели. | Качество и количество обучающих изображений может значительно повлиять на производительность модели. Наличие достаточно разнообразных и качественных изображений имеет решающее значение для обучения модели. |
папка_вывода | Строковый путь к папке, в которой хранится выходная модель | Этот параметр задает путь к папке, в которую сохраняется выходная модель после обучения. | В выходной папке должно быть достаточно места для сохранения файлов модели. Важно регулярно создавать резервные копии файлов модели, чтобы предотвратить потерю данных, которая может привести к потере работы. |
change_output_name | булево | Указывает, следует ли изменять выходное имя обучающей модели. Если установлено значение True, выходное имя будет изменено, в противном случае оно останется неизменным. | Н/Д |
save_json_folder | строка (информатика) | Путь к папке, в которой будут сохранены json-файлы обучающей модели. | Н/Д |
load_json_path | строка (информатика) | Путь к json-файлу, который будет использоваться для загрузки параметров модели. Это полезно для продолжения обучения с предыдущей контрольной точки. | Файл, указанный load_json_path, должен существовать и быть правильным json-файлом. |
json_load_skip_list | список строк | Указывает список строк для ключей в конфигурации модели, которые не загружаются в сохраненный .json-файл. | Если вы случайно включите необходимые ключи в json_load_skip_list, модель может работать не так, как ожидалось. |
multi_run_folder | строка (информатика) | Имя папки, в которой хранятся результаты нескольких тренировок, в формате {multirun_folder}/run{run_number}/. | Если выполнить несколько запусков без изменения имени папки multi_run_folder, предыдущие результаты будут перезаписаны. |
сохранять_json_only | булево | Если установлено значение True, сохраняется только файл конфигурации модели (формат .json), а не все контрольные точки модели. | Сам по себе файл .json не восстановит модель, и если для параметра save_json_only установлено значение True, вам придется начать обучение с нуля. |
caption_dropout_rate | Числа с плавающей точкой от 0 до 1 | Задает частоту случайного отбрасывания названий во время обучения. | Если это значение слишком велико, важная информация в заголовке может быть потеряна, что приведет к снижению качества результатов. |
caption_dropout_every_n_epochs | целое число (матем.) | Укажите частоту (в раундах), с которой происходит сброс титулов во время обучения. | Если установить слишком высокое значение, модель может не получить достаточного разнообразия заголовков во время обучения, что приведет к перестройке. Если установить слишком низкое значение, модель может не успеть обучиться на заголовках, прежде чем будет отброшена. |
caption_tag_dropout_rate | Числа с плавающей точкой от 0 до 1 | Управляет частотой случайного отбрасывания названий при обучении модели. Высокое значение означает, что будет отброшено больше названий, а низкое - меньше. | Установка высоких значений может привести к потере важной информации в заголовке, что приведет к снижению качества результатов. |
net_dim | целое число (матем.) | Этот параметр определяет количество скрытых блоков в сетевой архитектуре модели. Большие значения net_dim приводят к созданию более сложной и крупной модели, но также требуют больше вычислительных ресурсов и могут привести к перестройке модели, если она слишком велика, а обучающих данных недостаточно. | Переоценка, увеличение вычислительных ресурсов |
альфа | плавающая точка | Эта настройка определяет способность к обучению, используемую во время тренировки. Большие значения альфа могут привести к ускорению сходимости, но если установить их слишком высокими, то это может привести к чрезмерной подгонке модели или сходимости к неоптимальным решениям. Меньшие значения альфа могут привести к медленной сходимости или вообще не сходиться. | Субоптимальное решение, медленная сходимость |
планировщик | строка (информатика) | Этот параметр определяет график скорости обучения, используемый во время тренировки. Обычно выбираются следующие варианты: "шаг", "косинус" и "плато". План "шаг" уменьшает скорость обучения на фиксированный коэффициент после определенного количества итераций, а план "косинус" уменьшает скорость обучения на косинусную функцию. План "плато" снижает скорость обучения, когда потери при валидации перестают улучшаться. | Субоптимальное решение, медленная сходимость, трудности с выбором подходящего плана |
cosine_restarts | целое число (матем.) | Количество перезапусков схемы косинусного отжига. Большее число перезапусков позволяет чаще менять скорость обучения, снижая риск попадания в неоптимальную скорость обучения. | Увеличение числа перезапусков может привести к более частым изменениям скорости обучения, что сделает процесс обучения более нестабильным и трудно корректируемым. |
мощность планировщика | плавающая точка | Параметр мощности планировщика. Большие значения мощности означают, что скорость обучения изменяется медленнее. | Установка более высоких значений мощности может привести к тому, что скорость обучения будет слишком медленной, чтобы сходиться за разумное время. С другой стороны, установка более низких значений мощности может привести к слишком агрессивной скорости обучения, в результате чего модель будет чрезмерно соответствовать обучающим данным. |
прогрев_lr_ratio | плавающая точка | Отношение максимальной скорости обучения к начальной скорости обучения в период прогрева. Скорость обучения постепенно увеличивается от начального значения до максимального. | Высокий коэффициент скорости обучения при разминке может привести к тому, что модель будет сходиться медленно или не сходиться вообще. С другой стороны, низкий коэффициент скорости обучения при прогреве может привести к тому, что скорость обучения будет слишком низкой для эффективного обучения модели. |
скорость обучения | плавающая точка | Эта опция задает скорость обучения оптимизатора, используемого для обучения модели. Она определяет размер шага, с которым оптимизатор обновляет параметры модели. Значение по умолчанию - 0,0001. | Высокая скорость обучения может привести к тому, что модель слишком быстро сходится к неоптимальному решению, в то время как низкая скорость обучения может привести к медленному процессу обучения, в результате которого модель сходится к плохому решению. Скорость обучения должна быть тщательно настроена, чтобы сбалансировать эти компромиссы. |
text_encoder_lr | плавающая точка | Эта опция задает скорость обучения компонента текстового кодировщика модели. Если это значение отличается от параметра learning_rate, это позволяет произвести специальную тонкую настройку кодировщика текста. | Установка значения text_encoder_lr, отличного от learning_rate, может привести к чрезмерной подгонке кодировщика текста и плохому обобщению на новые данные. |
unet_lr | плавающая точка | Эта опция задает скорость обучения компонента UNet в модели. Если это значение отличается от значения learning_rate, это позволяет более точно настроить UNet. | Установка unet_lr в значение, отличное от learning_rate, может привести к чрезмерной подгонке UNet и плохому обобщению на новые данные. |
num_workers | целое число (матем.) | Указывает количество рабочих потоков для загрузки данных. Увеличение числа рабочих потоков может ускорить загрузку данных и обучение, но при этом может увеличить расход памяти. | Слишком большое количество рабочих потоков может привести к переполнению памяти и замедлить процесс обучения. |
постоянные_работники | булево | Определите, нужно ли использовать постоянные рабочие потоки. Постоянные рабочие потоки поддерживают очередь образцов данных, что позволяет загружать данные более эффективно. | Может привести к снижению производительности системы, особенно в системах с ограниченными ресурсами, такими как память или дисковый ввод-вывод. |
размер партии | целое число (матем.) | Определяет количество образцов, включаемых в каждую партию. Большие размеры партии могут привести к более эффективному обучению, но могут также увеличить объем памяти и замедлить сходимость. | Слишком большой размер партии может привести к переполнению памяти и замедлить процесс обучения, а слишком маленький размер партии может привести к медленной сходимости. |
num_epochs | целое число (матем.) | Указывает, сколько полных обходов должно быть выполнено для обучающих данных. Большее количество обходов приведет к созданию более точной модели, но также потребует больше времени на выполнение. | Более длительное время обучения может привести к чрезмерной подгонке данных, если используется слишком много раундов. |
сохранять_каждое_несколько_эпох | целое число (матем.) | Укажите, как часто модель должна сохраняться во время обучения. Например, значение 5 означает, что модель будет сохраняться каждые 5 раундов. | занимают больше места в памяти, поскольку модели сохраняются чаще. |
shuffle_captions | булево | Указывает, следует ли перемешивать обучающие данные между раундами. Перемешивание может помочь предотвратить попадание модели в локальные минимумы, но также может сделать обучение непоследовательным. | Если порядок обучающих данных значителен, это может привести к непоследовательности обучения. |
keep_tokens | целое число (матем.) | Корпус текстов, используемый для обучения наиболее частому Токен Количество. Токен с частотой встречаемости меньше keep_tokens будет заменен на неизвестный токен (""). Меньшее значение приводит к уменьшению объема словаря, что может снизить требования к памяти модели, но также может привести к потере информации. | Если значение keep_tokens слишком мало, информация может быть потеряна. |
max_steps | целое число (матем.) | Максимальное количество шагов, которое будет сделано во время обучения. Как только модель увидит пакет данных max_steps, обучение прекратится. | Если значение max_steps слишком мало, модель может быть обучена не полностью. При слишком высоком значении обучение может занять много времени. |
tag_occurrence_txt_file | строка (информатика) | Путь к текстовому файлу, содержащему информацию о встречаемости меток. Информация о встречаемости меток используется для взвешивания функции потерь во время обучения. | Если метки содержат недоступную информацию или заданы неверно, возможно, модель обучена неправильно. |
сортировать_теги_по_алфавиту | истинный или ложный | Если установлено значение true, теги в файле tag_occurrence_txt_file будут отсортированы в алфавитном порядке. Эта опция может быть использована для сохранения последовательности тегов и обеспечения того, чтобы похожие теги были сгруппированы вместе. | Н/Д |
train_resolution | целое значение | Это значение определяет разрешение учебного изображения. Более высокое разрешение позволяет получить более детальные изображения, но также требует больше памяти и вычислительных ресурсов. | Увеличение разрешения может значительно увеличить время обучения и требования к памяти, особенно если объем обучающих данных велик. |
min_bucket_resolution | целое значение | Это значение определяет минимальный размер ведра, используемого для обучения. Меньший размер ведра может привести к ускорению процесса обучения, но также может вызвать перебор с подгонкой или снизить качество результатов. | Чрезмерное уменьшение размера ковша может привести к снижению эффективности обучения и качества результатов. |
максимальное_разрешение_ковша | целое число (матем.) | Задает максимальное разрешение изображения в обучающих данных. Если разрешение обучающих данных больше, чем max_bucket_resolution, они будут уменьшены. | Высокое значение max_bucket_resolution может привести к увеличению времени обучения и потреблению памяти, а низкое значение может снизить качество генерируемого изображения. |
lora_model_for_resume | строка (информатика) | Указывает путь к предварительно обученной модели LoRA, которая будет использоваться для возобновления обучения с предыдущей контрольной точки. | Возобновление обучения на основе предварительно обученной модели может привести к чрезмерной подгонке, если новые обучающие данные значительно отличаются от исходных. |
сохранить_состояние | булево | Указывает, сохранять ли состояние обучения после каждого раунда. Если установлено значение True, состояние обучения будет сохранено в файле lora_model_for_resume. | Частое сохранение состояний обучения может привести к увеличению времени обучения и повышению нагрузки на диск. |
load_previous_save_state | истинный или ложный | Указывает, загружать ли ранее сохраненное состояние модели во время обучения. Если установлено значение True, обучение будет возобновлено с ранее сохраненного состояния. Если установлено значение False, обучение начнется с нуля. | Если ранее сохраненное состояние недоступно или повреждено, обучение не будет восстановлено, и оно начнется с нуля, что может привести к увеличению времени обучения и снижению производительности. |
учебный_комментарий | строка (информатика) | Указывает комментарий, который будет добавлен к имени сохраненной модели. Это можно использовать для различения разных моделей, созданных с разными настройками или параметрами. | не иметь |
unet_only | истинный или ложный | Указывает, следует ли обучать только компоненты UNet модели. Если установлено значение True, будет обучен только компонент UNet модели, а компонент кодировщика текста обучен не будет. Если установлено значение False, будут обучены оба компонента модели - UNet и кодировщик текста. | Обучение только компонента UNet модели может привести к снижению производительности по сравнению с одновременным обучением обоих компонентов, поскольку компонент кодировщика текста является важной частью модели и помогает кодировать текстовую информацию в процессе обучения. |
только текст | истинный или ложный | Определяет, обучать ли модель только на тексте или и на тексте, и на изображениях. Если установить значение True, обучение будет проходить быстрее, но качество изображения будет ниже. Установка значения False приведет к более медленному обучению, но более качественной генерации изображений. | Если установить значение True, полученное изображение будет не таким точным и детализированным, как при значении False. |
reg_img_folder | строка (информатика) | Путь к каталогу изображений, используемых для обучения. | Эта опция актуальна только в том случае, если для параметра text_only установлено значение False. Если изображения не указаны, модель будет обучаться только на тексте, и изображения генерироваться не будут. |
clip_skip | истинный или ложный | Определяет, должна ли модель пропускать обрезанные изображения в обучающих данных. Обрезанные изображения - это те, размер которых либо слишком мал, либо слишком велик по сравнению с разрешением train_resolution. | Если установлено значение True, модель может не обучаться на некоторых изображениях в обучающих данных. Если установить значение False, обучение может занять больше времени, поскольку модель должна обработать все изображения, даже отредактированные. |
тестовое_семя | целое число (матем.) | Задайте случайное зерно для генерации и оценки тестовых данных. Задание семени гарантирует, что при каждом запуске сценария будут генерироваться одни и те же тестовые данные. | Разные семена могут приводить к разным тестовым данным и результатам оценки, что затрудняет сравнение производительности в разных прогонах. |
предыдущий_потерянный_вес | плавающая точка | Укажите вес члена предварительных потерь в общем расчете потерь. Член предшествующих потерь используется для того, чтобы побудить модель генерировать результаты, схожие с предшествующим распределением обучающих данных. | Слишком высокие значения весов могут привести к получению результатов, слишком похожих на предыдущие, что снизит творческий потенциал модели. Слишком низкое значение весов может привести к тому, что результат будет слишком далек от предыдущего и недостаточно целостен. |
градиентное_определение | булево | Указывает, использовать ли градиентные контрольные точки для уменьшения использования памяти во время обучения. Градиентные контрольные точки включают выборочное сохранение и перезагрузку активаций во время обратного распространения, что сокращает использование памяти ценой увеличения времени вычислений. | Использование градиентных контрольных точек может замедлить процесс обучения и может быть необязательным для небольших моделей или устройств с достаточным объемом памяти. |
gradient_acc_steps | целое число (матем.) | Определяет количество шагов для накопления градиента во время обучения. Увеличение этого значения снижает потребление памяти и повышает стабильность обучения. | Большие значения gradient_acc_steps увеличивают количество операций и могут замедлить процесс обучения. |
смешанная точность | булево | Указывает, следует ли использовать обучение со смешанной точностью, которое использует типы данных с низкой точностью для ускорения обучения. | Обучение со смешанной точностью может привести к снижению точности и нестабильному обучению. |
сохранять_точность | плавающая точка | Указывает точность, которую следует использовать при сохранении весов модели. Обычно устанавливается на 32 или 16 в зависимости от точности, используемой во время обучения. | Более низкие значения точности могут привести к потере информации при сохранении весов модели, что приведет к снижению точности. |
save_as | строка (информатика) | Указывает формат файла, в котором будет сохранена обучающая модель. Поддерживаются следующие форматы: ckpt, safetensors, pt, bin. | Формат файла должен соответствовать типу художественной модели Stable Diffusion AI, для которой будет использоваться модель LoRA. |
caption_extension | строка (информатика) | Указывает расширение текстового файла, содержащего заголовки обучающих данных. | Расширение должно соответствовать реальному расширению файла заголовка. |
max_clip_token_length | целое число (матем.) | Укажите максимальное количество Token, допустимое в одном заголовке. Заголовки, превышающие эту длину, будут пропускаться во время обучения. | Установка больших значений может увеличить расход памяти во время обучения. Установка меньшего значения может привести к потере важной информации в заголовке. |
ведра | список целых чисел | Укажите размер алгоритма buckets. Например, если для buckets установлено значение [5,10,15], данные будут разделены на три ведра, данные длиной 5 Token будут находиться в одном ведре, данные длиной 10 Token - в другом, а данные длиной 15 Token - в третьем. | Для достижения хороших результатов необходимо тщательно выбирать количество ведер и их размер. Если количество ведер слишком мало, модель может работать плохо, а если количество ведер слишком велико, модель может быть перекорректирована. |
xformers | список строк | Укажите трансформатор, который будет использоваться во время обучения. Трансформатор может быть использован для применения таких методов улучшения данных, как произвольное обрезание, переворачивание, вращение и т. д. | Выбор трансформатора может значительно повлиять на производительность модели, поэтому важно выбрать трансформатор, который лучше всего подходит для конкретной задачи. |
use_8bit_adam | булево | Указывает, использовать ли 8-битный оптимизатор Адама. Эта опция может быть использована для снижения требований к памяти для процесса обучения. | Если установить значение True, требования к памяти для процесса обучения уменьшатся, но обучение может проходить медленнее, а модель может быть менее точной. |
кэш_латенты | булево | Если установлено значение True, потенциальные значения обучающих данных кэшируются для ускорения обучения. Это может сократить время обучения модели, но может также использовать больше памяти и увеличить время начала обучения. | Повышенное потребление памяти и замедленное время запуска. |
цвет_уг | булево | Если установлено значение True, во время обучения выполняется улучшение цвета. Это может увеличить разнообразие обучающих данных, но может и замедлить обучение. | Время тренировок замедляется. |
flip_aug | булево | Если установлено значение True, то во время обучения выполняется усиление флипа. Это может увеличить разнообразие обучающих данных, но может и замедлить обучение. | Время тренировок замедляется. |
случайная_урожайность | Правда/Ложь | Указывает, следует ли применять случайную обрезку к обучающему изображению. Если установлено значение True, то перед вводом в модель обучающее изображение будет случайным образом обрезано до указанного размера. | Использование случайной обрезки повышает разнообразие обучающих данных, но при этом увеличивает вычислительные затраты на обучение и может замедлить процесс обучения. |
vae | Правда/Ложь | Указывает, использовать ли вариационный автокодер (VAE) в качестве основы модели. Если установлено значение True, модель будет обучаться как VAE. | Использование VAE может обеспечить более гибкое представление данных, но оно также может усложнить обучение и потребовать более тонкой настройки. |
no_meta | Правда/Ложь | Указывает, следует ли исключить метаданные (например, теги категорий, атрибуты и т. д.) из процесса обучения. Если установлено значение True, модель не будет иметь доступа к метаданным во время обучения. | Исключение метаданных может упростить процесс обучения, но это может привести к созданию модели более низкого качества, не использующей дополнительную информацию, предоставляемую метаданными. |
log_dir | строка (информатика) | Путь к каталогу, в котором хранятся файлы журнала обучения. | Если каталог уже существует и не является пустым, обучение может перезаписать предыдущие журналы, хранящиеся в этом каталоге, что приведет к потере данных. |
bucket_reso_steps | целое число (матем.) | Увеличьте количество шагов для разрешения изображения. Разрешение изображения начинается с max_bucket_resolution и увеличивается в 2 раза после каждого шага. | Слишком высокое значение может привести к ошибкам памяти и увеличению времени обучения, поскольку размер изображения увеличивается на каждом шаге. Слишком низкое значение может привести к снижению качества изображения. |
bucket_no_upscale | булево | Указывает, следует ли ограничить увеличение разрешения изображения сверх его исходного размера. | Если установлено значение True, разрешение изображения не будет увеличиваться сверх исходного размера, что может привести к снижению качества изображения. |
v2 | истинный или ложный | Этот параметр определяет, используется ли версия 2 архитектуры модели. | Использование различных версий архитектуры модели может изменить качество и производительность генерируемого искусства, поэтому важно экспериментировать и сравнивать результаты, чтобы определить наилучший вариант для конкретной задачи. |
v_параметризация | spectral_norm", "instance_norm" или "batch_norm". | Эта настройка определяет, как нормализуются параметры модели во время обучения. Спектральная нормализация, нормализация экземпляра и пакетная нормализация - это различные подходы к предотвращению перебора, каждый из которых имеет свои компромиссы с точки зрения вычислительных затрат и производительности. | Выбор неправильного метода нормализации может негативно сказаться на производительности модели, поэтому важно опробовать различные варианты, чтобы определить, какой из них лучше всего подходит для конкретной задачи. |
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...