I. Princípios básicos das letras de músicas geradas pela IA do DeepSeek
O processo generativo de capturar as leis da composição musical por meio de um modelo de linguagem pré-treinado consiste em três estágios principais:
- Identificação do estilo:Com base nas palavras-chave "estilo chinês" e "pop-rock" inseridas pelo usuário, o corpus correspondente será correspondido automaticamente (por exemplo, analisando a distribuição de imagens das 300 letras de Jay Chou).
- Modelagem rítmica:Os padrões de rima são analisados usando o particípio BPE para criar um banco de dados de correspondências de sílabas (por exemplo, um banco de dados de combinações de rimas de "love-firm-agreement").
- Mapeamento de emoções:Converter palavras emocionais, como "tristeza", em imagens concretas (por exemplo, mapear "solidão" para cenas como "lâmpada de rua/noite chuvosa/quarto vazio") por meio do módulo de análise de sentimentos do BERT.
II Diretrizes práticas (tomando como exemplo a criação de canções de amor populares)
- Iniciar a geração:Entrada de comandos básicos
Por favor, gere letras para uma música pop sobre amor perdido que exija: - Estrutura da música principal/coro - 4 linhas por verso - Rimas com "ian". - Incluir imagens de dias chuvosos
- Otimização de parâmetros:Requisitos específicos adicionais
Requisitos adicionais: 1. inclua uma cena de "cafeteria" no segundo parágrafo. 2. evite clichês como "dor de cabeça". 3. 3. Adicione metáforas figurativas (por exemplo, "like a kite with a broken string").
- Exemplo de resultados gerados:
Música principal 1:
Gotas de chuva no peitoril da janela escrevendo ontem
Tempo de congelamento para alertas de chamadas perdidas
O café esfria o arco amargo
Contornar a lateral de seu rosto viradoCoro:
Somos como linhas subterrâneas paralelas.
Com promessas que nunca se cumprem.
Os limpadores de para-brisa não podem apagar o passado
Gradualmente fora de foco no espelho retrovisor em um círculo.
III. habilidades criativas de nível profissional
delicadeza | Exemplos de instruções válidas | análise de funções |
---|---|---|
Reforço da rima | "Crie uma estrutura de rimas ABAB no refrão com 9 sílabas por linha." | Ative o algoritmo de restrição de rima para detectar automaticamente a contagem de sílabas e fazer a correspondência com o banco de rimas |
imagens aninhadas | "Traduzindo 'pensamentos' em três imagens recursivas do oceano". | Acionamento do módulo de geração de metáforas para construir a cadeia de imagens de "Wave-Tide-Deep Sea". |
curva emocional | "Construa uma virada emocional da reminiscência para a libertação, estabelecendo um ponto de virada na terceira frase do segundo parágrafo" | Ative a modelagem de arco emocional para inserir automaticamente "Mas a luz do sol..." Tipo de frase de transição |
IV. programas de aprimoramento da qualidade
- Otimização iterativa:Instruções adicionais para o primeiro rascunho, por exemplo, "Mude 'congelar o tempo' para uma metáfora mais vívida, mantendo a imagem do tempo, mas aumentando a imagem"
- Fusão de estilos:Experimentar combinações cruzadas, como "adicionar elementos literários a estilos de música eletrônica" para estimular as vantagens do treinamento de mistura de modelos
- Ajuste de parâmetros:A criatividade é controlada pelo parâmetro de temperatura (0,3-0,7 para composição), e os valores de top_p são mantidos acima de 0,9 para garantir a coerência semântica
V. Notas sobre avisos de direitos autorais
Propõe-se incluir no prompt de geração: "Certifique-se de que todas as metáforas sejam originais e não envolvam fragmentos de letras específicas de músicas existentes", o sistema ativará o módulo de detecção de similaridade para comparar o banco de dados de direitos autorais de música com mais de 500 milhões de palavras. Se for detectada uma similaridade de fragmento superior a 20%, o mecanismo de reescrita será acionado automaticamente.