Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

Como a IA do DeepSeek gera as letras das músicas?

I. Princípios básicos das letras de músicas geradas pela IA do DeepSeek

O processo generativo de capturar as leis da composição musical por meio de um modelo de linguagem pré-treinado consiste em três estágios principais:

  • Identificação do estilo:Com base nas palavras-chave "estilo chinês" e "pop-rock" inseridas pelo usuário, o corpus correspondente será correspondido automaticamente (por exemplo, analisando a distribuição de imagens das 300 letras de Jay Chou).
  • Modelagem rítmica:Os padrões de rima são analisados usando o particípio BPE para criar um banco de dados de correspondências de sílabas (por exemplo, um banco de dados de combinações de rimas de "love-firm-agreement").
  • Mapeamento de emoções:Converter palavras emocionais, como "tristeza", em imagens concretas (por exemplo, mapear "solidão" para cenas como "lâmpada de rua/noite chuvosa/quarto vazio") por meio do módulo de análise de sentimentos do BERT.

II Diretrizes práticas (tomando como exemplo a criação de canções de amor populares)

  1. Iniciar a geração:Entrada de comandos básicos
    请生成一首关于失恋的流行歌曲歌词,要求:
    - 主歌/副歌结构
    - 每段4行
    - 押"ian"韵脚
    - 包含雨天意象
  2. Otimização de parâmetros:Requisitos específicos adicionais
    补充要求:
    1. 第二段加入"咖啡店"场景
    2. 避免使用"心痛"等陈词滥调
    3. 增加具象化比喻(如"像断了线的风筝")
  3. Exemplo de resultados gerados:

    Música principal 1:
    Gotas de chuva no peitoril da janela escrevendo ontem
    Tempo de congelamento para alertas de chamadas perdidas
    O café esfria o arco amargo
    Contornar a lateral de seu rosto virado

    Coro:
    Somos como linhas subterrâneas paralelas.
    Com promessas que nunca se cumprem.
    Os limpadores de para-brisa não podem apagar o passado
    Gradualmente fora de foco no espelho retrovisor em um círculo.

III. habilidades criativas de nível profissional

delicadeza Exemplos de instruções válidas análise de funções
Reforço da rima "Crie uma estrutura de rimas ABAB no refrão com 9 sílabas por linha." Ative o algoritmo de restrição de rima para detectar automaticamente a contagem de sílabas e fazer a correspondência com o banco de rimas
imagens aninhadas "Traduzindo 'pensamentos' em três imagens recursivas do oceano". Acionamento do módulo de geração de metáforas para construir a cadeia de imagens de "Wave-Tide-Deep Sea".
curva emocional "Construa uma virada emocional da reminiscência para a libertação, estabelecendo um ponto de virada na terceira frase do segundo parágrafo" Ative a modelagem de arco emocional para inserir automaticamente "Mas a luz do sol..." Tipo de frase de transição

IV. programas de aprimoramento da qualidade

  • Otimização iterativa:Instruções adicionais para o primeiro rascunho, por exemplo, "Mude 'congelar o tempo' para uma metáfora mais vívida, mantendo a imagem do tempo, mas aumentando a imagem"
  • Fusão de estilos:Experimentar combinações cruzadas, como "adicionar elementos literários a estilos de música eletrônica" para estimular as vantagens do treinamento de mistura de modelos
  • Ajuste de parâmetros:A criatividade é controlada pelo parâmetro de temperatura (0,3-0,7 para composição), e os valores de top_p são mantidos acima de 0,9 para garantir a coerência semântica

V. Notas sobre avisos de direitos autorais

Propõe-se incluir no prompt de geração: "Certifique-se de que todas as metáforas sejam originais e não envolvam fragmentos de letras específicas de músicas existentes", o sistema ativará o módulo de detecção de similaridade para comparar o banco de dados de direitos autorais de música com mais de 500 milhões de palavras. Se for detectada uma similaridade de fragmento superior a 20%, o mecanismo de reescrita será acionado automaticamente.


Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Como a IA do DeepSeek gera as letras das músicas?
pt_BRPortuguês do Brasil