Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime

Introdução geral

O DCT-Net é um projeto de código aberto desenvolvido pela DAMO Academy e pelo Instituto Wang Xuan de Tecnologia da Computação da Universidade de Pequim, com o objetivo de realizar a conversão estilizada de imagens para animação. O projeto usa técnicas de aprendizagem profunda para converter perfeitamente fotos naturais em vários estilos de arte, como animação, 3D, pintura à mão, esboços etc., usando a tradução calibrada por domínio. O DCT-Net fornece uma variedade de modelos de pré-treinamento e oferece suporte ao treinamento de dados de estilo personalizados, o que é adequado para entretenimento pessoal, design criativo, bem como para os setores de filmes e jogos. e para os setores de filmes e jogos.

DCT-Net: uma ferramenta de código aberto para transformar fotos e vídeos em anime estilizado-1

 

Lista de funções

  • Fornece uma grande variedade de modelos pré-treinados que abrangem uma grande variedade de estilos artísticos
  • Suporte para treinamento com dados de estilo personalizados
  • Avaliação on-line, sem necessidade de configuração do ambiente local
  • Desempenho eficiente, compatível com ambientes de CPU e GPU
  • Conversão de estilo para imagens e vídeos

 

Usando a Ajuda

Instalação e configuração

  1. Instalação de dependências: Primeiro, você precisa instalar o modelscope que pode ser instalada com o seguinte comando:
    pip install "modelscope[cv]" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
    
  2. Download do modelo pré-treinadoNa primeira execução do código, o modelo baixa automaticamente o arquivo de pré-treinamento.

Conversão de estilo de imagem

  1. Definição do modeloDefinição de cinco tipos de estilos de rosto a serem convertidos pelo modelo DCT-Net:
    model_dict = {
        "anime": "damo/cv_unet_person-image-cartoon_compound-models",
        "3d": "damo/cv_unet_person-image-cartoon-3d_compound-models",
        "handdrawn": "damo/cv_unet_person-image-cartoon-handdrawn_compound-models",
        "sketch": "damo/cv_unet_person-image-cartoon-sketch_compound-models",
        "art": "damo/cv_unet_person-image-cartoon-artstyle_compound-models"
    }
    
  2. Carregar imagens e convertê-las::
    import os
    import cv2
    from IPython.display import Image, display, clear_output
    from modelscope.pipelines import pipeline
    from modelscope.utils.constant import Tasks
    from modelscope.outputs import OutputKeys
    
    style = "anime"  # 可选 "anime", "3d", "handdrawn", "sketch", "art"
    filename = "4.jpg"
    img_path = 'picture/' + filename
    
    img_anime = pipeline(Tasks.image_portrait_stylization, model=model_dict["anime"]) result = img_anime(img_path) save_name = 'picture/images/' + os.path.splitext(filename)[0] + '_' + style + '.jpg' cv2.imwrite(save_name, result[OutputKeys.OUTPUT_IMG]) clear_output() display(Image(save_name))

Conversão de estilo de vídeo

  1. Extrair quadros de vídeo::
    video = 'sample_video.mp4'
    video_file = 'movie/' + video
    image_dir = 'movie/images/'
    
    vc = cv2.VideoCapture(video_file)
    i = 0
    if vc.isOpened():
        rval, frame = vc.read()
        while rval:
            cv2.imwrite(image_dir + str(i) + '.jpg', frame)
            i += 1
            rval, frame = vc.read()
    vc.release()
    
  2. Conversão de quadros de vídeoEstilo: estilize cada quadro usando o mesmo método utilizado para a conversão de imagens e, em seguida, mescle os quadros convertidos em um vídeo.

 

 

Download do instalador com um clique

Chefe do Círculo de Compartilhamento de IAEste conteúdo foi ocultado pelo autor. Digite o código de verificação para visualizar o conteúdo
Captcha:
Preste atenção ao número público do WeChat deste site, responda "CAPTCHA, um tipo de teste de desafio-resposta (computação)", obtenha o código de verificação. Pesquise no WeChat por "Chefe do Círculo de Compartilhamento de IA"ou"Aparência-AI"ou WeChat escaneando o lado direito do código QR pode prestar atenção a esse número público do WeChat do site.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime
pt_BRPortuguês do Brasil