DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime

Recursos mais recentes de IAAtualizado há 7 meses Círculo de compartilhamento de IA

2.1K 00

Introdução geral

O DCT-Net é um projeto de código aberto desenvolvido pela DAMO Academy e pelo Instituto Wang Xuan de Tecnologia da Computação da Universidade de Pequim, com o objetivo de realizar a conversão estilizada de imagens para animação. O projeto usa técnicas de aprendizagem profunda para converter perfeitamente fotos naturais em vários estilos de arte, como animação, 3D, pintura à mão, esboços etc., usando a tradução calibrada por domínio. O DCT-Net fornece uma variedade de modelos de pré-treinamento e oferece suporte ao treinamento de dados de estilo personalizados, o que é adequado para entretenimento pessoal, design criativo, bem como para os setores de filmes e jogos. e para os setores de filmes e jogos.

Lista de funções

Fornece uma grande variedade de modelos pré-treinados que abrangem uma grande variedade de estilos artísticos
Suporte para treinamento com dados de estilo personalizados
Avaliação on-line, sem necessidade de configuração do ambiente local
Desempenho eficiente, compatível com ambientes de CPU e GPU
Conversão de estilo para imagens e vídeos

Usando a Ajuda

Instalação e configuração

Instalação de dependências: Primeiro, você precisa instalar o modelscope que pode ser instalada com o seguinte comando:
```
pip install "modelscope[cv]" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html
```
Download do modelo pré-treinadoNa primeira execução do código, o modelo baixa automaticamente o arquivo de pré-treinamento.

Conversão de estilo de imagem

Definição do modeloDefinição de cinco tipos de estilos de rosto a serem convertidos pelo modelo DCT-Net:

model_dict = {
    "anime": "damo/cv_unet_person-image-cartoon_compound-models",
    "3d": "damo/cv_unet_person-image-cartoon-3d_compound-models",
    "handdrawn": "damo/cv_unet_person-image-cartoon-handdrawn_compound-models",
    "sketch": "damo/cv_unet_person-image-cartoon-sketch_compound-models",
    "art": "damo/cv_unet_person-image-cartoon-artstyle_compound-models"
}

Carregar imagens e convertê-las::

import os
import cv2
from IPython.display import Image, display, clear_output
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.outputs import OutputKeys

style = "anime"  # 可选 "anime", "3d", "handdrawn", "sketch", "art"
filename = "4.jpg"
img_path = 'picture/' + filename

img_anime = pipeline(Tasks.image_portrait_stylization, model=model_dict["anime"])
result = img_anime(img_path)

save_name = 'picture/images/' + os.path.splitext(filename)[0] + '_' + style + '.jpg'
cv2.imwrite(save_name, result[OutputKeys.OUTPUT_IMG])
clear_output()
display(Image(save_name))

Conversão de estilo de vídeo

Extrair quadros de vídeo::

video = 'sample_video.mp4'
video_file = 'movie/' + video
image_dir = 'movie/images/'

vc = cv2.VideoCapture(video_file)
i = 0
if vc.isOpened():
    rval, frame = vc.read()
    while rval:
        cv2.imwrite(image_dir + str(i) + '.jpg', frame)
        i += 1
        rval, frame = vc.read()
vc.release()

Conversão de quadros de vídeoEstilo: estilize cada quadro usando o mesmo método utilizado para a conversão de imagens e, em seguida, mescle os quadros convertidos em um vídeo.

Download do instalador com um clique

精简版（CPU版，只保留漫画风格）

https://drive.uc.cn/s/eab2a6fad2dd4 密码：XTQi

完整版：

download do thunderbolt Download do Quark 百度下载（6666）

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Recursos mais recentes de IA # AI Imagem para vídeo # Projeto de código aberto AI Java

7 meses atrás

01.5K

Langui: uma biblioteca de código aberto de componentes de interface de usuário de IA

Recursos mais recentes de IA # Projeto de código aberto AI Java # Design de página de IA

6 meses atrás

01.5K

Extract.fun：开源网站图片提取工具，利用Cloudflare浏览器渲染

Extract.fun: ferramenta de extração de imagens de sites de código aberto, usando a renderização de navegador do Cloudflare

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

01.7K

NetEase Tianyin: Arranjo de IA, composição de músicas e letras com um clique, ferramenta de criação profissional de música com IA em um só lugar

Recursos mais recentes de IA # AI Music

10 meses atrás

01.8K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime

Introdução geral

Lista de funções

Usando a Ajuda

Instalação e configuração

Conversão de estilo de imagem

Conversão de estilo de vídeo

Download do instalador com um clique

Connected Papers: uma ferramenta para pesquisar artigos acadêmicos por mapeamento de associação, uma ferramenta de visualização para literatura de pesquisa científica

VideoLingo: transcrição de vídeo, legendas de linha do tempo em nível de palavra, tradução de legendas de vídeo e ferramentas de código aberto para dublagem localizada

Artigos relacionados

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Langui: uma biblioteca de código aberto de componentes de interface de usuário de IA

Extract.fun: ferramenta de extração de imagens de sites de código aberto, usando a renderização de navegador do Cloudflare

NetEase Tianyin: Arranjo de IA, composição de músicas e letras com um clique, ferramenta de criação profissional de música com IA em um só lugar

Sem comentários

Últimas coleções

Artigos mais recentes

DCT-Net: uma ferramenta de código aberto para transpainting de fotos e vídeos para estilização de anime

Introdução geral

Lista de funções

Usando a Ajuda

Instalação e configuração

Conversão de estilo de imagem

Conversão de estilo de vídeo

Download do instalador com um clique

Connected Papers: uma ferramenta para pesquisar artigos acadêmicos por mapeamento de associação, uma ferramenta de visualização para literatura de pesquisa científica

VideoLingo: transcrição de vídeo, legendas de linha do tempo em nível de palavra, tradução de legendas de vídeo e ferramentas de código aberto para dublagem localizada

Artigos relacionados

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Langui: uma biblioteca de código aberto de componentes de interface de usuário de IA

Extract.fun: ferramenta de extração de imagens de sites de código aberto, usando a renderização de navegador do Cloudflare

NetEase Tianyin: Arranjo de IA, composição de músicas e letras com um clique, ferramenta de criação profissional de música com IA em um só lugar

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes