🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Total de 992 artigos

Tags: ai projetos de código aberto Página 51

Marker: converta rapidamente PDF em ferramentas de código aberto Markdown

Introdução geral O Marker é uma ferramenta de processamento de documentos baseada em aprendizagem profunda, projetada para converter arquivos PDF para o formato Markdown com rapidez e precisão. Ele oferece suporte a uma ampla variedade de tipos de documentos e é especialmente otimizado para a conversão de livros e artigos científicos. O Marker é capaz de remover conteúdo redundante, como cabeçalhos e rodapés, formatar tabelas e...

2024-09-03Ferramentas de IA Projeto de código aberto de IA Extração e limpeza de documentos

SadTalker：让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina fotos de retratos únicos e arquivos de áudio para criar vídeos realistas de cabeças falantes para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. O uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVAE, é excelente para capturar as facetas sutis...

2024-09-03Ferramentas de IA Projeto de código aberto de IA Pessoa digital com IA sincronização labial

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.

2025-04-26

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral O VideoReTalking é um sistema inovador que permite aos usuários gerar vídeos faciais sincronizados com os lábios com base no áudio de entrada, produzindo vídeos de saída de alta qualidade e sincronizados com os lábios, mesmo com emoções diferentes. O sistema divide esse objetivo em três tarefas sucessivas: geração de vídeos faciais com expressões típicas...

2024-09-02Ferramentas de IA Projeto de código aberto de IA sincronização labial

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步-首席AI分享圈

MuseV+Muse Talk: Estrutura completa de geração de vídeo humano digital | Retrato para vídeo | Pose para vídeo | Sincronização labial

Introdução geral O MuseV é um projeto público no GitHub que tem como objetivo permitir a geração de vídeos de avatar com duração ilimitada e alta fidelidade. Ele se baseia na tecnologia de difusão e oferece Image2Video, Text2Image2Video, Video2Video e muitos outros recursos. Fornece estrutura de modelo, casos de uso, início rápido...

2024-09-02Ferramentas de IA Projeto de código aberto de IA Pessoa digital com IA sincronização labial

Unstructured：开源预处理非结构化文档，无结构数据处理的利器-首席AI分享圈

Não estruturado: documentos não estruturados de pré-processamento de código aberto, ferramentas de processamento de dados não estruturados

Introdução abrangente O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM), para fornecer suporte. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM) para fornecer suporte.

2024-09-01Ferramentas de IA Projeto de código aberto de IA Extração e limpeza de documentos

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal, extração de vários layouts...

2024-09-01Ferramentas de IA Projeto de código aberto de IA

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para captura de conteúdo da Web

WebPilot Introdução geral O Webpilot é um "assistente da Web" gratuito e de código aberto que permite que você se comunique livremente com qualquer página da Web ou execute tarefas automatizadas. Em vez de alternar entre páginas ou copiar e colar, basta selecionar o texto ou digitar comandos, e o Webpilot fornecerá informações em tempo real e tarefas inteligentes...

2024-08-31Ferramentas de IA Serviços abertos de IA Projeto de código aberto de IA Ferramentas de pesquisa de IA

DB-GPT：构建AI原生数据应用开发框架，集成多模型管理与智能数据处理-首席AI分享圈

DB-GPT: criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados

Introdução abrangente O DB-GPT é uma estrutura de desenvolvimento de aplicativos de dados nativos de IA de código aberto criada usando AWEL (Agentic Workflow Expression Language) e tecnologias de corpo inteligente. O projeto tem como objetivo criar uma infraestrutura no campo de modelos grandes por meio do desenvolvimento de vários recursos técnicos, incluindo um sistema de gerenciamento de vários modelos (SMMF),...

2024-08-31Ferramentas de IA Projeto de código aberto de IA Análise de dados de IA Recuperação de conhecimento e a estrutura RAG

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

DreamTalk Introdução abrangente O DreamTalk é uma estrutura de geração de talking head de expressão orientada por modelo de difusão, desenvolvida em conjunto pela Universidade de Tsinghua, pelo Grupo Alibaba e pela Universidade de Ciência e Tecnologia de Huazhong. Ele consiste principalmente em três partes: uma rede de redução de ruído, um especialista em lábios com reconhecimento de estilo e um preditor de estilo, e é capaz de gerar uma variedade de entradas de áudio com base em...

2024-08-31Ferramentas de IA Projeto de código aberto de IA Pessoa digital com IA sincronização labial

InstantID：上传一张图片，迁移人像特征来生成不同风格图片-首席AI分享圈

InstantID: carregue uma imagem e migre os recursos de retrato para gerar diferentes estilos de imagens

Introdução abrangente O InstantID é uma tecnologia avançada voltada para a geração de imagens com estilos ou poses personalizados em segundos, garantindo um alto nível de fidelidade com o uso de uma única imagem de identificação de referência. A tecnologia usa uma solução baseada em modelo de difusão, integrando imagens faciais, imagens de...

2024-08-30Ferramentas de IA Controle de estilo de imagem AI Projeto de código aberto de IA AI Face Swap e Dress Up

ComfyUI Portrait Master 中文版：优化肖像生成的提示词工具-首席AI分享圈

ComfyUI Portrait Master versão chinesa: ferramenta de palavras-chave para otimizar a geração de retratos

Introdução geral A versão chinesa do ComfyUI Portrait Master é uma ferramenta de geração de palavras-chave de retratos projetada para criadores de imagens de IA. A ferramenta ajuda os usuários a gerar retratos de alta qualidade, otimizando as palavras-chave. Os usuários podem escolher diferentes tipos de lentes, gênero, nacionalidade, expressão facial...

2024-08-30Ferramentas de IA Auxiliares de geração de imagens com IA Projeto de código aberto de IA ComfyUI

IOPaint：全能AI图像处理工具，擦除、扩图、替换元素与绘制文本-首席AI分享圈

IOPaint: ferramenta completa de processamento de imagens de IA, apagando, expandindo, substituindo elementos e desenhando texto.

Introdução geral O IOPaint é uma ferramenta de processamento de imagens de IA gratuita e de código aberto que oferece suporte ao apagamento, reparo e expansão de imagens. Ele usa modelos de IA de última geração para ajudar os usuários a remover facilmente objetos indesejados de imagens, corrigir falhas, adicionar novo conteúdo e até mesmo expandir imagens.

2024-08-29Ferramentas de IA Ampliação e restauração de imagens com IA Projeto de código aberto de IA Teclado de IA para alterar o plano de fundo

GPT Academic：最佳Arxiv学术论文翻译、纠错与代码解释-首席AI分享圈

GPT Acadêmico: Melhor tradução de artigos acadêmicos do Arxiv, correção de erros e interpretação de códigos

Introdução abrangente O GPT Academic é uma plataforma interativa para modelos de idiomas grandes otimizados para pesquisa acadêmica, fornecendo ferramentas para interfaces de interação pragmática para modelos de idiomas grandes, como GPT/GLM, otimizados especificamente para tradução em papel, leitura em papel, retoques e experiência de escrita. Seu design é modular e oferece suporte a atalhos personalizados...

2024-08-29Ferramentas de IA Projeto de código aberto de IA Ferramentas educacionais de IA discutir um artigo ou tese (antigo)

gpt prompt engineer: Ferramenta de engenharia de prompt de modelo de linguagem | Otimização de comandos de prompt

Introdução geral O gpt-prompt-engineer é um projeto de código aberto no GitHub que se concentra na engenharia de prompts para modelos GPT. Os usuários podem inserir descrições de tarefas e casos de teste, e essa ferramenta é capaz de gerar, testar e classificar diferentes prompts para encontrar o melhor desempenho. O projeto utiliza os modelos GPT-4 e GPT-3.5-T...

2024-08-28Ferramentas de IA Projeto de código aberto de IA PROMPTS Aids

STORM：基于Topic搜索网络数据，生成带引用的论文、长文报告-首席AI分享圈

STORM: pesquise dados da Web com base no tópico, gere documentos com citações, relatórios de documentos longos

Introdução geral O STORM é um sistema de integração de conhecimento e geração de artigos desenvolvido pela equipe Oval da Universidade de Stanford. Ele se concentra na geração de artigos exaustivos do tipo Wikipedia (documentos sistemáticos) a partir do zero. O sistema usa modelos de linguagem em grande escala para pesquisa de tópicos, preparação de sinopses e modelagem de fontes reais da Internet...

2024-08-27Ferramentas de IA Projeto de código aberto de IA Gerar relatórios de pesquisa detalhados discutir um artigo ou tese (antigo)

XHS-Downloader：免费小红书数据采集工具，支持笔记批量下载、视频提取、图片去水印-首席AI分享圈

XHS-Downloader: Ferramenta gratuita de coleta de dados de Xiaohongshu, download em lote de notas de suporte, extração de vídeo, marca d'água de imagem

Introdução geral O XHS-Downloader é uma ferramenta de código aberto projetada para os usuários do Xiaohongshu para dar suporte à extração e ao download de imagens e vídeos sem marca d'água no Xiaohongshu. A ferramenta oferece uma variedade de recursos, incluindo a obtenção de cookies de navegadores, suporte para operações de linha de comando, downloads em lote, pontos de interrupção e assim por diante. Os usuários podem...

2024-08-26Ferramentas de IA Projeto de código aberto de IA

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Introdução geral O MediaCrawler é uma ferramenta de rastreamento de conteúdo de mídia social criada para desenvolvedores. Ao fornecer um rastreador avançado, ele pode rastrear rapidamente vídeos, imagens, comentários, curtidas, retweets e outros dados de plataformas sociais, como Xiaohongshu, Jieyin, Shutterbugs, B-station, Weibo e assim por diante. Essa ferramenta torna...

2024-08-25Ferramentas de IA Projeto de código aberto de IA

MJML：轻松设计响应式邮件，配合ChatGPT快速生成营销邮件-首席AI分享圈

MJML: Crie facilmente e-mails responsivos e gere rapidamente e-mails de marketing com o ChatGPT

Introdução geral O MJML (Mail Junction Markup Language) é uma estrutura de código aberto desenvolvida pela equipe do Mailjet para simplificar a criação de modelos de e-mail responsivos. Com uma linguagem de marcação semântica e uma biblioteca de componentes avançada, os desenvolvedores podem criar e-mails bonitos e eficientes com menos código.