Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 992 artigos

Tags: ai projetos de código aberto Página 51

Marker:快速将PDF转换为Markdown的开源工具-首席AI分享圈

Marker: converta rapidamente PDF em ferramentas de código aberto Markdown

Introdução geral O Marker é uma ferramenta de processamento de documentos baseada em aprendizagem profunda, projetada para converter arquivos PDF para o formato Markdown com rapidez e precisão. Ele oferece suporte a uma ampla variedade de tipos de documentos e é especialmente otimizado para a conversão de livros e artigos científicos. O Marker é capaz de remover conteúdo redundante, como cabeçalhos e rodapés, formatar tabelas e...

SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: Faça as fotos falarem | Áudio de sincronização de boca | Vídeo de sincronização de boca sintetizado | Pessoas digitais gratuitas

Introdução geral O SadTalker é uma ferramenta de código aberto que combina fotos de retratos únicos e arquivos de áudio para criar vídeos realistas de cabeças falantes para uma ampla variedade de cenários, como mensagens personalizadas, conteúdo educacional e muito mais. O uso revolucionário de tecnologias de modelagem 3D, como ExpNet e PoseVAE, é excelente para capturar as facetas sutis...

VideoReTalking:音频驱动的嘴唇同步和视频编辑系统-首席AI分享圈

VideoReTalking: sincronização labial acionada por áudio e sistema de edição de vídeo

Introdução geral O VideoReTalking é um sistema inovador que permite aos usuários gerar vídeos faciais sincronizados com os lábios com base no áudio de entrada, produzindo vídeos de saída de alta qualidade e sincronizados com os lábios, mesmo com emoções diferentes. O sistema divide esse objetivo em três tarefas sucessivas: geração de vídeos faciais com expressões típicas...

MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步-首席AI分享圈

MuseV+Muse Talk: Estrutura completa de geração de vídeo humano digital | Retrato para vídeo | Pose para vídeo | Sincronização labial

Introdução geral O MuseV é um projeto público no GitHub que tem como objetivo permitir a geração de vídeos de avatar com duração ilimitada e alta fidelidade. Ele se baseia na tecnologia de difusão e oferece Image2Video, Text2Image2Video, Video2Video e muitos outros recursos. Fornece estrutura de modelo, casos de uso, início rápido...

Unstructured:开源预处理非结构化文档,无结构数据处理的利器-首席AI分享圈

Não estruturado: documentos não estruturados de pré-processamento de código aberto, ferramentas de processamento de dados não estruturados

Introdução abrangente O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. O Unstructured-IO fornece um conjunto de componentes de código aberto para processamento e pré-processamento de imagens e documentos de texto, como PDF, HTML, documentos do Word etc. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM), para fornecer suporte. Seu principal objetivo é simplificar e otimizar os fluxos de trabalho de processamento de dados, especialmente para aplicativos de modelo de linguagem grande (LLM) para fornecer suporte.

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal, extração de vários layouts...

WebPilot:智能网页信息处理工具,网页内容抓取免费API-首席AI分享圈

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para captura de conteúdo da Web

WebPilot Introdução geral O Webpilot é um "assistente da Web" gratuito e de código aberto que permite que você se comunique livremente com qualquer página da Web ou execute tarefas automatizadas. Em vez de alternar entre páginas ou copiar e colar, basta selecionar o texto ou digitar comandos, e o Webpilot fornecerá informações em tempo real e tarefas inteligentes...

DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理-首席AI分享圈

DB-GPT: criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados

Introdução abrangente O DB-GPT é uma estrutura de desenvolvimento de aplicativos de dados nativos de IA de código aberto criada usando AWEL (Agentic Workflow Expression Language) e tecnologias de corpo inteligente. O projeto tem como objetivo criar uma infraestrutura no campo de modelos grandes por meio do desenvolvimento de vários recursos técnicos, incluindo um sistema de gerenciamento de vários modelos (SMMF),...

DreamTalk:使用一张头像图片即可生成表情丰富的说话视频-首席AI分享圈

DreamTalk: Gere vídeos de conversação expressivos com uma única imagem de avatar!

DreamTalk Introdução abrangente O DreamTalk é uma estrutura de geração de talking head de expressão orientada por modelo de difusão, desenvolvida em conjunto pela Universidade de Tsinghua, pelo Grupo Alibaba e pela Universidade de Ciência e Tecnologia de Huazhong. Ele consiste principalmente em três partes: uma rede de redução de ruído, um especialista em lábios com reconhecimento de estilo e um preditor de estilo, e é capaz de gerar uma variedade de entradas de áudio com base em...

InstantID:上传一张图片,迁移人像特征来生成不同风格图片-首席AI分享圈

InstantID: carregue uma imagem e migre os recursos de retrato para gerar diferentes estilos de imagens

Introdução abrangente O InstantID é uma tecnologia avançada voltada para a geração de imagens com estilos ou poses personalizados em segundos, garantindo um alto nível de fidelidade com o uso de uma única imagem de identificação de referência. A tecnologia usa uma solução baseada em modelo de difusão, integrando imagens faciais, imagens de...

ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具-首席AI分享圈

ComfyUI Portrait Master versão chinesa: ferramenta de palavras-chave para otimizar a geração de retratos

Introdução geral A versão chinesa do ComfyUI Portrait Master é uma ferramenta de geração de palavras-chave de retratos projetada para criadores de imagens de IA. A ferramenta ajuda os usuários a gerar retratos de alta qualidade, otimizando as palavras-chave. Os usuários podem escolher diferentes tipos de lentes, gênero, nacionalidade, expressão facial...

IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本-首席AI分享圈

IOPaint: ferramenta completa de processamento de imagens de IA, apagando, expandindo, substituindo elementos e desenhando texto.

Introdução geral O IOPaint é uma ferramenta de processamento de imagens de IA gratuita e de código aberto que oferece suporte ao apagamento, reparo e expansão de imagens. Ele usa modelos de IA de última geração para ajudar os usuários a remover facilmente objetos indesejados de imagens, corrigir falhas, adicionar novo conteúdo e até mesmo expandir imagens.

GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释-首席AI分享圈

GPT Acadêmico: Melhor tradução de artigos acadêmicos do Arxiv, correção de erros e interpretação de códigos

Introdução abrangente O GPT Academic é uma plataforma interativa para modelos de idiomas grandes otimizados para pesquisa acadêmica, fornecendo ferramentas para interfaces de interação pragmática para modelos de idiomas grandes, como GPT/GLM, otimizados especificamente para tradução em papel, leitura em papel, retoques e experiência de escrita. Seu design é modular e oferece suporte a atalhos personalizados...

gpt prompt engineer: Ferramenta de engenharia de prompt de modelo de linguagem | Otimização de comandos de prompt

Introdução geral O gpt-prompt-engineer é um projeto de código aberto no GitHub que se concentra na engenharia de prompts para modelos GPT. Os usuários podem inserir descrições de tarefas e casos de teste, e essa ferramenta é capaz de gerar, testar e classificar diferentes prompts para encontrar o melhor desempenho. O projeto utiliza os modelos GPT-4 e GPT-3.5-T...

STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告-首席AI分享圈

STORM: pesquise dados da Web com base no tópico, gere documentos com citações, relatórios de documentos longos

Introdução geral O STORM é um sistema de integração de conhecimento e geração de artigos desenvolvido pela equipe Oval da Universidade de Stanford. Ele se concentra na geração de artigos exaustivos do tipo Wikipedia (documentos sistemáticos) a partir do zero. O sistema usa modelos de linguagem em grande escala para pesquisa de tópicos, preparação de sinopses e modelagem de fontes reais da Internet...

XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印-首席AI分享圈

XHS-Downloader: Ferramenta gratuita de coleta de dados de Xiaohongshu, download em lote de notas de suporte, extração de vídeo, marca d'água de imagem

Introdução geral O XHS-Downloader é uma ferramenta de código aberto projetada para os usuários do Xiaohongshu para dar suporte à extração e ao download de imagens e vídeos sem marca d'água no Xiaohongshu. A ferramenta oferece uma variedade de recursos, incluindo a obtenção de cookies de navegadores, suporte para operações de linha de comando, downloads em lote, pontos de interrupção e assim por diante. Os usuários podem...

MediaCrawler:多社交媒体平台内容、视频评论爬虫工具-首席AI分享圈

MediaCrawler: conteúdo de plataformas de mídia social múltipla, ferramenta de rastreamento de comentários em vídeo

Introdução geral O MediaCrawler é uma ferramenta de rastreamento de conteúdo de mídia social criada para desenvolvedores. Ao fornecer um rastreador avançado, ele pode rastrear rapidamente vídeos, imagens, comentários, curtidas, retweets e outros dados de plataformas sociais, como Xiaohongshu, Jieyin, Shutterbugs, B-station, Weibo e assim por diante. Essa ferramenta torna...

MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件-首席AI分享圈

MJML: Crie facilmente e-mails responsivos e gere rapidamente e-mails de marketing com o ChatGPT

Introdução geral O MJML (Mail Junction Markup Language) é uma estrutura de código aberto desenvolvida pela equipe do Mailjet para simplificar a criação de modelos de e-mail responsivos. Com uma linguagem de marcação semântica e uma biblioteca de componentes avançada, os desenvolvedores podem criar e-mails bonitos e eficientes com menos código.

cognee:基于知识图谱构建的RAG开源框架,核心prompts学习-首席AI分享圈

cognee: uma estrutura de código aberto para a construção de RAGs com base em gráficos de conhecimento, aprendizagem de prompts centrais

Introdução geral O Cognee é uma solução de camada de dados confiável projetada para aplicativos de IA e agentes de IA. Projetado para carregar e construir contextos LLM (Large Language Model) para criar soluções de IA precisas e interpretáveis por meio de gráficos de conhecimento e armazenamentos de vetores. A estrutura facilita a economia de custos, a interpretabilidade e a...

pt_BRPortuguês do Brasil