Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 972 artigos

Tags: ai projetos de código aberto Página 37

infinite-zoom-stable-diffusion:生成无限缩放循环视频-首席AI分享圈

infinite-zoom-stable-diffusion: gerar vídeo em loop com zoom infinito

Introdução abrangente O Infinite Zoom Stable Diffusion (Difusão estável de zoom infinito) é um projeto de código aberto desenvolvido para criar vídeos com zoom infinito usando técnicas de difusão estável. O projeto oferece um notebook Colab fácil de usar, em que os usuários podem gerar um loop infinito de vídeo por meio de vários prompts. Projeto ...

Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip-首席AI分享圈

Easy-Wav2Lip: ferramenta para sincronização labial de vídeo de alta qualidade, otimizada para Wav2Lip

Introdução geral O Easy-Wav2Lip é uma ferramenta aprimorada baseada no Wav2Lip, projetada para simplificar o processo de sincronização labial de vídeo. A ferramenta oferece configuração e implementação mais simples, suporta o Google Colab e a instalação local. Ao otimizar o algoritmo, o Easy-Wav2Lip aumenta significativamente a velocidade de processamento e corrige...

Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。-首席AI分享圈

Research Rabbit: pesquisa na Web e elaboração de relatórios usando o LLM nativo, detalhando automaticamente os tópicos especificados pelo usuário e gerando resumos.

Introdução geral O Research Rabbit é um assistente nativo de pesquisa e resumo na Web baseado em LLM (Large Language Model). Depois que o usuário fornece um tópico de pesquisa, o Research Rabbit gera uma consulta de pesquisa, obtém resultados relevantes na Web e resume esses resultados. Ele repetirá esse processo para preencher a lacuna de conhecimento...

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e oferece uma interface gráfica do usuário (GUI) intuitiva e fácil de usar. Com esse projeto, os usuários podem experimentar o corpo inteligente...

HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替-首席AI分享圈

HelloMeme: gere imagens ou vídeos consistentes com ações de expressão local de alta fidelidade, Runway Act one open source ping pong!

Introdução abrangente O HelloMeme é um projeto de código aberto desenvolvido pela HelloVision, com o objetivo de gerar imagens e vídeos de alta qualidade por meio da integração do Spatial Knitting Attentions para incorporar condições de alto nível e alta fidelidade em modelos de difusão. O código e a modelagem do projeto ...

Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务-首席AI分享圈

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução abrangente O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). Ela foi desenvolvida pela Lumina AI Inc. e usa modelos visuais avançados para a ingestão de documentos...

GitIngest:快速将Github代码仓库转为适合LLM理解的文本-首席AI分享圈

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub em texto adequado para o uso do LLM. A ferramenta oferece análise com um clique...

CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型-首席AI分享圈

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

Introdução geral A CodeArena é uma plataforma exclusiva projetada para apresentar os melhores modelos de geração de código-fonte aberto (LLMs) por meio de confrontos em tempo real. Os usuários podem assistir a diferentes LLMs competindo nas mesmas tarefas de programação e ver os modelos com melhor desempenho por meio de tabelas de classificação em tempo real. A plataforma utiliza a Together AI para gerar código...

NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全-首席AI分享圈

NSFW Detector: detecta se um arquivo contém conteúdo NSFW para proteger a segurança dos dados.

Introdução abrangente O NSFW Detector é uma ferramenta de detecção de conteúdo incômodo baseada em IA, usada principalmente para detectar se imagens, vídeos, arquivos PDF etc. contêm conteúdo incômodo. A ferramenta adota o modelo Falconsai/nsfwimagedetection e usa o vit-base-patch16-224-in do Google...

ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话-首席AI分享圈

ChatFree (ChatAnywhere-2): copiloto nativo criado usando a API GPT, com suporte para diálogos complementares em qualquer janela.

Introdução geral O ChatFree é um projeto de código aberto que visa a liberar os aplicativos de IA dos usuários das restrições dos navegadores para serem executados localmente. Criado usando a API GPT, o Copilot foi projetado para oferecer suporte a uma ampla variedade de softwares de escritório, como Office, Word, WPS e outros. Desenvolvido pelo usuário do GitHub hmhm2022, o projeto fornece um...

Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包-首席AI分享圈

Sketch-Gen: gera esboços e desenhos de linha de alta qualidade, retropropaga palavras de sugestão de imagem, instalação de pacote com um clique

Introdução geral Sketch-Gen é uma ferramenta de geração de esboços e desenhos de linha baseada em tecnologia de IA, projetada para ajudar artistas e designers a gerar rapidamente esboços e desenhos de linha de alta qualidade. Derivada do projeto Paints-UNDO, a ferramenta usa modelos avançados de aprendizado de máquina para poder extrair linhas finas de imagens...

PydanticAI: A criação de aplicativos de IA generativa com o Pydantic facilita a criação de aplicativos de IA de nível de produção

Introdução geral O PydanticAI é uma estrutura de agente Python baseada no Pydantic, projetada para simplificar o desenvolvimento de aplicativos de IA generativa. Desenvolvida pela equipe da Pydantic, ela oferece suporte a uma ampla variedade de modelos (por exemplo, OpenAI, Gemini, Groq etc.) e fornece combinações seguras de tipo de fluxo de controle e agentes.

Steel Browser:自动化网页浏览器API,构建控制浏览器操作的智能体与应用-首席AI分享圈

Steel Browser: API automatizada de navegador da Web para criar inteligência e aplicativos que controlam as operações do navegador

Introdução geral O Steel Browser é uma API de navegador de código aberto projetada para agentes e aplicativos de IA. Ele fornece uma instância de navegador completa que permite aos usuários automatizar operações na Web sem se preocupar com a infraestrutura. O Steel Browser é compatível com uma variedade de estruturas de automação, como o Puppeteer...

E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一-首席AI分享圈

E2M: Converta vários formatos de arquivo para Markdown e obtenha facilmente uma formatação uniforme do documento

Introdução geral O E2M (Everything to Markdown) é uma biblioteca Python de código aberto projetada para converter uma ampla variedade de formatos de arquivo para o formato Markdown. A ferramenta é compatível com uma grande variedade de tipos de arquivos, incluindo doc, docx, epub, html, htm, url, pdf, ppt, pptx, mp3 e m4a. O E2M usa...

混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型-首席AI分享圈

Vídeo híbrido de Vincennes: geração de imagens realistas de vídeo de alta qualidade, geração de vídeo de código aberto da Tencent de modelos grandes

Introdução abrangente O Tencent Mixed Yuan Text Generation Video (disponível no Yuanbao APP) é uma plataforma de geração de vídeo baseada na tecnologia de IA lançada pela Tencent. A plataforma utiliza o grande modelo híbrido da Tencent com um poderoso conhecimento entre domínios e compreensão de linguagem natural, e é capaz de gerar conteúdo de vídeo de alta qualidade com base nas descrições textuais dos usuários...

Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库-首席AI分享圈

Llama OCR: biblioteca de OCR que converte imagens em Markdown em três linhas de código usando a interface Llama 3.2 Vision gratuita

Introdução geral O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision que converte documentos para o formato Markdown. Desenvolvida pela Nutlope, a biblioteca usa a interface gratuita do Llama 3.2 fornecida pela Together AI para analisar imagens e retornar documentos em formato Markdown...

Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体-首席AI分享圈

Clevrr Computer: automatizando a inteligência de manipulação da área de trabalho com a biblioteca PyAutoGUI

Introdução geral O Clevrr Computer é um projeto de código aberto que visa automatizar as operações do sistema usando a biblioteca PyAutoGUI. O projeto foi inspirado pelo Anthropic para projetar um agente de automação que possa executar com precisão e eficiência as tarefas de operação do sistema do usuário.

Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流-首席AI分享圈

Director: estrutura de agente de vídeo inteligente para executar fluxos de trabalho de pesquisa, edição e geração de vídeo com descrições de linguagem natural

Introdução geral O Director é uma estrutura de código aberto projetada para simplificar e otimizar as interações e os fluxos de trabalho de vídeo por meio da criação de agentes de vídeo inteligentes. A estrutura é baseada na infraestrutura de "vídeo como dados" do VideoDB e é capaz de lidar com tarefas complexas de vídeo, como pesquisa, edição, compilação e geração, e transmissão instantânea...

MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息-首席AI分享圈

ChatSum do servidor MCP: Confiando no MCP para consultar e resumir mensagens do WeChat no Claude

Introdução geral O MCP Server ChatSum é um projeto de código aberto criado para ajudar os usuários a consultar e resumir mensagens de bate-papo. O projeto está hospedado no GitHub e fornece um conjunto de ferramentas avançado que permite aos usuários consultar transcrições de bate-papo com base em parâmetros específicos e gerar resumos de acordo.MCP Server ChatSum principal...

pt_BRPortuguês do Brasil