Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 967 artigos

Tags: ai projetos de código aberto Página 4

集成多种先进语音合成服务的开源运营项目-首席AI分享圈

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala

Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...

VideoMind:视频按时间戳定位内容与问答的开源项目-首席AI分享圈

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a maneira como os humanos entendem o vídeo, dividindo as tarefas em planejamento,...

SuperCoder:命令行终端运行的智能代码助手-首席AI分享圈

SuperCoder: assistente de código inteligente para execução em terminal de linha de comando

Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ele usa a tecnologia de IA para ajudar os usuários a pesquisar código, visualizar a estrutura do projeto, editar arquivos e corrigir bugs. O projeto tem código aberto por huytd no GitHub e é compatível com Linux, MacOS e Windows...

Emigo:在Emacs中使用AI完成复杂编程任务的助手-首席AI分享圈

Emigo: um assistente para tarefas de programação complexas usando IA no Emacs

Introdução geral O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub. O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub, que ajuda os programadores a concluir a análise, a geração, a modificação e outras tarefas de código no Emacs, integrando um modelo de linguagem em grande escala (LLM).

SegAnyMo:从视频中自动分割任意运动物体的开源工具-首席AI分享圈

SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos

Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou veículos. Ela combina o TAP...

GenXD:生成任意3D和4D场景视频的开源框架-首席AI分享圈

GenXD: estrutura de código aberto para gerar vídeos de cenas arbitrárias em 3D e 4D

Introdução geral O GenXD é um projeto de código aberto desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, resolvendo a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto analisa o movimento da câmera e do objeto,...

ChatAnyone:从照片生成半身数字人肖像视频的工具-首席AI分享圈

ChatAnyone: uma ferramenta para gerar vídeos de retratos humanos digitais de meio corpo a partir de fotografias

Introdução geral O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto baseia-se em um modelo de difusão de movimento hierárquico que gera movimentos da cabeça, gestos e expressões para...

Search-R1:强化学习训练大模型搜索与推理的工具-首席AI分享圈

Search-R1: Aprendizado por reforço para treinar modelos grandes para pesquisa e raciocínio

Introdução geral O Search-R1 é um projeto de código aberto desenvolvido por PeterGriffinJin no GitHub e baseado na estrutura veRL. Ele usa técnicas de aprendizagem por reforço (RL) para treinar grandes modelos de linguagem (LLMs), permitindo que os modelos aprendam de forma autônoma a raciocinar e invocar mecanismos de pesquisa para resolver problemas. O projeto é compatível com o Qwen2.5...

DeepGemini:多模型编排任务并封装为API接口-首席AI分享圈

DeepGemini: orquestração de tarefas de vários modelos e encapsulamento em uma interface de API

Introdução geral O DeepGemini é um projeto de código aberto, criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar com flexibilidade uma variedade de modelos de IA e é chamado por meio da interface de API compatível com OpenAI. O projeto é baseado em Python 3.11 e ...

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: ComputerGYM, AgentAI e Playwright, e os usuários podem ...

II-Researcher:深度搜索与分步推理解答复杂问题-首席AI分享圈

II-Researcher: pesquisa profunda e raciocínio por etapas para responder a perguntas complexas

Introdução geral O II-Researcher é uma ferramenta de pesquisa de inteligência artificial de código aberto desenvolvida pela equipe do Intelligent-Internet e hospedada no GitHub. Ele foi projetado para pesquisa profunda e raciocínio complexo, e é capaz de responder a perguntas complexas por meio de pesquisas inteligentes na Web e análise em várias etapas. O projeto foi lançado em 27 de março de 2025...

Cua:让AI代理在macOS/Linux沙盒中安全执行应用-首席AI分享圈

Cua: habilitando agentes de IA para executar aplicativos com segurança em sandboxes do macOS/Linux

Introdução geral O Cua é um projeto de código aberto chamado Computer-Use Agent (pronuncia-se "koo-ah"), projetado para dispositivos Apple Silicon para criar e executar máquinas virtuais macOS e Linux de alto desempenho em velocidades próximas a 90% nativamente. Ele foi projetado para dispositivos Apple Silicon, pode criar e executar máquinas virtuais macOS e Linux de alto desempenho, com velocidades próximas às do dispositivo nativo 90%. O Cua usa o Ap...

Paper to Podcast:把学术论文转换为多人对话播客-首席AI分享圈

Paper to Podcast: conversão de artigos acadêmicos em podcasts de conversas com várias pessoas

Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada em transformar trabalhos de pesquisa acadêmica em podcasts animados e divertidos. Ela facilita a compreensão de conteúdos acadêmicos complexos usando tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens: o apresentador, o aluno e o especialista. Isso ...

OmniSQL:将自然语言转化为高质量SQL查询的模型-首席AI分享圈

OmniSQL: um modelo para transformar a linguagem natural em consultas SQL de alta qualidade

Introdução geral O OmniSQL é um projeto de código aberto desenvolvido pela equipe do RUCKBReasoning e hospedado no GitHub. Sua principal função é transformar as perguntas de linguagem natural inseridas pelo usuário em instruções de consulta SQL de alta qualidade para ajudar os usuários a interagir facilmente com os bancos de dados. O projeto se baseia em um texto automatizado...

LatentSync:用音频直接生成唇形同步视频的开源工具-首席AI分享圈

LatentSync: uma ferramenta de código aberto para gerar vídeo com sincronização labial diretamente do áudio

Introdução geral O LatentSync é uma ferramenta de código aberto desenvolvida pela ByteDance e hospedada no GitHub. Ela aciona os movimentos labiais dos personagens em um vídeo diretamente por meio do áudio, permitindo que o formato da boca corresponda à voz com precisão. O projeto é baseado no modelo de difusão latente do Stable Diffusion, conhecido como LatentSync.

基于Workers AI免费将多种文件转为Markdown格式-首席AI分享圈

Converta vários arquivos para o formato Markdown gratuitamente com base em Workers AI

Introdução geral O serverless-markdown-convertor é uma ferramenta de código aberto gratuita, baseada no desenvolvimento do Cloudflare Worker e do Workers AI, que pode converter uma variedade de arquivos para o formato Markdown. Ele é compatível com PDF, imagens, documentos do Office, HTML e outros tipos de arquivos comuns, sem a necessidade de ...

pt_BRPortuguês do Brasil