Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 970 artigos

Tags: ai projetos de código aberto Página 28

Micro Agent:AI编程智能体,自动生成代码并测试、修复代码-首席AI分享圈

Microagente: inteligência de programação de IA que gera código automaticamente e o testa e corrige.

Introdução geral O Micro-Agent é um assistente de codificação de IA de código aberto desenvolvido pela Builder.io, projetado para fornecer aos desenvolvedores a capacidade de gerar e testar códigos automaticamente. Ele gera casos de teste compreendendo descrições de linguagem natural e itera o código até que todos os testes sejam aprovados, reduzindo assim a necessidade de os desenvolvedores escreverem e depurarem manualmente a geração...

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: reconhecimento e síntese de fala off-line com o ONNXRuntime

Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com uma variedade de plataformas, incluindo Android, iOS, Raspberry Pi etc., e pode ser usado na ausência de conectividade de rede em tempo real...

Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化-首席AI分享圈

Eko: Fluxos de trabalho corporais inteligentes de criação de linguagem natural para automação de desktops e navegadores

Introdução geral A Eko é uma estrutura JavaScript de nível de produção projetada para criar fluxos de trabalho eficientes de agentes inteligentes por meio de descrições de linguagem natural. Ele foi projetado para permitir que os desenvolvedores automatizem tarefas cotidianas usando tecnologias de IA sem programação profunda.

Agent Inbox:与AI智能体进行人机交互的管理界面-首席AI分享圈

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada.

Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容-首席AI分享圈

Social Media Agent: um assistente inteligente para mídias sociais que gera e gerencia automaticamente o conteúdo das mídias sociais

Introdução geral O Agente de mídia social (SMA) é um projeto de código aberto que gerencia informações de interação pela nova Caixa de entrada do agente, projetado para ajudar os usuários a gerar e gerenciar automaticamente o conteúdo de mídia social. O projeto foi desenvolvido pela equipe da LangChain e utiliza técnicas avançadas de processamento de linguagem natural e colaboração entre humanos e computadores...

Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程-首席AI分享圈

Assistente executivo de IA: assistente executivo de IA, lembretes para ler e-mails e planejar agendas de trabalho

Introdução geral O Executive AI Assistant (EAIA) é uma ferramenta de assistente baseada em IA projetada para ajudar os usuários a automatizar e gerenciar suas tarefas diárias. Desenvolvida pela LangChain, a ferramenta é capaz de lidar com e-mails, agendamento, gerenciamento de tarefas etc. O EAIA faz isso integrando-se a uma variedade de APIs e serviços, como o Open...

MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色-首席AI分享圈

MangaNinjia: uma ferramenta automatizada de coloração de linhas para colorir rapidamente desenhos de anime em preto e branco.

Introdução abrangente O MangaNinjia é um projeto de código aberto desenvolvido pelo Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), com foco no processamento automatizado da coloração de desenhos de linha. Essa ferramenta alcança a correspondência precisa de cores de imagens de referência por meio de técnicas de aprendizagem profunda, o que melhora muito a eficiência na criação de quadrinhos...

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...

Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识-首席AI分享圈

Pesquisa o1: Capacitar modelos de inferência para pesquisar ativamente, permitindo que modelos grandes pesquisem conhecimento externo enquanto pensam

Introdução abrangente O Search-o1 é um projeto de código aberto que visa aprimorar o desempenho de modelos de raciocínio em larga escala (LRMs) por meio da integração de mecanismos de pesquisa avançados. A ideia central é resolver o problema do déficit de conhecimento encontrado no processo de raciocínio por meio de pesquisa dinâmica e integração de conhecimento. O projeto é desenvolvido pela equipe sunnynexus, ...

Llama 3.2 Reasoning WebGPU: executando o Llama-3.2 em um navegador

Introdução geral Transformers.js é uma biblioteca JavaScript fornecida pela Hugging Face, projetada para executar modelos de aprendizado de máquina de última geração diretamente no navegador, sem suporte de servidor. A biblioteca é comparável à biblioteca de transformadores da Hugging Face para Python e oferece suporte a uma variedade de modelos...

MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布-首席AI分享圈

MoneyPrinter V2: gere e publique automaticamente vídeos curtos no YouTube e conteúdo no Twitter

Introdução geral O MoneyPrinter V2 é um projeto de código aberto desenvolvido por FujiwaraChoki para ajudar os usuários a ganhar dinheiro on-line por meio da automação. O projeto integra principalmente a automação do Twitter, a geração de vídeos curtos do YouTube, o marketing de afiliados e outras funções. Os usuários podem usar scripts Python para conteúdo...

RTranslator:语音实时翻译安卓应用,免费且支持离线使用-首席AI分享圈

RTranslator: um aplicativo de tradução de voz em tempo real para Android, gratuito e off-line!

Introdução geral O RTranslator é um aplicativo de tradução off-line em tempo real, quase gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso conectando um fone de ouvido Bluetooth e conversar com outras pessoas como se estivessem falando seu próprio idioma.

Gemini Next Chat:一键免费部署您的私人多模态Gemini应用-首席AI分享圈

Gemini Next Chat: Implemente seu aplicativo Gemini multimodal privado gratuitamente com um clique!

Introdução geral O Gemini Next Chat é um projeto de código aberto desenvolvido para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implementá-lo gratuitamente com um clique no Vercel. O Gemini Next Chat oferece um cliente multiplataforma ...

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...

Vanna:利用RAG技术将文本生成精准SQL查询-首席AI分享圈

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Introdução geral O Vanna é uma estrutura Python de código aberto licenciada pelo MIT que se concentra na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará as consultas SQL apropriadas. Essas consultas podem ser automaticamente...

SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频-首席AI分享圈

SVFR: uma estrutura unificada para implementar o reparo de faces em vídeos, reparando vídeos antigos com retratos em preto e branco e desfocados

Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza a priori geradores e de movimento para integrar informações específicas da tarefa por meio de uma estrutura unificada de restauração facial, propondo...

LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话-首席AI分享圈

LiveTalking: sistema interativo digital humano ao vivo em tempo real de código aberto para obter um diálogo síncrono de áudio e vídeo

Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema oferece suporte a ...

Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑-首席AI分享圈

Aider: ferramenta de assistente de programação de código aberto, use o assistente de IA para escrever códigos e editar arquivos

Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação, integra-se perfeitamente aos fluxos de trabalho do Git e pode...

JoyGen:音频驱动的3D深度感知人像说话视频编辑工具-首席AI分享圈

JoyGen: Ferramenta de edição de vídeo de retratos falados em 3D com reconhecimento de profundidade e orientada por áudio

Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do locutor...

pt_BRPortuguês do Brasil