Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 970 artigos

Tags: ai projetos de código aberto Página 21

zChunk:基于Llama-70B的通用语义分块策略-首席AI分享圈

zChunk: uma estratégia genérica de fragmentação semântica baseada no Llama-70B

Introdução abrangente O zChunk é uma nova estratégia de fragmentação desenvolvida pela ZeroEntropy para fornecer uma solução para a fragmentação semântica genérica. A estratégia se baseia no modelo Llama-70B e otimiza o processo de fragmentação de um documento, solicitando a geração de fragmentações e garantindo a manutenção de uma alta relação sinal-ruído durante a recuperação de informações. zChunk é especialmente adequado para...

Hibiki:实时语音翻译模型,保留原声特点的流式翻译-首席AI分享圈

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original

Introdução geral O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente da tradução off-line tradicional, o Hibiki é capaz de gerar tradução de fala natural no idioma de destino e fornecer tradução de texto em tempo real enquanto o usuário fala. O modelo usa uma arquitetura de vários fluxos e é capaz de...

Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话-首席AI分享圈

Qwen4Mac: use os grandes modelos do Qwen na barra de menu do Mac para conversas a qualquer momento!

Introdução geral O Qwen4Mac é um projeto de código aberto criado para integrar o Qwen Large Language Model (LLM) à barra de menus do Mac, facilitando aos usuários chamá-lo e usá-lo a qualquer momento. O projeto é desenvolvido e mantido por andreaturchet e fornece uma maneira fácil para os usuários acessarem e usarem diretamente o Qw...

口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)-首席AI分享圈

Pocket AI: um assistente de IA off-line executado em seu telefone, adaptado para o DeepSeek-R1 (5,37 GB)

Introdução geral O Pocket AI (PocketPal AI versão chinesa) é um poderoso assistente de IA off-line projetado para permitir que os usuários conversem com a IA a qualquer hora e em qualquer lugar. Ele se baseia em modelos de idiomas pequenos (SLMs) e pode ser executado em telefones celulares sem conexão com a Internet, especialmente adaptado à experiência do usuário chinês. O Pocket AI é compatível com vários modelos de idiomas pequenos...

Kokoro WebGPU:浏览器中离线运行的文本转语音服务-首席AI分享圈

Kokoro WebGPU: um serviço de conversão de texto em fala para operação off-line em navegadores

Introdução geral O Kokoro WebGPU é a versão WebGPU do modelo de conversão de texto em fala (TTS) do Kokoro, fornecido pela WebML Community na plataforma Hugging Face. O projeto utiliza a tecnologia WebGPU para permitir que os usuários executem conversões eficientes de texto para fala localmente em seus navegadores.

OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划-首席AI分享圈

OpenHealthForAll: assistente de IA para gerenciamento de dados pessoais de saúde, upload de relatórios de exames para um plano de saúde personalizado

Introdução geral O OpenHealthForAll é um projeto de código aberto criado para ajudar os usuários a gerenciar e entender seus dados pessoais de saúde. Ao aproveitar a tecnologia de inteligência artificial, o OpenHealthForAll fornece um assistente de saúde administrado localmente para ajudar os usuários a gerenciar e analisar melhor suas informações de saúde. O projeto oferece suporte...

OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统-首席AI分享圈

OpenPilot: sistema de direção autônoma de código aberto, faça você mesmo um conjunto de seu próprio sistema de direção inteligente para seu carro

Introdução geral O OpenPilot é um sistema de direção autônoma de código aberto desenvolvido pela comma.ai para aprimorar a experiência de direção e a segurança dos veículos existentes com recursos avançados de assistência ao motorista. Desde o seu primeiro lançamento em 2016, o OpenPilot é compatível com mais de 275 modelos de veículos e está constantemente atualizando e otimizando sua funcionalidade...

Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术-首席AI分享圈

Agentic Security: ferramenta de varredura de vulnerabilidades LLM de código aberto que fornece técnicas de ataque e testes de fuzz abrangentes

Introdução geral O Agentic Security é uma ferramenta de código aberto de varredura de vulnerabilidades do LLM (Large Language Model) projetada para fornecer aos desenvolvedores e profissionais de segurança técnicas abrangentes de teste e ataque de fuzz. A ferramenta é compatível com conjuntos de regras personalizados ou ataques baseados em agentes, é capaz de integrar APIs LLM para testes de estresse e oferece...

CogVLM2:开源多模态模型,支持视频理解与多轮对话-首席AI分享圈

CogVLM2: modelo multimodal de código aberto para apoiar a compreensão de vídeos e várias rodadas de diálogo

Introdução geral O CogVLM2 é um modelo multimodal de código aberto desenvolvido pelo Grupo de Pesquisa em Mineração de Dados da Universidade de Tsinghua (THUDM), baseado na arquitetura Llama3-8B e projetado para oferecer desempenho comparável ou até melhor que o GPT-4V. O modelo oferece suporte à compreensão de imagens, ao diálogo em várias rodadas e à compreensão de vídeos, e é capaz de lidar com conteúdo de até 8K de comprimento...

VisoMaster:强大且易用的图片/视频换脸和编辑软件-首席AI分享圈

VisoMaster: software de edição e de melhoria de fotos e vídeos potente e fácil de usar

Introdução geral O VisoMaster é uma ferramenta de edição e troca de faces de vídeo poderosa e fácil de usar que utiliza tecnologia de inteligência artificial para obter efeitos naturais e realistas de troca de faces. Seja uma imagem ou um vídeo, o VisoMaster gera resultados de troca de rosto de alta qualidade com operações simples, adequadas tanto para usuários gerais quanto para profissionais....

基于RAG构建提供健康建议的小助手(实验项目)-首席AI分享圈

Construção, com base em RAG, de um mini-assistente que fornece orientação sobre saúde (projeto piloto)

Introdução abrangente O LLM-RAG-Longevity-Coach é um chatbot baseado nas tecnologias Large Language Modelling (LLM) e Retrieval Augmented Generation (RAG), projetado para fornecer conselhos personalizados sobre saúde e longevidade aos usuários. Desenvolvido por Tyler Burleigh, o projeto utiliza o Streamlit para criar a interface do usuário,...

Maestro:简化主流开源视觉语言模型微调过程的工具-首席AI分享圈

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código aberto

Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como Florence-2, PaliGemma ...

One-Prompt-One-Story:文本提示生成角色身份一致的图像-首席AI分享圈

One-Prompt-One-Story: os prompts de texto geram imagens consistentes de identidade de personagem

Introdução abrangente One-Prompt-One-Story (1Prompt1Story) é uma ferramenta inovadora de geração de texto para imagem projetada para permitir a geração consistente de imagens a partir de um único prompt. O projeto, apresentado por Tao Liu et al. no ICLR 2025, emprega uma abordagem sem treinamento que é capaz de manter a identidade do personagem enquanto...

为Next.js应用程序添加RAG驱动的在线聊天工具-首席AI分享圈

Adição de uma ferramenta de bate-papo on-line orientada por RAG aos aplicativos Next.js

Introdução abrangente O componente de bate-papo Upstash RAG é um componente React projetado para aplicativos Next.js para fornecer uma interface de bate-papo com IA baseada na tecnologia RAG (Retrieval Augmented Generation). O componente combina o Upstash Vector para pesquisa de similaridade, o Together AI para modelos de linguagem grandes (LL...

AudioNotes:快速提取音视频内容并生成结构化笔记-首席AI分享圈

AudioNotes: extraia rapidamente o conteúdo de áudio e vídeo e gere notas estruturadas

O AudioNotes é um sistema de notas estruturadas de áudio/vídeo baseado no FunASR e no Qwen2. Ele pode extrair rapidamente o conteúdo de áudio e vídeo e chamar o grande modelo de organização para gerar notas estruturadas em Markdown, o que é conveniente para os usuários lerem e encontrarem informações rapidamente. O sistema é compatível com vários ...

Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具-首席AI分享圈

Bilingual Book Maker: Use a tradução de IA para criar e-books bilíngues, ferramenta de tradução automática de livros completos

Introdução abrangente O Bilingual Book Maker é um projeto de código aberto criado para ajudar os usuários a criar versões multilíngues de eBooks usando a tecnologia de IA. A ferramenta usa principalmente o ChatGPT para tradução e oferece suporte a vários formatos de arquivo, incluindo epub, txt e srt. O Bilingual Book Maker foi projetado para traduzir livros eletrônicos que...

Rowfill:批量提取文档结构化信息并自动化分析-首席AI分享圈

Rowfill: extração em lote de informações estruturadas de documentos e análise automatizada

Introdução abrangente O Rowfill é uma plataforma de processamento de documentos de código aberto projetada para profissionais do conhecimento. Ele usa tecnologias avançadas de IA para extrair, analisar e processar dados de documentos, imagens e PDFs complexos. O Rowfill oferece suporte a modelos nativos de linguagem grande (LLMs) e modelos visuais OpenAI para garantir que os dados sejam ocultos...

PRAG:提升问答系统性能的参数化检索增强生成工具-首席AI分享圈

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução abrangente O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração aumentada por recuperação que visa aprimorar a geração incorporando conhecimento externo diretamente no espaço de parâmetros de um Modelo de Linguagem Grande (LLM). A ferramenta supera o método tradicional de geração aumentada por recuperação contextual de...

GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告-首席AI分享圈

Pesquisador GPT: gere relatórios de pesquisa abrangentes e detalhados usando dados locais e baseados na Web

Introdução geral O GPT Researcher é uma ferramenta de agente autônomo baseada no Large Language Model (LLM), projetada para realizar pesquisas locais e na Web e gerar relatórios de pesquisa detalhados. A ferramenta oferece desempenho estável e velocidade mais rápida ao paralelizar o trabalho do agente, garantindo informações precisas e imparciais.GPT...

pt_BRPortuguês do Brasil