Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 966 artigos

Tags: ai projetos de código aberto Página 2

Tarsier:生成高质量视频描述的开源视频理解模型-首席AI分享圈

Tarsier: um modelo de compreensão de vídeo de código aberto para gerar descrições de vídeo de alta qualidade

Introdução abrangente O Tarsier é uma família de modelos de linguagem de vídeo de código aberto desenvolvida pela ByteDance para gerar descrições de vídeo de alta qualidade. Ele consiste em uma estrutura simples: o CLIP-ViT processa os quadros de vídeo e analisa as relações temporais em combinação com um modelo de linguagem grande (LLM). A versão mais recente do Tarsier2-...

Austen:分析书籍角色关系并生成图表的AI工具-首席AI分享圈

Austen: uma ferramenta de IA para analisar as relações entre personagens de livros e gerar gráficos

Introdução geral O Austen é uma ferramenta de IA de código aberto que usa a estrutura Angular e a inicialização Analogjs, combinadas com a tecnologia Mermaidjs para gerar gráficos que ajudam os usuários a analisar as relações entre personagens em livros. Os usuários podem digitar o nome do livro na Open Library, e o Austen automaticamente, por meio da IA,...

DeepCoder-14B-Preview:擅长代码生成的的开源模型-首席AI分享圈

DeepCoder-14B-Preview: um modelo de código aberto que se destaca na geração de código

Introdução geral O DeepCoder-14B-Preview é um modelo de geração de código-fonte aberto desenvolvido pela equipe da Agentica e lançado na plataforma Hugging Face. Ele se baseia no DeepSeek-R1-Distilled-Qwen-14B, otimizado por técnicas de aprendizado por reforço distribuído (RL), e é capaz de lidar com até 64 mil tokens de super...

Thera:任意尺寸图像放大、去锯齿的开源工具-首席AI分享圈

Thera: ampliação de imagens de qualquer tamanho, ferramentas de código aberto de remoção de serrilhado

Introdução geral O Thera é uma ferramenta de super-resolução de imagens de código aberto desenvolvida por uma equipe da ETH Zurich e da Universidade de Zurich. Ela pode aplicar zoom em imagens de baixa resolução em escalas arbitrárias, como 2x, 3,14x ou até mesmo múltiplos não inteiros, e aplicar zoom sem serrilhados ou borrados.

A2A:谷歌发布AI智能间通信的开放协议-首席AI分享圈

A2A: Google lança protocolo aberto para comunicação entre inteligências de IA

Introdução geral O A2A (Agent2Agent) é um protocolo de código aberto desenvolvido pelo Google para permitir que as inteligências de IA desenvolvidas por diferentes estruturas ou fornecedores se comuniquem e colaborem entre si. Ele fornece um conjunto padronizado de métodos para que as inteligências descubram os recursos umas das outras, compartilhem tarefas e realizem o trabalho.A2A aborda os principais...

Tabby:可集成到 VSCode 的本地自托管AI编程助手-首席AI分享圈

Tabby: um assistente de programação de IA nativo auto-hospedado que se integra ao VSCode

Introdução geral O Tabby é um assistente de programação de IA de código aberto desenvolvido pela equipe do TabbyML que os usuários podem implantar localmente ou em um servidor. Ele oferece recursos semelhantes aos do GitHub Copilot, como preenchimento automático de código e perguntas e respostas inteligentes, mas o melhor recurso é o fato de ser auto-hospedado e não depender de serviços de nuvem ou...

LM Speed:快速测试大模型API性能-首席AI分享圈

Velocidade do LM: teste rápido do desempenho de APIs de modelos grandes

Introdução geral O LM Speed é uma ferramenta projetada especificamente para desenvolvedores de IA, bem como um site de serviço on-line lmspeed.net. Sua função principal é testar e analisar o desempenho das APIs de modelo de linguagem, ajudando os usuários a identificar rapidamente os gargalos de velocidade e otimizar as estratégias de chamada. A ferramenta é compatível com APIs OpenAI e muitas outras...

DevDocs:快速抓取并整理技术文档的MCP服务-首席AI分享圈

DevDocs: um serviço MCP para rastrear e organizar rapidamente a documentação técnica

Introdução geral O DevDocs é uma ferramenta de código aberto totalmente gratuita desenvolvida pela equipe da CyberAGI e hospedada no GitHub. Projetada para programadores e desenvolvedores de software, ela parte do URL de um documento técnico, rastreia automaticamente as páginas relevantes e as organiza em arquivos Markdown ou JSON concisos. Ele tem um...

TestDriver:使用AI自动测试软件的智能工具-首席AI分享圈

TestDriver: uma ferramenta inteligente para automatizar testes de software usando IA

Introdução geral O TestDriver é um site que usa tecnologia de inteligência artificial para ajudar os desenvolvedores a testar software. Ele automatiza a tarefa de testar software simulando ações humanas, como clicar em um mouse ou digitar um texto. O núcleo do site é um "computador que usa um agente de IA" que opera o computador como uma pessoa real, adequado para...

SiteMCP:抓取网站内容并转为MCP服务-首席AI分享圈

SiteMCP: rastrear o conteúdo do site e transformá-lo em serviços MCP

Introdução geral O SiteMCP é uma ferramenta de código aberto cuja função principal é rastrear todo o conteúdo de um site e transformá-lo em um servidor MCP (Model Context Protocol) que permite que assistentes de IA (como o Claude Desktop) acessem diretamente os dados do site. Ela foi desenvolvida pelo desenvolvedor ryoppippi e está hospedada no Git...

Deep Chat:快速集成到网站的AI聊天组件-首席AI分享圈

Deep Chat: um componente de bate-papo com IA para integração rápida com o site

Descrição geral O Deep Chat é um componente de bate-papo de IA de código aberto projetado para desenvolvedores da Web. Foi desenvolvido por Ovidijus Parsiunas, hospedado no GitHub, e atualmente tem mais de 2 mil estrelas. Os usuários podem integrá-lo em seus sites com uma configuração simples e ele suporta a interface com OpenAI, Huggi...

Arrakis:为AI智能体提供安全沙盒环境的开源工具-首席AI分享圈

Arrakis: uma ferramenta de código aberto que fornece um ambiente seguro de sandbox para inteligências de IA

Introdução geral O Arrakis é um ambiente de sandbox projetado para inteligências de IA para fornecer um ambiente seguro e personalizável. Ele foi desenvolvido por Abhishek Bhardwaj, hospedado no GitHub, e usa a licença AGPL v3. O Arrakis isola o código de IA por meio da tecnologia de máquina virtual leve (MicroVM), garantindo...

自动解析PDF内容并提取文字与表格的开源服务-首席AI分享圈

Analise automaticamente o conteúdo do PDF e extraia texto e tabelas de serviços de código aberto

Introdução abrangente Analisa automaticamente o layout de documentos PDF, identifica texto, títulos, imagens, tabelas, fórmulas e outros elementos na página e determina sua ordem correta. A ferramenta é compatível com a funcionalidade OCR e permite converter PDFs digitalizados em texto pesquisável. Ela é executada no Docker e oferece dois modelos: modelo visual (Vis...

Dolphin:面向亚洲语言识别与语音转文本模型-首席AI分享圈

Dolphin: reconhecimento de idiomas asiáticos e modelagem de fala para texto para idiomas asiáticos

Introdução abrangente O Dolphin é um modelo de código aberto desenvolvido pela DataoceanAI em colaboração com a Universidade de Tsinghua, com foco no reconhecimento de fala e de idioma para idiomas asiáticos. Ele é compatível com 40 idiomas do Leste Asiático, do Sul da Ásia, do Sudeste Asiático e do Oriente Médio, além de 22 dialetos chineses. O modelo é baseado em mais de 210.000 horas de...

AstrBot:具有WebUI的AI聊天机器人接入平台-首席AI分享圈

AstrBot: plataforma de acesso a chatbot de IA com WebUI

Introdução abrangente O AstrBot é uma estrutura de desenvolvimento de chatbot de código aberto, compatível com QQ, Telegram, WeChat e outras plataformas de mensagens, e pode acessar facilmente o OpenAI, o DeepSeek, o Google Gemini e outros modelos de linguagem grandes (LLM). Essa estrutura oferece um sistema de plug-ins, um painel de gerenciamento visual e vários ...

WeClone:用微信聊天记录和语音训练数字分身-首席AI分享圈

WeClone: treinamento de doppelgangers digitais com registros de bate-papo e vozes do WeChat

Introdução abrangente O WeClone é um projeto de código aberto que usa registros de bate-papo e mensagens de voz do WeChat, combinados com grandes modelos de linguagem e tecnologia de síntese de fala, para permitir que os usuários criem doppelgangers digitais personalizados. O projeto pode analisar os hábitos de bate-papo do usuário para treinar o modelo, mas também um pequeno número de amostras de voz para gerar clones de voz realistas ...

DiffPortrait360:从单张人像生成360度头部视图-首席AI分享圈

DiffPortrait360: gere visualizações de cabeça em 360 graus a partir de um único retrato

Introdução geral O DiffPortrait360 é um projeto de código-fonte aberto afiliado ao artigo DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis (Difusão consistente de retratos para síntese de visualização 360) da CVPR 2025. Ele pode gerar uma visualização consistente da cabeça em 360 graus a partir de uma única foto de retrato, oferecendo suporte a pessoas reais...

Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台-首席AI分享圈

Comp AI: uma plataforma de código aberto para automatizar a conformidade com SOC 2, ISO 27001 e GDPR

Introdução geral A Comp AI é uma plataforma de código aberto desenvolvida pela Comp AI, Inc., com sede em São Francisco, EUA. Ela ajuda as organizações a acelerar os requisitos de conformidade, como SOC 2, ISO 27001 e GDPR, por meio de ferramentas automatizadas, com o objetivo de estar pronta em semanas, não em meses. A plataforma está posicionada como Drata ...

pt_BRPortuguês do Brasil