Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1
Total de 860 artigos

Tags: ai projetos de código aberto

Motia:用代码快速构建智能体的开发框架-首席AI分享圈

Motia: uma estrutura de desenvolvimento para a criação rápida de inteligências em código

Introdução geral O Motia é uma estrutura de agente de IA de código aberto para engenheiros de software, hospedada no GitHub e desenvolvida pela equipe MotiaDev. Ele permite que os desenvolvedores escrevam, testem e implementem rapidamente agentes inteligentes em linguagens de programação conhecidas (por exemplo, Python, TypeScript, Ruby).

DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎-首席AI分享圈

DiffSynth-Engine: Mecanismo de código aberto para baixa implantação existente do FLUX, Wan 2.1

Introdução geral O DiffSynth-Engine é um projeto de código aberto lançado pela ModelScope, hospedado no GitHub. Ele se baseia na tecnologia de modelagem de difusão, com foco na geração eficiente de imagens e vídeos, adequada para que os desenvolvedores implantem modelos de IA em ambientes de produção. O projeto evoluiu a partir do DiffSynth-Studio,...

RF-DETR:实时视觉对象检测开源模型-首席AI分享圈

RF-DETR: um modelo de código aberto para detecção de objetos visuais em tempo real

Introdução abrangente O RF-DETR é um modelo de detecção de objetos de código aberto desenvolvido pela equipe do Roboflow. Ele se baseia na arquitetura Transformer e seu principal recurso é a eficiência em tempo real. O modelo obteve a primeira detecção em tempo real de mais de 60 APs no conjunto de dados Microsoft COCO, bem como um excelente desempenho no benchmark RF100-VL,...

Aana SDK:简易部署多模态AI模型的开源工具-首席AI分享圈

Aana SDK: uma ferramenta de código aberto para facilitar a implantação de modelos de IA multimodais

Introdução geral O Aana SDK é uma estrutura de código aberto desenvolvida pela Mobius Labs, cujo nome vem da palavra malaiala ആന (elefante). Ele ajuda os desenvolvedores a implantar e gerenciar rapidamente modelos de IA multimodais, oferecendo suporte ao processamento de texto, imagens, áudio e vídeo e outros dados.

PiT:用图像零件拼出完整图像的工具(未开放)-首席AI分享圈

PiT: ferramenta para juntar imagens completas a partir de partes de imagens (não aberto)

Introdução geral O PiT (Piece it Together) é uma ferramenta de código aberto hospedada no GitHub e desenvolvida por pesquisadores como Elad Richardson, da Universidade de Tel Aviv. Ela permite que os usuários insiram pedaços de partes de imagens, como asas, penteados ou olhos, e depois usa técnicas de inteligência artificial para gerar uma imagem completa...

Agent TARS:使用视觉和命令操作电脑的开源智能体-首席AI分享圈

Agente TARS: uma inteligência de código aberto que usa visão e comandos para operar computadores

Introdução abrangente O agente TARS é uma inteligência de IA multimodal de código aberto da ByteDance, com recursos principais que ajudam os usuários a realizar tarefas complexas no computador, compreendendo visualmente o conteúdo da Web e combinando operações de linha de comando e de sistema de arquivos. Em vez de exigir operações manuais como as ferramentas tradicionais, ele executa automaticamente...

Qlib:微软开发的AI量化投资研究工具-首席AI分享圈

Qlib: uma ferramenta de pesquisa de investimento quantitativo de IA desenvolvida pela Microsoft

Introdução abrangente O Qlib é uma plataforma de código aberto desenvolvida pela Microsoft que se concentra no uso da tecnologia de IA para ajudar os usuários a pesquisar investimentos quantitativos. Ela começa com o processamento de dados mais básico e ajuda os usuários a explorar ideias de investimento e transformá-las em estratégias utilizáveis. A plataforma é simples e fácil de usar, adequada para usuários que desejam usar o aprendizado de máquina para melhorar a pesquisa de investimentos. q...

Uma ferramenta para rastrear automaticamente romances e gerar audiolivros com vários caracteres

Introdução geral O Auto-Audio-Book é um projeto de código aberto hospedado no GitHub. Ele rastreia automaticamente o conteúdo de romances de sites e o converte em audiolivros com várias vozes de personagens. Desenvolvedor zqq-nuli escrito em Python 3.10+, combinado com grandes modelos (como Gemini e CosyVoice...

UniAPI:免服务器统一管理大模型API转发-首席AI分享圈

UniAPI: gerenciamento unificado sem servidor de encaminhamento de API de modelo grande

Introdução abrangente O UniAPI é um encaminhador de API compatível com o protocolo OpenAI, e sua função principal é gerenciar APIs de vários provedores de serviços de modelos grandes, como OpenAI, Azure OpenAI, Claude etc., por meio de um formato OpenAI unificado. Os desenvolvedores podem usar uma única interface para chamar modelos de diferentes fornecedores sem a necessidade de...

Oliva:语音控制的多智能体产品搜索助手-首席AI分享圈

Oliva: um assistente de pesquisa de produtos com inteligência múltipla controlado por voz

Introdução geral O Oliva é uma ferramenta de assistente de inteligência múltipla de código aberto desenvolvida pela Deluxer no GitHub. Ela ajuda os usuários a pesquisar informações sobre produtos no banco de dados Qdrant por meio da colaboração de várias inteligências de IA. Os principais recursos são o suporte de voz, combinado com as tecnologias LangChain e Superlinked...

Playwright MCP:微软推出的浏览器自动化MCP服务-首席AI分享圈

Playwright MCP: Serviço MCP de automação do navegador da Microsoft

Introdução geral O Playwright MCP é uma ferramenta de código aberto desenvolvida pela Microsoft e hospedada no GitHub. Ela permite que modelos de inteligência artificial controlem diretamente os navegadores por meio do protocolo MCP (Model Context Protocol), executando ações como abrir páginas da Web, clicar em elementos e inserir texto. A ferramenta é baseada no Pl...

PDF Craft:PDF扫描文件转Markdown的开源工具-首席AI分享圈

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e hospedada no GitHub para usuários que gostam de organizar seus e-books. A ferramenta é executada por meio de um modelo de IA local sem a necessidade de uma conexão com a Internet, o que preserva a privacidade e...

InfiniteYou:保留人脸特征的照片生成与编辑工具-首席AI分享圈

InfiniteYou: uma ferramenta de geração e edição de fotos que preserva as características faciais

Introdução geral O InfiniteYou é um projeto de código aberto desenvolvido pela equipe da ByteDance Intelligent Creation. Ele se baseia na tecnologia Diffusion Transformers (DiTs), usando o modelo FLUX.1-dev. A função principal é permitir que os usuários carreguem uma foto e insiram uma descrição de texto para gerar uma nova imagem, preservando a identidade do personagem. Projeto ...

Grok-Mirror:一键部署可盈利的Grok镜像站-首席AI分享圈

Grok-Mirror: implantação com um clique de sites espelho lucrativos do Grok

Introdução abrangente O Grok-Mirror é uma estação de espelhamento doméstica Grok3 de implementação rápida e sem servidor baseada em A estação de espelhamento Grok foi criada para ser operável. Ela permite que os usuários implementem um quiosque Grok local com um clique via Docker. O Grok é um assistente de IA lançado pela xAI, e o Grok-Mirror, por meio da tecnologia de espelhamento, permite...

LHM:从单张图片生成支持动作的3D人体模型-首席AI分享圈

LHM: geração de modelos humanos em 3D com capacidade de movimento a partir de uma única imagem

Introdução abrangente O LHM (Large Animatable Human Reconstruction Model) é um projeto de código aberto desenvolvido pela equipe do aigc3d para gerar rapidamente modelos humanos em 3D com suporte a ações a partir de uma única imagem. O principal recurso é usar a tecnologia de IA para transformar uma imagem 2D em um modelo 3D em poucos segundos, com suporte para visualização em tempo real e...

Second Me:本地训练拥有个人记忆和习惯的AI分身-首席AI分享圈

Second Me: doppelgangers de IA treinados localmente com memórias e hábitos pessoais

O Second Me é um projeto de código aberto desenvolvido pela equipe Mindverse que permite criar uma IA em seu computador que atua como um "sósia digital", aprendendo sua fala e seus hábitos por meio de suas palavras e memórias e transformando-o em um assistente inteligente que o entende. Seu melhor recurso é que todos os números...

openapi-mcp-server:让AI直接调用开放API的MCP服务-首席AI分享圈

openapi-mcp-server: permite que a IA invoque diretamente os serviços MCP com APIs abertas

Introdução geral O openapi-mcp-server é uma ferramenta de código aberto projetada para transformar APIs compatíveis com a OpenAPI v3.1 em recursos utilizáveis por IA. Ela é mantida por janwilmake e desenvolvida com base no protocolo MCP (Model Context Protocol). A função principal do projeto é atuar como um proxy de API, permitindo que as...

StarVector:从图像和文字生成SVG矢量图的基础模型-首席AI分享圈

StarVector: um modelo básico para gerar gráficos vetoriais SVG a partir de imagens e texto

Introdução geral O StarVector é um projeto de código aberto criado por desenvolvedores como Juan A. Rodriguez para converter imagens e textos em SVG (Scalable Vector Graphics, gráficos vetoriais escaláveis). Essa ferramenta usa um modelo de linguagem visual que entende o conteúdo da imagem e as instruções de texto para gerar um código SVG de alta qualidade ...

pt_BRPortuguês do Brasil