Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 970 artigos

Tags: ai projetos de código aberto Página 5

基于Workers AI免费将多种文件转为Markdown格式-首席AI分享圈

Converta vários arquivos para o formato Markdown gratuitamente com base em Workers AI

Introdução geral O serverless-markdown-convertor é uma ferramenta de código aberto gratuita, baseada no desenvolvimento do Cloudflare Worker e do Workers AI, que pode converter uma variedade de arquivos para o formato Markdown. Ele é compatível com PDF, imagens, documentos do Office, HTML e outros tipos de arquivos comuns, sem a necessidade de ...

VirtualWife:支持B站直播和语音互动的二次元数字人-首席AI分享圈

VirtualWife: uma pessoa digital secundária que suporta a transmissão ao vivo da estação B e a interação por voz

O VirtualWife é um projeto de pessoa digital virtual de código aberto criado pelo desenvolvedor yakami129. O objetivo é criar um personagem virtual com uma "alma" e os usuários podem interagir com ele como se fosse um amigo. O projeto é compatível com a transmissão ao vivo da estação B e pode ser usado em voz e texto chineses para se comunicar com...

GPT-Crawler:自动爬取网站内容生成知识库文件-首席AI分享圈

GPT-Crawler: rastreamento automático do conteúdo do site para gerar documentos da base de conhecimento

Introdução geral O GPT-Crawler é uma ferramenta de código aberto desenvolvida pela equipe do BuilderIO e hospedada no GitHub. Ele rastreia o conteúdo da página inserindo um ou mais URLs de sites, gerando um arquivo de conhecimento estruturado (output.json) para criar GPTs personalizados ou assistentes de IA. Os usuários podem...

MegaTTS3:合成中英文语音的轻量模型-首席AI分享圈

MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês

Introdução abrangente O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em colaboração com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de discursos mistos em chinês e inglês e a clonagem de discursos. O projeto está hospedado no GitHub e é mencionado...

KBLaM:为大模型嵌入外部知识的开源增强工具-首席AI分享圈

KBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandes

O KBLaM é um projeto de código aberto desenvolvido pela Microsoft, conhecido como Knowledge Base augmented Language Model (KBLaM). Ele transforma o conhecimento externo em vetores e o incorpora à camada de atenção de um modelo grande, de modo que o modelo possa usar diretamente esse conhecimento para responder a perguntas ou ...

LangGraph CodeAct: geração de código para ajudar as inteligências a resolver tarefas complexas

Introdução geral O LangGraph CodeAct é uma estrutura de código aberto no GitHub pela equipe de IA da LangChain, com base na arquitetura CodeAct (consulte o artigo arXiv:2402.01030 para obter detalhes). Ela ajuda as inteligências a processar tarefas complexas com eficiência, gerando e executando código Python. Essa ferramenta é usada pelo Manus...

BrowserTools MCP:实时监控浏览器活动的MCP服务-首席AI分享圈

BrowserTools MCP: serviço MCP para monitoramento em tempo real da atividade do navegador

Introdução geral O BrowserTools MCP é um projeto de código aberto desenvolvido pela equipe do AgentDeskAI. Ele permite que a IA monitore a atividade do navegador em tempo real, incluindo registros, solicitações de rede e capturas de tela, além de analisar o desempenho da Web, SEO e acessibilidade por meio de extensões do Chrome e serviços Node.js....

AgentLaboratory:利用智能代理完成科研全流程的开源工具-首席AI分享圈

AgentLaboratory: uma ferramenta de código aberto para completar todo o processo de pesquisa científica com agentes inteligentes

Introdução geral O AgentLaboratory é uma ferramenta de código aberto hospedada no GitHub e desenvolvida por Samuel Schmidgall. Ela usa agentes inteligentes orientados por modelos de linguagem ampla (LLMs) para ajudar os pesquisadores com todo o processo de pesquisa científica, incluindo revisão da literatura, projeto experimental e elaboração de relatórios. Essa ferramenta é...

Kilo Code:具有简洁使用体验的Roo Code分支-首席AI分享圈

Kilo Code: uma ramificação do Roo Code com uma experiência de usuário limpa

Introdução geral O Kilo Code é um plug-in de extensão de código aberto para o Visual Studio Code (VS Code). Ele usa tecnologia de inteligência artificial para ajudar os usuários a escrever códigos com mais eficiência. Esse projeto foi desenvolvido pela equipe do Kilo-Org, inicialmente bifurcado do Roo Code, seguido pela adição de mais recursos, como ...

AgentIQ:灵活连接和管理AI智能体的开源工具-首席AI分享圈

AgentIQ: uma ferramenta de código aberto para conexão e gerenciamento flexíveis de inteligências de IA

Introdução geral O AgentIQ é uma ferramenta de código aberto da NVIDIA projetada para ajudar os desenvolvedores a conectar e gerenciar eficientemente as inteligências de IA. Ela permite que as inteligências de diferentes estruturas colaborem perfeitamente, conectem dados e ferramentas empresariais e criem fluxos de trabalho como funções de chamada. Os melhores recursos dessa ferramenta são a flexibilidade e a re...

MIDI-3D:从单张图片快速生成多物体3D场景的开源工具-首席AI分享圈

MIDI-3D: uma ferramenta de código aberto para gerar rapidamente cenas 3D com vários objetos a partir de uma única imagem

Introdução geral O MIDI-3D é um projeto de código aberto desenvolvido pela equipe do VAST-AI-Research que pode gerar rapidamente cenas 3D contendo vários objetos a partir de uma única imagem para desenvolvedores, pesquisadores e criadores. Essa ferramenta é baseada em técnicas de modelagem de difusão de múltiplas instâncias, combinando inteligência artificial e modelagem 3D, e pode ser usada com...

TripoSF:快速生成高分辨率3D模型的实用工具-首席AI分享圈

TripoSF: uma ferramenta prática para a geração rápida de modelos 3D de alta resolução

Introdução geral O TripoSF é um projeto de código aberto criado pela equipe do VAST-AI-Research, especificamente projetado para gerar rapidamente modelos 3D de alta resolução a partir de uma única imagem. Ele usa uma tecnologia chamada SparseFlex, com eficiência de processamento, e pode ser executado em dispositivos comuns.

TripoSG:单张图像生成高分辨率3D建模数字资产-首席AI分享圈

TripoSG: geração de ativos digitais modelados em 3D de alta resolução a partir de uma única imagem

Introdução geral O TripoSG é um projeto de código aberto desenvolvido pela equipe de pesquisa VAST AI para gerar modelos 3D de alta qualidade a partir de uma única imagem. O projeto usa a tecnologia de conversor de fluxo retificador em larga escala, combinada com treinamento supervisionado híbrido e conjuntos de dados de alta qualidade, para permitir a geração de modelos 3D com detalhes geométricos claros e...

MoshiVis:实时语音对话和图像理解的开源模型-首席AI分享圈

MoshiVis: um modelo de código aberto para diálogo de fala em tempo real e compreensão de imagens

Introdução geral O MoshiVis é um projeto de código aberto desenvolvido pela Kyutai Labs e hospedado no GitHub. Ele se baseia no modelo de fala para texto Moshi (7B parâmetros), com cerca de 206 milhões de novos parâmetros de adaptação e um codificador visual PaliGemma2 congelado (400M parâmetros), permitindo que o modelo use a fala em tempo real...

MiniMind:2小时从零训练26M参数GPT的开源工具-首席AI分享圈

MiniMind: 2 horas de treinamento do zero com a ferramenta de código aberto GPT de parâmetros 26M

O MiniMind é um projeto de código aberto criado pelo desenvolvedor jingyaogong. Seu principal objetivo é permitir que pessoas comuns treinem rapidamente seus próprios modelos de IA. A principal característica do MiniMind é que ele leva 2 horas para treinar um modelo GPT de 26 milhões de parâmetros do zero em uma única placa de vídeo NVIDIA 3090....

WritingBench:测试大模型写作能力的基准评估工具-首席AI分享圈

WritingBench: uma ferramenta de avaliação de benchmarking para testar a capacidade de redação de modelos grandes

Introdução geral O WritingBench é um projeto de código aberto desenvolvido pela equipe do X-PLUG e hospedado no GitHub. É uma ferramenta projetada para testar a capacidade de escrita de modelos grandes, fornecendo 1239 tarefas de escrita do mundo real. Essas tarefas abrangem 6 domínios principais e 100 subdomínios, não...

pt_BRPortuguês do Brasil