Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 970 artigos

Tags: ai projetos de código aberto Página 34

Open Notebook:个性化AI笔记工具,Notebook LM开源替代方案-首席AI分享圈

Open Notebook: ferramenta de anotações com IA personalizada, alternativa de código aberto ao Notebook LM

Introdução geral O Open Notebook é uma ferramenta de gerenciamento de notas de código aberto e focada na privacidade, criada para oferecer aos usuários uma alternativa ao Google Notebook LM. Com o Open Notebook, os usuários podem gerenciar fluxos de trabalho de pesquisa sob seu próprio controle, gerar notas assistidas por IA e...

CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作-首席AI分享圈

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação de interfaces gráficas de usuário (GUIs) entre plataformas. O modelo é baseado no CogVLM (GLM-4V-9B), oferece suporte a interações bilíngues em inglês e chinês e é capaz de ...

DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐-首席AI分享圈

DisPose: geração de vídeos com controle preciso da postura humana, criando damas dançantes

Introdução geral O DisPose é um projeto inovador de inteligência artificial de código aberto voltado para a geração controlada de animação de imagens de personagens. Desenvolvido por uma equipe de pesquisadores e com código aberto no GitHub, o projeto usa técnicas avançadas de aprendizagem profunda para obter um controle preciso da animação de personagens por meio da decomposição das informações de pose do esqueleto.

Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目-首席AI分享圈

Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências

Introdução abrangente Smolagents é uma biblioteca de agente inteligente leve desenvolvida pela HuggingFace que se concentra em simplificar o processo de desenvolvimento de sistemas de agente de IA. O projeto é conhecido por sua filosofia de design limpo, com apenas cerca de 1.000 linhas de código principal, mas oferece recursos avançados de integração de recursos. Seu recurso mais notável é o suporte à execução de código...

Vision Parse:使用视觉语言模型将PDF文档智能转换为Markdown格式-首席AI分享圈

Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Introdução abrangente O Vision Parse é uma ferramenta revolucionária de processamento de documentos que combina de forma inteligente a tecnologia de última geração dos modelos de linguagem visual (Vision Language Models) para converter de forma inteligente documentos PDF em conteúdo de alta qualidade no formato Markdown. A ferramenta oferece suporte a uma ampla variedade de modelos de linguagem visual de primeira linha, incluindo o...

InvSR:开源图像超分辨率项目,提升图像分辨率质量-首席AI分享圈

InvSR: Projeto de super-resolução de imagem de código aberto para melhorar a qualidade da resolução da imagem

Introdução geral O InvSR é um projeto inovador de super-resolução de imagem de código aberto baseado em técnicas de inversão de difusão capazes de converter imagens de baixa resolução em imagens de alta resolução e alta qualidade. O projeto explora o rico conhecimento prévio da imagem incorporado em modelos de difusão em larga escala pré-treinados e, por meio de um mecanismo de amostragem flexível, oferece suporte a 1 a...

Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成-首席AI分享圈

Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução

Introdução geral O Infinity é uma estrutura inovadora de geração de imagens de alta resolução desenvolvida pela equipe da FoundationVision. O projeto rompe as limitações dos modelos tradicionais de geração de imagens por meio de uma abordagem inovadora de modelagem autorregressiva visual em nível de bits.

GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序-首席AI分享圈

GeminiCoder: com base no projeto LlamaCoder, use a API Gemini para gerar aplicativos da Web rapidamente

Introdução abrangente O GeminiCoder é uma ferramenta inovadora de geração de aplicativos da Web desenvolvida com base na API do Google Gemini. O projeto herda os excelentes recursos do LlamaCoder e integra as versões experimentais Gemini 1.5 Pro, Gemini 1.5 Flash e Gemini 2.0 Flash mais recentes da poderosa IA...

GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案-首席AI分享圈

GPTme: assistente de programação inteligente executado em um terminal de linha de comando, alternativa localizada para o interpretador de código ChatGPT

Introdução abrangente O GPTMe é uma ferramenta revolucionária de assistente de IA de terminal projetada para aumentar a eficiência do trabalho dos desenvolvedores. Ele combina perfeitamente recursos avançados de IA com o ambiente do terminal, oferecendo suporte a diversas funções, como execução de código, edição de arquivos, navegação na Web e reconhecimento visual. Como um substituto localizado para o interpretador de código ChatGPT...

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Introdução abrangente A ferramenta de monitoramento de degradação do serviço ChatGPT é um projeto de código aberto criado para ajudar os usuários a detectar se o serviço ChatGPT foi degradado devido a IPs de alto risco. A ferramenta analisa os valores de dificuldade do Proof of Work (PoW) para determinar se o IP de um usuário está sinalizado como de alto risco, o que resulta em um limite funcional...

LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo-首席AI分享圈

LogoCreator: gerador de logotipos de código aberto, que usa inteligência artificial para gerar logotipos de marcas profissionais

Introdução geral O LogoCreator é um gerador de logotipos de código aberto baseado no modelo Together AI e Flux, com foco no fornecimento de serviços rápidos e profissionais de design de logotipos para empresas e indivíduos. O projeto foi desenvolvido e tem código aberto pelo desenvolvedor Nutlope e recebeu mais de 1.600 estrelas no GitHub. Como base ...

SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成-首席AI分享圈

SimGRAG: geração de aprimoramento de recuperação orientada por gráficos de conhecimento usando subgrafos semelhantes

Introdução abrangente O SimGRAG (SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented Generation) é uma abordagem baseada em RAG (Knowledge Graphs Driven Retrieval-Augmented Generation). Seu objetivo é aprimorar os subgrafos semelhantes utilizando ...

KAG:知识图谱与向量混合检索的专业知识库问答框架-首席AI分享圈

KAG: uma estrutura de perguntas e respostas de base de conhecimento profissional para recuperação híbrida de gráficos de conhecimento e vetores

Introdução abrangente O KAG (Knowledge Augmented Generation) é uma estrutura de raciocínio e recuperação orientada por forma lógica baseada no mecanismo OpenSPG e em modelos de linguagem ampla (LLMs). A estrutura foi projetada especificamente para criar soluções de raciocínio lógico e questionamento de fatos para bases de conhecimento de domínio profissional, o que pode superar de forma eficaz o tradicional RAG...

VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权-首席AI分享圈

VideoSeal: Ferramenta avançada de incorporação e extração de marca d'água oculta em vídeo de código aberto para proteger os direitos autorais de vídeo

Introdução geral O VideoSeal é uma ferramenta de marca d'água de vídeo de código aberto desenvolvida pela Facebook Research, projetada para fornecer incorporação e extração eficientes de marcas d'água de vídeo. A ferramenta é compatível com os modelos de código aberto mais recentes e contém modelos pré-treinados, código de treinamento, código de inferência e ferramentas de avaliação, todos liberados sob a licença MIT.

Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手-首席AI分享圈

Obsidian Copilot: experimente o assistente inteligente de anotações com o AI Assistant na Obsidian

Introdução geral O Obsidian Copilot é um poderoso plug-in de assistente de IA para o software Obsidian Notes que integra perfeitamente a inteligência da OpenAI aos fluxos de trabalho do Obsidian Notes. Criado pelo desenvolvedor Logan Yang, esse plug-in foi reconhecido na plataforma GitHub com mais de 3.200 classificações de estrelas. Ele usa...

Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库-首席AI分享圈

Languine: tradução de aplicativos usando IA, compatível com todas as principais bibliotecas de i18n

Introdução geral O Languine é uma poderosa ferramenta de tradução desenvolvida pelo Midday para ajudar os desenvolvedores a simplificar o processo de localização de seus aplicativos. Com o Languine, os desenvolvedores podem aproveitar a tecnologia de IA para gerar rapidamente traduções precisas e contextualizadas em mais de 100 idiomas.

OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象-首席AI分享圈

OASIS: simulação de inteligência múltipla de interações de mídia social de milhões de usuários para estudar fenômenos sociais complexos

Introdução geral O OASIS (Open Agent Social Interaction Simulations) é um simulador de mídia social de código aberto capaz de simular o comportamento de até um milhão de usuários. A plataforma combina um modelo de linguagem em grande escala e agentes baseados em regras projetados para reproduzir de forma realista o comportamento de plataformas de mídia social, como o Twitter...

Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章-首席AI分享圈

Refly: uma plataforma de escrita de IA baseada na orquestração de processos em uma tela gratuita para geração automatizada de artigos

Introdução geral O Refly é um mecanismo de criação nativo de IA baseado em tela gratuito, projetado para ajudar os usuários a transformar ideias em conteúdo de alta qualidade por meio de diálogo multithread, integração de base de conhecimento, memória contextual e tecnologia de pesquisa inteligente. A plataforma abrange mais de 20 modelos de cenários profissionais, incluindo pesquisas acadêmicas e técnicas...

ClickClickClick:启用任何LLM实现自动化安卓和电脑操作-首席AI分享圈

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. No momento, o projeto está em uma fase altamente experimental e oferece suporte a vários modelos, como Ollama, Gemini e GPT 4o. usando...

pt_BRPortuguês do Brasil