Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 992 artigos

Tags: ai projetos de código aberto Página 42

Moondream:批量反推图像提示词的开源轻量级视觉语言模型-首席AI分享圈

Moondream: um modelo de linguagem visual leve e de código aberto para retropropagação em lote de palavras-chave de imagens

Introdução abrangente O Moondream é um modelo de linguagem visual leve e de código aberto projetado para permitir recursos de descrição de imagens por meio de técnicas de aprendizagem profunda e visão computacional. O modelo é capaz de ser executado com eficiência em uma variedade de plataformas e é particularmente adequado para dispositivos de borda.

Flux Gym:低显存训练FLUX LoRA的简易UI-首席AI分享圈

Flux Gym: interface de usuário fácil para treinar o FLUX LoRA com pouca memória gráfica

Introdução geral O Flux Gym é uma interface de usuário da Web fácil de usar para treinar o FLUX LoRA com suporte para baixa memória gráfica (12 GB/16 GB/20 GB). O front-end é baseado na interface de usuário Gradio do AI-Toolkit e o back-end é alimentado pelo Kohya Scripts. O Flux Gym combina a simplicidade da WebUI do AI-Toolkit com o Kohya Scripts.

PicMenu:文字菜单转换为美观的图文菜单-首席AI分享圈

PicMenu: Converta menus de texto em belos menus gráficos

Introdução abrangente O PicMenu é uma ferramenta inovadora de IA que transforma os cardápios tradicionais de papel em cardápios com imagens vívidas e intuitivas por meio de uma simples operação fotográfica. A ferramenta não apenas gera automaticamente imagens de alta qualidade de cada prato, mas também fornece informações valiosas sobre os pratos, proporcionando uma nova transformação digital para o setor de bufê...

Gemini-OpenAI: geração reversa de endereços Gemini que contornam as restrições de região e convertem para APIs compatíveis com OpenAI

Introdução geral O Gemini OpenAI API Agent é um endpoint compatível com OpenAI gratuito e sem manutenção de servidor. Os usuários podem implementá-lo facilmente em plataformas como Vercel, Netlify e Cloudflare para uso pessoal. O projeto é destinado àqueles que precisam da API OpenAI, mas não querem assumir a manutenção do servidor...

Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行-首席AI分享圈

Sana: geração rápida de imagens de alta resolução, modelo de tamanho ultrapequeno de 0,6 B, operação de GPU de laptop de baixo perfil

Introdução geral O Sana é uma estrutura eficiente de geração de imagens de alta resolução desenvolvida pelo NVIDIA Labs, capaz de gerar imagens com resolução de até 4096 × 4096 em questão de segundos. O Sana emprega um transformador de difusão linear e uma tecnologia de autocodificador de compactação profunda para melhorar drasticamente a velocidade e a qualidade da geração de imagens,...

SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面-首席AI分享圈

SP-MangaEditer: ferramenta profissional de criação de ilustrações de mangá em quatro painéis, gerando imagens e editando páginas de mangá

Introdução geral O SP-MangaEditer é uma plataforma independente de edição de mangás projetada para criadores de mangás. A plataforma suporta geração de imagens, edição de camadas, ajuste de imagens, aplicação de filtros e muitas outras funções para ajudar os usuários a criar facilmente ilustrações de mangá de alta qualidade. Os usuários podem gerar rapidamente com simples...

SQLite-Utils-Ask: permite que os usuários consultem bancos de dados SQLite e arquivos CSV/JSON para obter dados de consulta

Introdução geral O SQLite-Utils-Ask é uma ferramenta avançada projetada para ajudar os usuários a realizar consultas de dados com perguntas e respostas em bancos de dados SQLite e arquivos CSV/JSON com o auxílio do LLM (Large Language Model). A ferramenta é capaz de gerar automaticamente consultas SQL apropriadas com base nas perguntas do usuário e executar as consultas para retornar...

GraphRAG-Dify: equipando o Dify com recursos do GraphRAG

Introdução abrangente O GraphRAG-Dify é um projeto de código aberto desenvolvido para combinar as tecnologias GraphRAG e Dify para criar e implantar rapidamente um agente de IA. O projeto usa FastAPI e Uvicorn para a criação de serviços e oferece suporte à importação de DSL, o que facilita a integração e o uso em aplicativos reais pelos usuários. Lista de funções Criar ...

askrepo: ferramenta de leitura de código-fonte que usa o LLM para analisar o código, fornece explicações detalhadas do código e oferece suporte a várias linguagens de programação

Introdução geral O askrepo é uma ferramenta de leitura de código-fonte baseada no LLM (Large Language Model). Ela é capaz de ler o conteúdo de um arquivo de texto gerenciado pelo Git em um diretório especificado e enviá-lo à API do Google Gemini para fornecer respostas a perguntas com base em prompts especificados. A ferramenta foi projetada para ajudar os desenvolvedores a...

PDFMathTranslate:保留PDF完整排版的AI翻译工具-首席AI分享圈

PDFMathTranslate: ferramenta de tradução de IA que preserva a tipografia completa dos PDFs

Introdução abrangente O PDFMathTranslate é uma ferramenta de código aberto voltada para a tradução de artigos científicos, capaz de traduzir o texto completo de documentos PDF e gerar uma versão bilíngue. Ele usa a tecnologia de IA para manter completamente o layout do documento original, incluindo fórmulas, diagramas, índices e anotações, com suporte para Google, DeepL, Ollama...

Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装-首席AI分享圈

Voice-Pro: ferramenta de tradução de vídeo multifuncional de código aberto, transcrição e tradução de voz em vários idiomas, instalação com um clique no Windows

Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra as tecnologias Whisper, Faster-Whisper e Whisper-Timestamped para oferecer...

Linly-Dubbing:智能视频多语言AI配音/翻译工具-首席AI分享圈

Linly-Dubbing: ferramenta inteligente de dublagem/tradução de vídeo multilíngue com IA

Introdução abrangente O Linly-Dubbing é uma ferramenta inteligente de tradução e dublagem multilíngue de IA projetada para oferecer aos usuários serviços de tradução de legendas e dublagem de vídeo multilíngue de alta qualidade por meio da integração de tecnologia avançada de IA. A ferramenta é especialmente adequada para educação internacional, localização de conteúdo global e outros cenários, ajudando as equipes a trazer conteúdo de alta qualidade...

FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。-首席AI分享圈

FlipSketch: converte desenhos estáticos em animações de esboço guiadas por texto, simplificando o processo de animação.

Introdução geral O FlipSketch é um projeto de código aberto criado para converter desenhos estáticos em animações guiadas por texto. Hospedado no GitHub, o projeto oferece uma ferramenta inovadora que permite aos usuários gerar efeitos de animação a partir de descrições de texto. O FlipSketch combina técnicas de processamento de imagens e de processamento de linguagem natural...

AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站-首席AI分享圈

AutoFlow: base de conhecimento conversacional baseada em GraphRAG/ferramenta de pesquisa profunda na Web com diálogos que podem ser integrados a outros sites

Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra o LlamaIndex e a estrutura DSPy para oferecer suporte à pesquisa de diálogos complexos e à edição de gráficos de conhecimento. Os usuários podem usar um substituto JavaScript simples...

Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格-首席AI分享圈

Maxun: uma plataforma de código aberto, sem código, que rastreia automaticamente os dados da Web e os converte em APIs ou planilhas

Introdução abrangente O Maxun é uma plataforma de extração de dados da Web sem código aberto que permite aos usuários treinar robôs em minutos para rastrear automaticamente os dados da Web e convertê-los em APIs ou planilhas. A plataforma suporta paginação e rolagem, pode se adaptar a alterações no layout do site, oferece recursos avançados de rastreamento de dados para...

OpenPromptStudio:可视化编辑、管理图像提示词,同步自己的Notion提示词表-首席AI分享圈

OpenPromptStudio: edite e gerencie visualmente prompts de imagem, sincronize suas próprias listas de prompts do Notion!

Introdução geral O OpenPromptStudio (OPS) é um editor visual de código aberto para palavras de alerta do AIGC, desenvolvido pela equipe Moonvy. Seu objetivo é simplificar o processo de criação e gerenciamento de palavras de prompt com suporte para modelos de IA, como o Midjourney. O OPS oferece recursos avançados de gerenciamento de palavras de prompt por meio da integração do Notion, que permite aos usuários...

Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务-首席AI分享圈

UI da Web de geração de texto: interface de bate-papo de modelo de linguagem grande baseada em Gradio com suporte para vários serviços de back-end

Introdução geral A UI da Web de geração de texto é uma UI da Web baseada no Gradio, projetada para o Modelo de linguagem grande (LLM). Ela é compatível com uma variedade de back-ends de geração de texto, incluindo Transformers, llama.cpp e ExLlamaV2. Os usuários podem instalá-lo rapidamente com etapas simples...

Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码-首席AI分享圈

Morphic: mecanismo de pesquisa de código aberto com tecnologia de IA oferece perguntas e respostas inteligentes, pesquisa de vídeo e geração de código de interface do usuário

Introdução geral O Morphic é um mecanismo de busca baseado na tecnologia de IA com uma interface de usuário generativa projetada para fornecer perguntas e respostas inteligentes e uma experiência de busca eficiente. Os usuários podem realizar várias pesquisas, inclusive de texto, vídeo etc., com o Morphic, além de salvar o histórico de pesquisa e compartilhar os resultados da pesquisa.

Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)-首席AI分享圈

Swarm: um projeto pedagógico experimental para aprender sistemas corporais leves e multiinteligentes (exemplo da OpenAI)

Introdução geral O Swarm é uma estrutura educacional experimental desenvolvida pela OpenAI para explorar interfaces leves, controladas e fáceis de testar para sistemas multiagentes. A estrutura é usada principalmente para demonstrar transferências e padrões de rotina entre agentes para ajudar os desenvolvedores a entender e implementar a coordenação e a execução de sistemas com vários agentes.

pt_BRPortuguês do Brasil