Introdução geral O Open Notebook é uma ferramenta de gerenciamento de notas de código aberto e focada na privacidade, criada para oferecer aos usuários uma alternativa ao Google Notebook LM. Com o Open Notebook, os usuários podem gerenciar fluxos de trabalho de pesquisa sob seu próprio controle, gerar notas assistidas por IA e...
Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação de interfaces gráficas de usuário (GUIs) entre plataformas. O modelo é baseado no CogVLM (GLM-4V-9B), oferece suporte a interações bilíngues em inglês e chinês e é capaz de ...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O DisPose é um projeto inovador de inteligência artificial de código aberto voltado para a geração controlada de animação de imagens de personagens. Desenvolvido por uma equipe de pesquisadores e com código aberto no GitHub, o projeto usa técnicas avançadas de aprendizagem profunda para obter um controle preciso da animação de personagens por meio da decomposição das informações de pose do esqueleto.
Introdução abrangente Smolagents é uma biblioteca de agente inteligente leve desenvolvida pela HuggingFace que se concentra em simplificar o processo de desenvolvimento de sistemas de agente de IA. O projeto é conhecido por sua filosofia de design limpo, com apenas cerca de 1.000 linhas de código principal, mas oferece recursos avançados de integração de recursos. Seu recurso mais notável é o suporte à execução de código...
Introdução abrangente O Vision Parse é uma ferramenta revolucionária de processamento de documentos que combina de forma inteligente a tecnologia de última geração dos modelos de linguagem visual (Vision Language Models) para converter de forma inteligente documentos PDF em conteúdo de alta qualidade no formato Markdown. A ferramenta oferece suporte a uma ampla variedade de modelos de linguagem visual de primeira linha, incluindo o...
Introdução geral O InvSR é um projeto inovador de super-resolução de imagem de código aberto baseado em técnicas de inversão de difusão capazes de converter imagens de baixa resolução em imagens de alta resolução e alta qualidade. O projeto explora o rico conhecimento prévio da imagem incorporado em modelos de difusão em larga escala pré-treinados e, por meio de um mecanismo de amostragem flexível, oferece suporte a 1 a...
Introdução geral O Infinity é uma estrutura inovadora de geração de imagens de alta resolução desenvolvida pela equipe da FoundationVision. O projeto rompe as limitações dos modelos tradicionais de geração de imagens por meio de uma abordagem inovadora de modelagem autorregressiva visual em nível de bits.
Introdução abrangente O GeminiCoder é uma ferramenta inovadora de geração de aplicativos da Web desenvolvida com base na API do Google Gemini. O projeto herda os excelentes recursos do LlamaCoder e integra as versões experimentais Gemini 1.5 Pro, Gemini 1.5 Flash e Gemini 2.0 Flash mais recentes da poderosa IA...
Introdução abrangente O GPTMe é uma ferramenta revolucionária de assistente de IA de terminal projetada para aumentar a eficiência do trabalho dos desenvolvedores. Ele combina perfeitamente recursos avançados de IA com o ambiente do terminal, oferecendo suporte a diversas funções, como execução de código, edição de arquivos, navegação na Web e reconhecimento visual. Como um substituto localizado para o interpretador de código ChatGPT...
Introdução abrangente A ferramenta de monitoramento de degradação do serviço ChatGPT é um projeto de código aberto criado para ajudar os usuários a detectar se o serviço ChatGPT foi degradado devido a IPs de alto risco. A ferramenta analisa os valores de dificuldade do Proof of Work (PoW) para determinar se o IP de um usuário está sinalizado como de alto risco, o que resulta em um limite funcional...
Introdução geral O LogoCreator é um gerador de logotipos de código aberto baseado no modelo Together AI e Flux, com foco no fornecimento de serviços rápidos e profissionais de design de logotipos para empresas e indivíduos. O projeto foi desenvolvido e tem código aberto pelo desenvolvedor Nutlope e recebeu mais de 1.600 estrelas no GitHub. Como base ...
Introdução abrangente O SimGRAG (SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented Generation) é uma abordagem baseada em RAG (Knowledge Graphs Driven Retrieval-Augmented Generation). Seu objetivo é aprimorar os subgrafos semelhantes utilizando ...
Introdução abrangente O KAG (Knowledge Augmented Generation) é uma estrutura de raciocínio e recuperação orientada por forma lógica baseada no mecanismo OpenSPG e em modelos de linguagem ampla (LLMs). A estrutura foi projetada especificamente para criar soluções de raciocínio lógico e questionamento de fatos para bases de conhecimento de domínio profissional, o que pode superar de forma eficaz o tradicional RAG...
Introdução geral O VideoSeal é uma ferramenta de marca d'água de vídeo de código aberto desenvolvida pela Facebook Research, projetada para fornecer incorporação e extração eficientes de marcas d'água de vídeo. A ferramenta é compatível com os modelos de código aberto mais recentes e contém modelos pré-treinados, código de treinamento, código de inferência e ferramentas de avaliação, todos liberados sob a licença MIT.
Introdução geral O Obsidian Copilot é um poderoso plug-in de assistente de IA para o software Obsidian Notes que integra perfeitamente a inteligência da OpenAI aos fluxos de trabalho do Obsidian Notes. Criado pelo desenvolvedor Logan Yang, esse plug-in foi reconhecido na plataforma GitHub com mais de 3.200 classificações de estrelas. Ele usa...
Introdução geral O Languine é uma poderosa ferramenta de tradução desenvolvida pelo Midday para ajudar os desenvolvedores a simplificar o processo de localização de seus aplicativos. Com o Languine, os desenvolvedores podem aproveitar a tecnologia de IA para gerar rapidamente traduções precisas e contextualizadas em mais de 100 idiomas.
Introdução geral O OASIS (Open Agent Social Interaction Simulations) é um simulador de mídia social de código aberto capaz de simular o comportamento de até um milhão de usuários. A plataforma combina um modelo de linguagem em grande escala e agentes baseados em regras projetados para reproduzir de forma realista o comportamento de plataformas de mídia social, como o Twitter...
Introdução geral O Refly é um mecanismo de criação nativo de IA baseado em tela gratuito, projetado para ajudar os usuários a transformar ideias em conteúdo de alta qualidade por meio de diálogo multithread, integração de base de conhecimento, memória contextual e tecnologia de pesquisa inteligente. A plataforma abrange mais de 20 modelos de cenários profissionais, incluindo pesquisas acadêmicas e técnicas...
Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. No momento, o projeto está em uma fase altamente experimental e oferece suporte a vários modelos, como Ollama, Gemini e GPT 4o. usando...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.