Introdução geral O AI Logo é um projeto de aplicativo de IA de código aberto com o objetivo de ajudar os usuários a gerar rapidamente logotipos de marca personalizados por meio de inteligência artificial. Ele combina técnicas avançadas de IA, como Stable Diffusion e DeepAI, para permitir que os usuários insiram informações simples sobre a marca e obtenham designs de logotipo de alta qualidade. Esse...
Introdução geral O Docs é uma plataforma colaborativa de código aberto para anotações e gerenciamento de documentos desenvolvida pela equipe do suitenumerique. Ela foi criada usando as tecnologias Django e React com o objetivo de fornecer uma ferramenta fácil de usar para ajudar os usuários a fazer anotações, gerenciar documentos e compartilhar conhecimento. Essa plataforma é compatível com...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
A tecnologia OCR é capaz de converter informações textuais em uma imagem em dados de texto editáveis e processáveis. Em termos simples, ela reconhece e extrai texto de imagens. A seguir, analisaremos os 10 projetos de código-fonte aberto de OCR com o maior número de estrelas no GitHub, fornecendo a você uma seleção detalhada de ferramentas de OCR...
Introdução abrangente O SmartRead é uma ferramenta de código aberto baseada em IA projetada para documentos técnicos. Ele analisa automaticamente arquivos PDF e anota o conteúdo principal, como termos importantes, títulos ou ideias centrais, para ajudar os usuários a entender rapidamente documentos complexos. Ao mesmo tempo, ele também pode fornecer artigos e vídeos relacionados ao tópico do documento...
Introdução geral O Hunyuan3D-2 é um projeto de código aberto desenvolvido pela Tencent, com o objetivo de gerar modelos 3D de alta resolução a partir de texto ou imagens. Ele consiste em dois componentes principais: modelo de geração de forma (Hunyuan3D-DiT) e modelo de geração de textura (Hunyuan3D-Paint). Os usuários podem inserir descrições de texto ou...
Introdução geral O LangManus é uma estrutura de automação de IA de código aberto hospedada no GitHub. Desenvolvido por um grupo de ex-colegas em seu tempo livre, é um projeto acadêmico com o objetivo de combinar modelos de linguagem e ferramentas especializadas para realizar tarefas como pesquisa na Web, rastreamento de dados e execução de código. A estrutura usa modelos multiagentes...
O Gemini tem sido atualizado com certa frequência ultimamente, sem nenhuma ordem específica: O modelo de inferência Veo2 agora está disponível no Google AI Studio, Gemini (versão reduzida) Suporte nativo para modelos multimodais para geração e edição de imagens: Gemini 2.0 Flash (agora o nome padrão é: Gemini 2.0 Fl...
Resumo Os sistemas de recuperação de informações são essenciais para o acesso eficiente a grandes coleções de documentos. Abordagens recentes usam modelos de linguagem ampla (LLMs) para melhorar o desempenho da recuperação por meio do aumento da consulta, mas geralmente dependem de técnicas caras de aprendizado supervisionado ou destilação que exigem recursos computacionais significativos e dados rotulados manualmente. Em ...
Introdução geral O Cursor Talk to Figma MCP é um projeto de código aberto que conecta a ferramenta de programação de IA Cursor ao software de design Figma por meio do protocolo Model Context Protocol (MCP). Ele foi criado pelo desenvolvedor Sonny Lazuardi, está hospedado no GitHub e tem data de lançamento em 3 de março de 2025. ...
Introdução abrangente O XianyuAutoAgent é um sistema robótico inteligente de atendimento ao cliente projetado especificamente para a plataforma Idlefish, com código aberto pelo desenvolvedor shaxiu no GitHub. Ele realiza tarefas automatizadas de 7×24 horas por meio da tecnologia de IA para ajudar os vendedores de peixes ociosos a responder a mensagens, lidar com barganhas e obter orientação técnica. As principais funções incluem ...
Introdução geral O Seed-VC é um projeto de código aberto no GitHub, desenvolvido pela Plachtaa. Ele pode usar um trecho de áudio de referência de 1 a 30 segundos para realizar rapidamente a conversão de voz ou música, sem treinamento adicional. O projeto oferece suporte à conversão de voz em tempo real, com latência tão baixa quanto 400 milissegundos ou mais, adequado para reuniões on-line...
Introdução geral O PilottAI é uma estrutura Python de código aberto hospedada no GitHub e criada pelo desenvolvedor anuj0456. Ele se concentra em ajudar os usuários a criar um sistema corporal multiinteligente de classe empresarial, com suporte para integração de modelo de linguagem grande (LLM), fornecendo agendamento de tarefas, expansão dinâmica, mecanismo tolerante a falhas e outros recursos.
Introdução geral O HumanOmni é um grande modelo multimodal de código aberto desenvolvido pela equipe HumanMLLM e hospedado no GitHub. Ele se concentra na análise de vídeos humanos e pode processar imagens e sons para ajudar a entender o conteúdo de emoções, ações e diálogos. O projeto usou 2,4 milhões de videoclipes centrados em humanos e...
Introdução geral A Aha é a primeira ferramenta do mundo a se concentrar no marketing da Netflix usando uma equipe de IA, desenvolvida pela Aha Labs. Ela oferece uma equipe de agentes de IA on-line 24 horas por dia, 7 dias por semana, para ajudar os usuários a lançar, gerenciar e dimensionar suas campanhas de marketing da Netflix. Os usuários inserem informações sobre a marca ou o site, e a IA automatizará tarefas como a correspondência com a Netflix,...
A gigante chinesa da Internet, Alibaba, está entrando no espaço da inteligência artificial (IA) em grande estilo. Segundo informações, o CEO da Alibaba, Wu Yongming, deixou claro que deseja se dedicar totalmente à IA nos negócios existentes da empresa. Em um anúncio na Bolsa de Valores de Hong Kong (24 de fevereiro), o Alibaba planeja investir pelo menos US$ 380 bilhões nos próximos três...
Antecedentes Com base na Wenshin Intelligent Body Platform, o assistente de recomendação de livros desenvolvido com o modelo mais recente do DeepSeek é capaz de fazer recomendações inteligentes de produtos com base no conteúdo do diálogo do usuário, obter conversões precisas e transações em dinheiro e criar um negócio de ciclo fechado. Este tutorial analisará profundamente a prática de desenvolvimento do assistente de recomendação de livros do DeepSeek e ajudará...
Introdução abrangente O TxAgent é uma ferramenta de IA de código aberto desenvolvida pela Equipe de Inteligência Artificial Médica e Científica (MIMS) da Universidade de Harvard para ajudar os médicos a analisar interações medicamentosas e desenvolver planos de tratamento personalizados. Ele faz isso por meio do raciocínio em várias etapas e da recuperação em tempo real do conhecimento biomédico, incorporando informações específicas do paciente (por exemplo, idade,...
Introdução abrangente O OpenSearch-SQL é um projeto de código aberto, uma poderosa ferramenta Text-to-SQL que pode transformar a descrição da linguagem natural do usuário em instruções de consulta SQL, para ajudar as pessoas que não estão familiarizadas com o banco de dados a acessar facilmente os dados. Esse projeto foi desenvolvido pela equipe do OpenSearch-AI, com base no Apach...
O SmolDocling é um modelo de linguagem visual (VLM) desenvolvido pela equipe do ds4sd em colaboração com a IBM, com base no SmolVLM-256M, hospedado na plataforma Hugging Face. O SmolDocling é um modelo de linguagem visual (VLM) baseado no SmolVLM-256M, hospedado na plataforma Hugging Face. É o menor VLM do mundo, com apenas 256 milhões de parâmetros, e sua principal função é...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.