Projeto de código aberto de IA

Total de 1020 artigos

organizar em ordem

AigoTools: inclusão automática de sites e suporte para o site de navegação multilíngue de ferramentas de IA de código aberto

Introdução geral O AigoTools é um software de código aberto de navegação de sites da Web com IA, projetado para ajudar os usuários a criar e gerenciar rapidamente sites de navegação. Ele tem gerenciamento de site integrado e recursos de inclusão automática baseados em IA, suporte para vários idiomas, alternância de tema claro/escuro e otimização de SEO.

10 meses atrás

02.9K

Gemini Balance：Gemini模型API兼容OpenAI格式，解锁区域限制并支持多API Key轮询

Gemini Balance: a API do modelo Gemini é compatível com o formato OpenAI, desbloqueando restrições de região e oferecendo suporte à pesquisa de chaves de várias APIs.

Introdução abrangente O Gemini Balance é um serviço proxy de API OpenAI desenvolvido com base na estrutura FastAPI, com o objetivo de fornecer recursos eficientes de otimização e gerenciamento de chaves de várias APIs. O projeto é compatível com as chamadas do modelo Gemini, e os principais recursos incluem...

Recursos mais recentes de IA # Projeto de código aberto AI Java

4 meses atrás

02.9K

FoleyCrafter: Adicionando som sincronizado e vívido a um vídeo silencioso

Introdução geral O FoleyCrafter é um projeto de código aberto desenvolvido pelo OpenMMLab para gerar efeitos sonoros vívidos e sincronizados para vídeos silenciosos. O projeto usa técnicas avançadas de inteligência artificial para gerar efeitos sonoros semanticamente relevantes e sincronizados com o tempo, analisando o conteúdo do vídeo...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Music

8 meses atrás

02.9K

TableGPT Agent: ferramenta inteligente projetada para analisar dados tabulares complexos

Introdução abrangente O TableGPT Agent é uma ferramenta inteligente baseada no projeto de código aberto do GitHub, projetado para processar e analisar dados tabulares. Ele se baseia no TableGPT2 Big Language Model e usa a interação de linguagem natural para permitir que os usuários consultem, manipulem e...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

6 meses atrás

02.9K

OmniSVG: a partir de texto e imagens para gerar gráficos vetoriais SVG projeto de código aberto

Introdução geral O OmniSVG é um projeto de código aberto voltado para a geração de gráficos vetoriais (SVG) de alta qualidade por meio de um modelo multimodal. Ele usa modelos visual-linguísticos pré-treinados para dar suporte à geração de SVG a partir de descrições textuais ou entradas de imagens, abrangendo uma ampla gama de cenários, desde ícones simples até personagens complexos de anime. Itens ...

Recursos mais recentes de IA # Controle de estilo de imagem AI # Projeto de código aberto AI Java

4 meses atrás

02.9K

RSS Translator: uma ferramenta para assinar e traduzir conteúdo RSS em tempo real

Introdução geral O RSS Translator é uma ferramenta de código aberto, limpa e autoimplantável, desenvolvida para ajudar os usuários a traduzir e assinar conteúdo RSS em tempo real. A ferramenta é compatível com vários mecanismos de tradução, incluindo o Google Translate, o Microsoft Tra...

Recursos mais recentes de IA # Projeto de código aberto AI Java Tradução de IA #

6 meses atrás

02.9K

UniAPI: gerenciamento unificado sem servidor de encaminhamento de API de modelo grande

Introdução abrangente O UniAPI é um encaminhador de API compatível com o protocolo OpenAI, e sua função principal é gerenciar APIs de vários provedores de serviços de modelo grande, como OpenAI, Azure OpenAI, Clau...

Recursos mais recentes de IA # Projeto de código aberto AI Java

5 meses atrás

02.9K

VLM-R1: um modelo de linguagem visual para localizar alvos de imagem por meio de linguagem natural

Introdução geral O VLM-R1 é um projeto de modelagem de linguagem visual de código aberto desenvolvido pelo Om AI Lab e hospedado no GitHub. O projeto se baseia na abordagem R1 do DeepSeek, combinada com o modelo Qwen2.5-VL, por meio do aprendizado por reforço...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Detecção visual de alvos

6 meses atrás

02.9K

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela em tempo real e forneçam...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Inteligência de automação de desktop

7 meses atrás

02.9K

light card: ferramenta geradora de cartões HTML5, crie belos cartões de conteúdo com ferramentas simples

Descrição geral O lightcard é uma ferramenta simples e elegante de geração de cartões projetada para ajudar os usuários a criar facilmente belos cartões de conteúdo. A ferramenta suporta conteúdo de texto personalizado, vários estilos de tema e códigos QR para tornar a criação mais fácil e divertida. Os usuários podem editar o título, o corpo e o autor...

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

02.9K

Podcastfy：多源内容转多语言音频对话工具，NotebookLM 播客功能的开源替代方案

Podcastfy: conteúdo de várias fontes para ferramenta de conversação de áudio multilíngue, uma alternativa de código aberto aos recursos de podcasting do NotebookLM

Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

10 meses atrás

02.9K

GPTme：在命令行终端中运行的智能编程助手，ChatGPT代码解释器的本地化替代方案

GPTme: assistente de programação inteligente executado em um terminal de linha de comando, alternativa localizada para o interpretador de código ChatGPT

Introdução abrangente O GPTMe é uma ferramenta revolucionária de assistente de IA de terminal projetada para aumentar a eficiência do trabalho dos desenvolvedores. Ele combina perfeitamente recursos avançados de IA com o ambiente do terminal, oferecendo suporte a diversas funções, como execução de código, edição de arquivos, navegação na Web e reconhecimento visual. Como solução de código do ChatGPT...

Recursos mais recentes de IA # Projeto de código aberto AI Java Programação de IA #

8 meses atrás

02.9K

tldraw: SDK de quadro branco de tela ilimitada de código aberto, IA para gerar wireframes minimalistas e diagramas UML

Descrição geral O tldraw é uma ferramenta de desenho colaborativo gratuita e instantânea que oferece uma tela ilimitada onde os usuários podem desenhar gráficos, escrever textos e colaborar instantaneamente. Com uma interface intuitiva e excelente desempenho, ele é adequado para colaboração em equipe e trabalho remoto. Com suporte da comunidade de código aberto, o tldr...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Quadro branco de IA com infográfico

9 meses atrás

02.8K

QAnything: sistema de perguntas e respostas da base de conhecimento local com fluxo de processamento de RAG altamente integrado

QAnything Introdução abrangente O QAnything (Question and Answer based on Anything) é um sistema local de perguntas e respostas baseado em conhecimento lançado pela NetEase, que suporta todos os tipos de formatos de arquivos e bancos de dados e pode ser instalado e usado off-line....

Recursos mais recentes de IA # Serviços abertos de IA # Projeto de código aberto AI Java # Recuperação de conhecimento e estrutura RAG

11 meses atrás

02.8K

Clonagem de voz CSM: clonagem rápida de voz com o CSM-1B

Introdução geral O CSM Voice Cloning é um projeto de código aberto desenvolvido por Isaiah Bjork e hospedado no GitHub. Ele se baseia no modelo Sesame CSM-1B, que permite aos usuários clonar uma amostra de áudio simplesmente fornecendo um...

Recursos mais recentes de IA # Projeto de código aberto AI Java Clonagem de voz do # AI

5 meses atrás

02.8K

AI Web Operator：浏览器自动化操作，OpenAI Operator的开源实现

AI Web Operator: automação do navegador, implementação de código aberto do OpenAI Operator

Introdução geral O AI Web Operator é uma ferramenta de operador de navegador de IA de código aberto projetada para simplificar a experiência do usuário no navegador, integrando várias tecnologias de IA e SDKs. A ferramenta é baseada no Browserbase e no Vercel...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Produtos multimodais interativos em tempo real

6 meses atrás

02.8K

Gemini Teacher: Assistente de correção de pronúncia em inglês

Introdução geral O Gemini Teacher é um assistente de prática de conversação em inglês baseado na IA do Google Gemini. Ele reconhece a pronúncia em inglês do usuário em tempo real e fornece feedback instantâneo e sugestões de correção. A ferramenta foi projetada para ajudar os usuários a melhorar suas habilidades de fala em inglês por meio de...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramentas educacionais de IA

6 meses atrás

02.8K

Bambo: uma estrutura leve e flexível para corpos inteligentes, com configuração simples de funções e ferramentas para lidar com várias cargas de tarefas

Introdução geral O Bambo é um novo tipo de estrutura de proxy, que é mais leve e mais flexível do que as estruturas convencionais e pode lidar com uma variedade de tarefas de carga. O Bambo obtém uma funcionalidade de proxy eficiente definindo todas as ferramentas no catálogo de ferramentas e usando funções personalizadas assíncronas. Os usuários podem usar o llm_c...

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

8 meses atrás

02.8K

ANUS: uma estrutura de IA de código aberto para automação de tarefas e colaboração com vários agentes

Introdução geral O ANUS (Advanced Neural Understanding System) é uma estrutura de agente de IA de código aberto hospedada no GitHub, criada pelo usuário nikmcfly por...

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

5 meses atrás

02.8K

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

Introdução abrangente O SemHash é uma ferramenta leve e flexível para eliminar a duplicação de conjuntos de dados por similaridade semântica. Ele combina a rápida geração de incorporação do Model2Vec com a eficiente pesquisa de similaridade ANN (vizinho mais próximo aproximado) do Vicinity.SemHa...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

7 meses atrás

02.8K

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

Introdução geral O OmniParse é uma poderosa plataforma de análise e otimização de dados projetada para transformar quaisquer dados não estruturados em dados estruturados e acionáveis otimizados para a estrutura GenAI (Generative Artificial Intelligence). Não importa se você está trabalhando com documentos, tabelas, imagens, vídeos, arquivos de áudio ou...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

9 meses atrás

02.8K

Higress: fornecendo uma solução eficiente de gateway de IA para simplificar o gerenciamento de microsserviços e aumentar a segurança

Introdução abrangente O Higress é um gateway de API nativo da nuvem desenvolvido pela Alibaba, com base no Istio e no Envoy, projetado para fornecer soluções eficientes de agendamento de tráfego, governança de serviços e segurança. Ele oferece suporte a extensões de plug-in Wasm para várias linguagens de programação para negócios de IA...

Recursos mais recentes de IA # Projeto de código aberto AI Java

9 meses atrás

02.8K

SpeechGPT 2.0-preview: um macromodelo de diálogo de fala antropomórfico de ponta a ponta para interação em tempo real

O SpeechGPT 2.0-preview é o primeiro sistema de interação antropomórfica em tempo real introduzido pelo OpenMOSS, que é treinado com base em milhões de horas de dados de fala. O sistema é equipado com expressão falada antropomórfica e resposta de baixa latência de 100 ms, oferecendo suporte à interação natural e suave em tempo real...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Produtos multimodais interativos em tempo real

6 meses atrás

02.8K

STAR: Modelo de IA de aprimoramento de tempo espacial para melhorar a nitidez da resolução de vídeo

Introdução abrangente O STAR (Spatial-Temporal Augmentation with Text-to-Video Models) é uma estrutura inovadora de super-resolução de vídeo desenvolvida em conjunto pela Nanjing University, ByteDance e Southwest University...

Recursos mais recentes de IA # Ampliação e restauração de imagens AI # Projeto de código aberto AI Java

7 meses atrás

02.8K

Zed: um editor de código colaborativo multijogador de alto desempenho desenvolvido pela Rust

Introdução geral O Zed é um editor de código colaborativo multiusuário de alto desempenho, desenvolvido pelos criadores do Atom e do Tree-sitter. Escrito na linguagem Rust, o Zed foi projetado para proporcionar uma experiência de codificação rápida e fluida. Seus principais recursos incluem suporte para multijogadores...

Recursos mais recentes de IA # AI IDE # Projeto de código aberto AI Java Programação de IA #

8 meses atrás

02.8K

OpenAI WebRTC Python：与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: uma biblioteca Python para interação de voz com APIs em tempo real da OpenAI

Introdução abrangente O OpenAI Realtime WebRTC Python é uma biblioteca Python profissional que fornece aos desenvolvedores uma solução completa para interação de voz com a API OpenAI Realtime. O projeto baseia-se na tecnologia WebRTC, que permite baixa latência...

Recursos mais recentes de IA # Projeto de código aberto AI Java

7 meses atrás

02.8K

Artab: mostra pinturas mundialmente famosas em uma nova guia aberta no navegador, plug-in do Chrome

Descrição geral O Artab é uma extensão de navegador projetada para exibir as maiores obras de arte do mundo sempre que você abrir uma nova guia. A extensão está disponível para os navegadores Chrome, Edge e Firefox. Com o Artab, os usuários podem navegar...

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

02.8K

Social Media Agent：社交媒体智能助手，自动生成和管理社交媒体内容

Social Media Agent: um assistente inteligente para mídias sociais que gera e gerencia automaticamente o conteúdo das mídias sociais

Introdução geral O Social Media Agent (Agente de mídia social) é um projeto de código aberto que gerencia as informações de interação pela nova Caixa de entrada do agente, projetado para ajudar os usuários a automatizar a geração e o gerenciamento de conteúdo de mídia social. O projeto foi desenvolvido pela equipe da LangChain...

Recursos mais recentes de IA # Projeto de código aberto AI Java Mídia social de IA #

7 meses atrás

02.8K

IndexTTS: ferramenta de conversão de texto em fala com suporte a mixagem de chinês e inglês

Introdução geral O IndexTTS é uma ferramenta de conversão de texto em fala (TTS) de código aberto hospedada no GitHub e desenvolvida pela equipe do index-tts. Ele se baseia na tecnologia XTTS e Tortoise, aprimorando o design do módulo, para fornecer uma solução eficiente e ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

5 meses atrás

02.8K

CFG-Zero-star: uma ferramenta de código aberto para melhorar a qualidade da geração de imagens e vídeos

Introdução abrangente O CFG-Zero-star é um projeto de código aberto desenvolvido por Weichen Fan e pela equipe do S-Lab da Universidade Tecnológica de Nanyang. Ele se concentra no aprimoramento da técnica CFG (Classifier Free Guidance) em modelos de correspondência de fluxo por meio da otimização da estratégia de orientação e do zero-inicial ...

Recursos mais recentes de IA # AI Auxiliares de geração de imagens # Projeto de código aberto AI Java Ferramenta de geração de vídeo # AI

5 meses atrás

02.8K

Groq AppGen：使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: um projeto experimental para demonstrar os recursos de geração de código HTML do Llama 3.3 70B usando APIs do Groq

Introdução geral O Groq AppGen é um gerador de aplicativos da Web interativo e inovador, desenvolvido e de código aberto pela Groq Inc. O projeto demonstra o poder do modelo Llama 3.3 70B para geração de código HTML. Ao integrar o Groq...

Recursos mais recentes de IA # Projeto de código aberto AI Java

7 meses atrás

02.8K

GenEx: geração de mundos 3D exploráveis em 360° a partir de uma única imagem (código progressivamente de código aberto)

Introdução geral O GenEx é um modelo avançado de IA capaz de gerar um mundo 3D 360° totalmente explorável a partir de uma única imagem. Os usuários podem explorar interativamente esse mundo gerado. O GenEx ultrapassa os limites da IA figurativa no espaço imaginativo e tem o potencial de...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Texto e imagem AI para 3D

8 meses atrás

02.8K

Kilo Code: uma ramificação do Roo Code com uma experiência de usuário limpa

Introdução geral O Kilo Code é um plug-in de extensão de código aberto para o Visual Studio Code (VS Code). Ele usa tecnologia de inteligência artificial para ajudar os usuários a escrever códigos com mais eficiência. Esse projeto foi desenvolvido pela equipe do Kilo-Org, a maioria...

Recursos mais recentes de IA # AI IDE # Projeto de código aberto AI Java Programação de IA #

5 meses atrás

02.8K

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

Galeria de desenvolvimento de IA: Conjunto de ferramentas de desenvolvimento de modelos de IA nativos do Windows, integração de modelos do lado final em aplicativos do Windows

Introdução geral O AI Dev Gallery é um aplicativo de ferramentas de desenvolvimento de IA da Microsoft (atualmente em visualização pública) projetado para desenvolvedores do Windows. Ele fornece uma plataforma abrangente para ajudar os desenvolvedores a integrar facilmente os recursos de IA em seus...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramenta de modelo grande de código aberto implantada localmente

7 meses atrás

02.8K

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução abrangente O Pyramid Flow é um método eficiente de geração de vídeo autorregressivo baseado na técnica de correspondência de fluxo. O método alcança maior eficiência computacional na geração e descompressão de conteúdo de vídeo por meio da interpolação entre diferentes resoluções e níveis de ruído...

Recursos mais recentes de IA # AI Imagem para vídeo # Projeto de código aberto AI Java

9 meses atrás

02.8K

Aana SDK: uma ferramenta de código aberto para facilitar a implantação de modelos de IA multimodais

Introdução geral O Aana SDK é uma estrutura de código aberto desenvolvida pela Mobius Labs, batizada com o nome da palavra malaiala ആന (elefante). Ele ajuda os desenvolvedores a implementar e gerenciar rapidamente modelos de IA multimodais, oferecendo suporte ao processamento de texto, imagens, áudio e vídeo e outros dados...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramenta de modelo grande de código aberto implantada localmente

5 meses atrás

02.8K

OmAgent: uma estrutura de corpo inteligente para a criação de dispositivos inteligentes multimodais

Introdução abrangente O OmAgent é uma estrutura de corpo inteligente multimodal desenvolvida pelo Om AI Lab, com o objetivo de fornecer recursos avançados baseados em IA para dispositivos inteligentes. Ao integrar modelos de base multimodais de última geração e algoritmos de corpo inteligente, o projeto permite que os desenvolvedores criem dispositivos inteligentes eficientes em uma variedade de...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Produtos multimodais interativos em tempo real Estrutura de desenvolvimento do corpo inteligente #

7 meses atrás

02.8K

PandasAI: uma plataforma de diálogo de análise de dados para consultas de dados e geração de gráficos em linguagem natural

Introdução geral O PandasAI é uma plataforma de código aberto baseada em Python projetada para simplificar o processo de análise de dados por meio de técnicas de processamento de linguagem natural. Permite que os usuários trabalhem em um diálogo com bancos de dados (por exemplo, SQL, CSV, pandas, polars, mongodb, n...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

9 meses atrás

02.8K

Open Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na Web

Introdução geral O Open Deep Research é uma ferramenta de geração de relatórios de pesquisa orientada por IA de código aberto como uma alternativa de código aberto aos recursos de pesquisa profunda do Google Gemini. O projeto é desenvolvido em TypeScript e baseado no Next.js 1...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gerar um relatório de pesquisa detalhado

4 meses atrás

02.8K

MTEB: Benchmarking para avaliar o desempenho dos modelos de incorporação de texto

Introdução geral O MTEB (Massive Text Embedding Benchmark) é um projeto de código aberto desenvolvido pela equipe do embeddings-benchmark e hospedado no GitHub, com o objetivo de fornecer modelos de incorporação de texto...

Recursos mais recentes de IA # Projeto de código aberto AI Java

5 meses atrás

02.8K

InstantCharacter: uma ferramenta de código aberto para gerar caracteres consistentes a partir de uma única imagem

Introdução geral O InstantCharacter é um projeto de código aberto desenvolvido pela Tencent Hunyuan e pela equipe do InstantX, hospedado no GitHub. Ele gera mapas de caracteres de aparência consistente com uma imagem de referência e uma descrição de texto...

Recursos mais recentes de IA # Controle de estilo de imagem AI # Projeto de código aberto AI Java

3 meses atrás

02.8K

Qwen2.5-VL: um grande modelo multimodal de código aberto para análise de documentos de imagem e vídeo

Introdução abrangente O Qwen2.5-VL é um grande modelo multimodal de código aberto desenvolvido pela equipe Qwen da Alibaba Cloud (Alibaba Cloud). Ele pode lidar com texto, imagens, vídeo e documentos ao mesmo tempo, é uma versão atualizada do Qwen2-VL, baseada no Qwen2.5...

Recursos mais recentes de IA # Projeto de código aberto AI Java

5 meses atrás

02.8K

Story-Adapter: gerar ilustrações gráficas contínuas e consistentes com base em uma longa história.

Introdução geral O Story-Adapter é uma estrutura inovadora de visualização de histórias que converte histórias textuais em sequências de imagens coerentes. Desenvolvido por pesquisadores, esse projeto emprega uma abordagem iterativa que não requer treinamento para gerar ilustrações de histórias de alta qualidade. A estrutura é caracterizada por sua capacidade de lidar com longas...

Recursos mais recentes de IA # Controle de estilo de imagem AI # Projeto de código aberto AI Java

7 meses atrás

02.8K

DataLine: cliente de análise e visualização de dados de IA para geração rápida de gráficos e relatórios

Introdução geral O DataLine é uma poderosa ferramenta de análise e visualização de dados de IA projetada para ajudar os usuários a interagir com uma variedade de fontes de dados por meio de operações simples. Seja um arquivo CSV ou um banco de dados convencional, como Postgres, MySQL, Snowflake, SQL...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

6 meses atrás

02.8K

MoneyPrinterTurbo: gere cópias de vídeo e vídeos curtos em HD com um clique, inserindo um tema de vídeo

Introdução abrangente O MoneyPrinterTurbo é um projeto de código aberto que usa tecnologia avançada de modelo grande de IA para realizar a função de gerar vídeos HD curtos com um clique. Os usuários só precisam fornecer um tema de vídeo ou palavras-chave e o sistema gerará automaticamente cópias de vídeo, clipes de vídeo, legendas de vídeo e...

Recursos mais recentes de IA # Projeto de código aberto AI Java Ferramenta de geração de vídeo # AI

5 meses atrás

02.8K

VideoSeal: Ferramenta avançada de incorporação e extração de marca d'água oculta em vídeo de código aberto para proteger os direitos autorais de vídeo

Introdução geral O VideoSeal é uma ferramenta de marca d'água de vídeo de código aberto desenvolvida pela Facebook Research, projetada para fornecer incorporação e extração eficientes de marcas d'água de vídeo. A ferramenta é compatível com os modelos de código aberto mais recentes e contém modelos pré-treinados, código de treinamento, código de inferência e ferramentas de avaliação...

Recursos mais recentes de IA # Projeto de código aberto AI Java Editor de áudio/vídeo # AI

8 meses atrás

02.8K

SQLite-Utils-Ask：让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: permite que os usuários consultem bancos de dados SQLite e arquivos CSV/JSON para obter dados de consulta

Introdução geral O SQLite-Utils-Ask é uma ferramenta avançada criada para ajudar os usuários a realizar consultas de dados com perguntas e respostas em bancos de dados SQLite e arquivos CSV/JSON com o auxílio do LLM (Large Language Model). A ferramenta é capaz de gerar automaticamente perguntas para o usuário com base em...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

9 meses atrás

02.8K

Data Formulator: uma ferramenta de visualização de dados orientada por IA

Introdução geral O Data Formulator é uma ferramenta de visualização de dados orientada por IA de código aberto desenvolvida pela Microsoft Research. A ferramenta combina uma interface gráfica de usuário (GUI) e entrada de linguagem natural (NL) para permitir que os usuários criem e iterem rapidamente por meio de interações e comandos simples...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA

6 meses atrás

02.8K

JoyGen: Ferramenta de edição de vídeo de retratos falados em 3D com reconhecimento de profundidade e orientada por áudio

Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução 3D e métodos de extração de recursos de áudio para capturar com precisão as características de identidade do locutor e a expressão...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Digital Man

7 meses atrás

02.8K

Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Introdução abrangente O Vision Parse é uma ferramenta revolucionária de processamento de documentos, que combina de forma inteligente a mais avançada tecnologia de modelos de linguagem visual (Vision Language Models), a capacidade de converter documentos PDF de forma inteligente em um formato Markdown de alta qualidade...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

8 meses atrás

02.8K

WeChat Video No. Downloader: Baixe rapidamente o vídeo WeChat Video No., compatível com vários formatos e plataformas

Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no...

Recursos mais recentes de IA # Projeto de código aberto AI Java

7 meses atrás

02.8K

AutoFlow：基于GraphRAG的对话式知识库/网页深度搜索工具，对话框可集成到其他网站

AutoFlow: base de conhecimento conversacional baseada em GraphRAG/ferramenta de pesquisa profunda na Web com diálogos que podem ser integrados a outros sites

Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra as estruturas LlamaIndex e DSPy para oferecer suporte à pesquisa de diálogos complexos e ao gráfico de conhecimento...

Recursos mais recentes de IA Robô de atendimento ao cliente # AI # Projeto de código aberto AI Java # Gráfico de conhecimento

7 meses atrás

02.8K

Gemini Search：Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini Search: um mecanismo de pesquisa de IA no estilo Perplexity criado no Gemini 2.0 Flash

Introdução abrangente O Gemini-Search é um projeto de mecanismo de pesquisa inteligente de código aberto baseado na tecnologia Google Gemini 2.0. O projeto usa o desenvolvimento TypeScript e tem o compromisso de replicar o mecanismo de pesquisa Perplexity ...

Recursos mais recentes de IA # Projeto de código aberto AI Java Ferramenta de busca # AI

7 meses atrás

02.8K

DB-GPT: criação de uma estrutura de desenvolvimento de aplicativos de dados nativos de IA, integrando gerenciamento de vários modelos e processamento inteligente de dados

Introdução abrangente O DB-GPT é uma estrutura de desenvolvimento de aplicativos de dados nativos de IA de código aberto criada usando AWEL (Agentic Workflow Expression Language) e tecnologias de corpo inteligente. O projeto tem como objetivo criar uma infraestrutura no campo de grandes modelos...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Análise de dados de IA # Recuperação de conhecimento e estrutura RAG

5 meses atrás

02.8K

CogView3: modelo de imagem de geração de texto de difusão em cascata de código aberto do Wisdom Spectrum

Introdução abrangente O CogView3 é um sistema avançado de imagens geradas por texto desenvolvido pela Universidade de Tsinghua e pela Think Tank Team (Chi Spectrum Qingyan). Ele se baseia em um modelo de difusão em cascata e gera imagens de alta resolução em vários estágios. Os principais recursos do CogView3 incluem geração em vários estágios, arquitetura inovadora e desempenho eficiente...

Recursos mais recentes de IA Geração de imagens on-line # AI # Projeto de código aberto AI Java

10 meses atrás

02.8K

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Introdução abrangente A ferramenta de monitoramento de degradação do serviço ChatGPT é um projeto de código aberto criado para ajudar os usuários a detectar se o serviço ChatGPT foi degradado devido a IPs de alto risco. A ferramenta analisa os valores de dificuldade do Proof of Work (PoW) para determinar se os usuários...

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

02.8K

OASIS: simulação de inteligência múltipla de interações de mídia social de milhões de usuários para estudar fenômenos sociais complexos

Introdução geral O OASIS (Open Agent Social Interaction Simulations) é um simulador de mídia social de código aberto capaz de simular o comportamento de até um milhão de usuários. A plataforma combina um modelo de linguagem em grande escala com um modelo baseado em regras...

Recursos mais recentes de IA # Projeto de código aberto AI Java Aplicação do corpo inteligente #

5 meses atrás

02.8K

GPT-Crawler: rastreamento automático do conteúdo do site para gerar documentos da base de conhecimento

Introdução geral O GPT-Crawler é uma ferramenta de código aberto desenvolvida pela equipe do BuilderIO e hospedada no GitHub. Ele rastreia o conteúdo da página inserindo um ou mais URLs de sites, gerando arquivos de conhecimento estruturado (output.jso...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

2 meses atrás

02.8K

Parler-TTS: geração de modelos de conversão de texto em fala específicos do locutor a partir do texto de entrada

Introdução geral O Parler-TTS é uma biblioteca de modelos de conversão de texto em fala (TTS) de código aberto desenvolvida pela Hugging Face, projetada para gerar fala de alta qualidade e com som natural. O modelo é capaz de gerar fala com base no texto de entrada com um estilo de locutor específico (por exemplo, gênero, tom, estilo de fala...).

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

6 meses atrás

02.8K

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Introdução geral O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance que visa gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais em vídeos de unidades para animar imagens de retratos individuais, gerando efeitos de movimento realistas e sensíveis ao contexto.

Recursos mais recentes de IA # AI Imagem para vídeo # Projeto de código aberto AI Java

7 meses atrás

02.8K

Porkybank: gerenciamento de orçamento diário com tecnologia de IA para facilitar o acompanhamento de orçamentos diários

Descrição geral O Porkybank é um aplicativo de gerenciamento de finanças pessoais de código aberto desenvolvido para ajudar os usuários a controlar facilmente seu orçamento diário. Com uma fórmula simples (Renda - Despesas) / Dias = Dinheiro, os usuários podem visualizar sua situação financeira. O projeto está hospedado no GitHu...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Assistente de eficiência de vida de IA

7 meses atrás

02.8K

Nó GaiaNet: instale e execute seu próprio serviço de proxy on-line de modelo local

Introdução geral O GaiaNet-AI/gaianet-node é um projeto de código aberto que permite aos usuários instalar rapidamente a pilha de software de nó padrão no Mac, Linux ou Windows WSL com um único comando. Os usuários podem inicializar os nós, personalizar as configurações, fazer download...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ferramenta de modelo grande de código aberto implantada localmente

11 meses atrás

02.8K

Agent Laboratory: código automatizado e assistente de redação de estudos para pesquisadores

Introdução abrangente O Agent Laboratory é um fluxo de trabalho de pesquisa autônomo de ponta a ponta projetado para ajudar os pesquisadores a concretizar suas ideias de pesquisa. O sistema consiste em agentes dedicados, orientados por modelos de linguagem em grande escala, que dão suporte a todo o fluxo de trabalho de pesquisa, desde a realização de revisões de literatura e desenvolvimento de planos até a execução...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gerar um relatório de pesquisa detalhado

4 meses atrás

02.8K

Cog-ComfyUI: executando fluxos de trabalho do ComfyUI com APIs

Introdução geral O Cog-ComfyUI é um projeto de código aberto desenvolvido para executar fluxos de trabalho do ComfyUI por meio de uma API. Criado pelo usuário fofr do GitHub, o projeto fornece uma maneira eficiente de integrar e executar fluxos de trabalho do ComfyUI.

Recursos mais recentes de IA # AI Auxiliares de geração de imagens # Projeto de código aberto AI Java # ComfyUI

6 meses atrás

02.8K

Open NotebookLM: converte PDF em podcasts de ferramentas de código aberto

Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF e gerar um diálogo natural adequado para podcasts de áudio...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Conversão de texto em fala com IA

6 meses atrás

02.8K

修复无效JSON字符串，解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Corrige cadeias de caracteres JSON inválidas e resolve possíveis erros de formatação em dados JSON gerados por LLMs.

Descrição geral Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo corrige erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e valores-chave incompletos...

Recursos mais recentes de IA # Projeto de código aberto AI Java

10 meses atrás

02.8K

Moshi: uma estrutura de diálogo de fala em tempo real com suporte a vários idiomas e sotaques para modelos de base de diálogo de fala

Introdução geral O Moshi Chat é um assistente de voz de IA em tempo real de ponta a ponta da Kyutai, um laboratório francês de IA sem fins lucrativos. Ele não apenas ouve em tempo real, mas também se envolve em conversas naturais e oferece suporte a interações multimodais, incluindo a capacidade de ver, ouvir e falar.Moshi Ch...

Recursos mais recentes de IA # Projeto de código aberto AI Java

11 meses atrás

02.8K

NodeRAG: uma ferramenta baseada em gráficos heterogêneos para recuperação e geração de informações precisas

Uma introdução abrangente O NodeRAG é um sistema RAG (Retrieval Augmented Generation) de código aberto hospedado no GitHub e desenvolvido por Terry-Xu-666. Ele otimiza a recuperação e a geração de informações por meio de estruturas gráficas heterogêneas, melhorando significativamente a precisão da recuperação e a relevância contextual.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Recuperação de conhecimento e estrutura RAG

4 meses atrás

02.8K

Deep Research Web UI: um assistente de IA que oferece suporte à pesquisa profunda multilíngue

Introdução abrangente A Deep Research Web UI é uma ferramenta de assistente de pesquisa de código aberto baseada em tecnologia de IA, projetada para ajudar os usuários a realizar pesquisas iterativas profundas sobre qualquer tópico. Ele combina o poder dos mecanismos de pesquisa, o rastreamento da Web e a modelagem de linguagem em larga escala por meio de uma interface intuitiva na Web...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gerar um relatório de pesquisa detalhado

4 meses atrás

02.8K

Ferramenta de código aberto para conversão de fala em texto em tempo real

Introdução geral O realtime-transcription-fastrtc é um projeto de código aberto voltado para a conversão de fala em texto em tempo real. Ele usa a tecnologia FastRTC para processar fluxos de áudio de baixa latência, combinada com um modelo Whisper local para obter eficiência ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

02.8K

Copilot后端代理服务：用其他模型接管GitHub Copilot插件服务端

Serviço de proxy de back-end do Copilot: assumir o servidor de plug-in do GitHub Copilot com outros modelos

Introdução geral O Copilot Backend Agent Service é um projeto de código aberto desenvolvido para gerenciar o servidor de plug-in do Copilot do GitHub, aproveitando outros modelos de FIM, como o DeepSeek, e oferecendo suporte a várias pessoas que compartilham contas oficiais. O serviço oferece suporte a uma variedade de IDEs, incluindo o V...

Recursos mais recentes de IA # Serviços abertos de IA # Projeto de código aberto AI Java

8 meses atrás

02.8K

Report mAIstro：生成任意自定义主题的详细报告文档，例如商业分析、年终汇报等

Geração de relatórios: gere relatórios detalhados sobre qualquer tópico personalizado, como análise de negócios, relatórios de fim de ano, etc.

Descrição geral O Report mAIstro é uma ferramenta avançada projetada para ajudar os usuários a criar facilmente relatórios personalizados por meio da tecnologia de processamento de linguagem natural. A ferramenta utiliza a tecnologia LangChain para transformar tópicos e estruturas fornecidos pelo usuário em relatórios detalhados...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gerar um relatório de pesquisa detalhado

4 meses atrás

02.8K

MindSearch：开源AI搜索引擎框架，部署您自己的 Perplexity 搜索引擎！

MindSearch: estrutura de mecanismo de pesquisa de IA de código aberto para implementar seu próprio mecanismo de pesquisa Perplexity!

Introdução abrangente O MindSearch é uma estrutura de mecanismo de busca de IA de código aberto lançada pelo Laboratório de Inteligência Artificial de Xangai (SAL), cujo objetivo é simular o processo de pensamento humano para coleta e integração de informações complexas. A ferramenta combina as tecnologias avançadas de modelagem de linguagem em larga escala (LLM) e mecanismos de busca por meio de inteligência múltipla...

Recursos mais recentes de IA # Projeto de código aberto AI Java Ferramenta de busca # AI

8 meses atrás

02.8K

Knowledge Table: uma ferramenta de código aberto para extração e exploração eficientes de dados estruturados

Introdução abrangente A Knowledge Table (Tabela de conhecimento) é um projeto de código aberto criado para simplificar o processo de extração e exploração de dados estruturados de documentos não estruturados. Os usuários podem criar representações de conhecimento estruturado, como tabelas e gráficos, por meio de uma interface de consulta em linguagem natural. A ferramenta permite personalizar a extração ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gráfico de conhecimento

10 meses atrás

02.8K

HyperChat: um cliente de diálogo de IA que usa a inteligência do MCP para executar tarefas complexas

Introdução geral O HyperChat é um cliente de bate-papo de código aberto desenvolvido pelo BigSweetPotatoStudio e hospedado no GitHub, projetado para fornecer uma visão geral abrangente do modelo de linguagem do BigSweetPotatoStudio, integrando APIs de vários modelos de linguagem grandes (LLMs), como OpenAI, Cla...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Aplicativo de bate-papo localizado com IA Aplicação do corpo inteligente #

5 meses atrás

02.8K

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Gráfico de conhecimento # Recuperação de conhecimento e estrutura RAG

7 meses atrás

02.8K

InspireMusic: estrutura de geração de música, canção e áudio unificada e de código aberto da Ali

Introdução geral O InspireMusic é um kit de ferramentas de código aberto baseado no PyTorch voltado para a geração de música, canções e áudio. Ele fornece uma estrutura unificada para gerar áudio de alta qualidade com controles para dicas de texto, estrutura musical e estilo musical.

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Music

5 meses atrás

02.8K

Vector Vein: plataforma de criação de fluxo de trabalho de IA sem código

Introdução abrangente O Vector Vein é uma plataforma de criação de fluxos de trabalho de IA sem código, projetada para ajudar os usuários a criar facilmente fluxos de trabalho inteligentes e automatizados. Sem necessidade de base de programação, os usuários podem simplesmente conectar vários módulos funcionais por meio de operações de arrastar e soltar para criar fluxos de trabalho de IA complexos...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Fluxo de trabalho com pouco código

8 meses atrás

02.8K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: criando mini-inteligências LLM com "estrutura de gráfico direcionado" em 100 linhas de código

Introdução geral O miniLLMFlow é uma estrutura de desenvolvimento minimalista do Large Language Model (LLM) que contém apenas 100 linhas de código principal, demonstrando a filosofia de design de "manter a simplicidade". A estrutura foi projetada especificamente para permitir que os assistentes de IA (por exemplo, ChatGPT, Claude etc.)...

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

7 meses atrás

02.8K

LAMBDA: Sistema de automação de e-mail com IA localizada para geração rápida de respostas de rascunho de e-mail (Gmail)

Introdução geral O LAMBDA (Local Auto MailBox Draft Assistant) é um sistema de automação de e-mail com IA localizada, projetado para aprender com o estilo de e-mail do usuário e gerar um rascunho para cada e-mail não lido na caixa de entrada do Gmail...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Assistente de eficiência de vida de IA

8 meses atrás

02.8K

Construção, com base em RAG, de um mini-assistente que fornece orientação sobre saúde (projeto piloto)

Introdução geral O LLM-RAG-Longevity-Coach é um chatbot baseado nas tecnologias Large Language Modelling (LLM) e Retrieval Augmented Generation (RAG), projetado para fornecer conselhos personalizados sobre saúde e longevidade aos usuários. O projeto foi desenvolvido por Tyler Burle...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Assistente de eficiência de vida de IA

6 meses atrás

02.8K

Zola: aplicativo da Web de bate-papo de IA de código aberto com upload de documentos e suporte a vários modelos

Introdução geral O Zola é um aplicativo de bate-papo com IA gratuito e de código aberto desenvolvido pelo desenvolvedor Julien Thibeaut (nome de usuário ibelick do GitHub) e hospedado no GitHub. Seu melhor recurso é que ele suporta vários modos de IA...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Aplicativo de bate-papo localizado com IA Plataforma de diálogo multimodelo integrada de IA #

4 meses atrás

02.7K

Flock: orquestração de fluxo de trabalho com pouco código para criar chatbots rapidamente

Introdução geral O Flock é uma plataforma de código aberto de baixo código para fluxo de trabalho, hospedada no GitHub e desenvolvida pela equipe da Onelevenvy. Ela se baseia nas tecnologias LangChain e LangGraph e se concentra em ajudar os usuários a criar rapidamente máquinas de bate-papo...

Recursos mais recentes de IA Robô de atendimento ao cliente # AI # Projeto de código aberto AI Java # Fluxo de trabalho com pouco código

6 meses atrás

02.7K

Markdownify MCP Server：基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: converte vários conteúdos no formato Markdown com base no protocolo MCP.

Introdução geral O Markdownify MCP Server é uma ferramenta de código aberto baseada no Model Context Protocol, hospedada no GitHub pelo desenvolvedor Zach Caceres ...

Recursos mais recentes de IA # Projeto de código aberto AI Java Serviços de MCP ## Extração e limpeza de documentos

5 meses atrás

02.7K

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

Introdução geral O Gemini Playground é um projeto de código aberto criado para ajudar os usuários a implementar rapidamente um site de diálogo multimodal. O projeto é desenvolvido por um técnico de rastreamento de camarão, com suporte ao uso da chave da API Gemini em 10 segundos para concluir a implantação. Se o usuário estiver ...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Modelo grande e gratuito de API

6 meses atrás

02.7K

Agent Service Toolkit：基于LangGraph构建AI智能体的完整工具集

Agent Service Toolkit: um conjunto completo de ferramentas para a criação de inteligências de IA com base no LangGraph

Introdução abrangente O AI Agent Service Toolkit é um conjunto de ferramentas completo baseado em LangGraph, FastAPI e Streamlit, projetado para ajudar os desenvolvedores a criar e executar rapidamente serviços de agente de IA. O kit de ferramentas fornece um...

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

7 meses atrás

02.7K

ExtractThinker: extração e categorização de documentos em dados estruturados para otimizar o processo de manuseio de documentos

Introdução abrangente O ExtractThinker é uma ferramenta flexível de inteligência de documentos que extrai e classifica dados estruturados de documentos usando Modelos de Linguagem Grandes (LLMs), fornecendo um fluxo de trabalho de processamento de documentos semelhante ao ORM. Ele é compatível com vários carregadores de documentos, incluindo o Tess...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

7 meses atrás

02.7K

AudioNotes: extraia rapidamente o conteúdo de áudio e vídeo e gere notas estruturadas

Introdução abrangente O AudioNotes é um sistema de notas estruturadas de áudio/vídeo desenvolvido com base no FunASR e no Qwen2. Ele pode extrair rapidamente o conteúdo de áudio/vídeo e chamar o grande modelo para gerar notas estruturadas em Markdown, o que é conveniente para...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

6 meses atrás

02.7K

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)

Introdução geral O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O projeto foi criado pela NZqian para fornecer a pesquisadores e desenvolvedores dados de alta qualidade sobre letras de rap, coletando e processando músicas de rap do YouTube...

Recursos mais recentes de IA # Projeto de código aberto AI Java # AI Music

8 meses atrás

02.7K

Agent Inbox: uma interface de gerenciamento para interação humano-computador com inteligências de IA

Introdução geral O Agent Inbox é um projeto de código aberto desenvolvido pela equipe da LangChain para proporcionar uma nova experiência de usuário na interação com inteligências de IA. O projeto permite que os usuários gerenciem e otimizem as interações com várias inteligências de IA por meio de uma interface centralizada.Ag...

Recursos mais recentes de IA # Projeto de código aberto AI Java

7 meses atrás

02.7K

Crawlee: criação de rastreadores da Web confiáveis e ferramentas de automação do navegador com Node.js

Introdução geral O Crawlee é um rastreador da Web de código aberto e uma biblioteca de automação de navegador desenvolvida pela Apify, projetada para ambientes Node.js. Ele é compatível com JavaScript e TypeScript e pode ser usado com o Puppeteer...

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

02.7K

ChainForge: um ambiente de programação visual de código aberto para testar e avaliar a eficácia de grandes dicas de modelos de linguagem

Introdução geral O ChainForge é um ambiente de programação visual de código aberto projetado para testar e avaliar a eficácia de dicas de modelos de linguagem ampla (LLM). Ele oferece um ambiente de engenharia de dicas de fluxo de dados por meio do qual os usuários podem explorar e analisar rapidamente a qualidade de diferentes dicas na resposta do LLM...

Recursos mais recentes de IA # Projeto de código aberto AI Java # PROMPTS Aids

8 meses atrás

02.7K

GOT-OCR2.0: baseado no modelo de OCR multimodal de ponta a ponta QWen2 0.5B

Introdução abrangente O GOT-OCR2.0 é um modelo de reconhecimento óptico de caracteres (OCR) de código aberto co-proposto pela StepStar, cujo objetivo é impulsionar a tecnologia de OCR em direção ao OCR-2.0 por meio de um modelo unificado de ponta a ponta. O modelo oferece suporte a uma ampla variedade de tarefas de OCR, incluindo reconhecimento de texto normal, gr...

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR

11 meses atrás

02.7K

ColiVara: serviço de armazenamento e recuperação de documentos baseado em incorporação visual

Introdução geral O ColiVara é um serviço de armazenamento e recuperação de documentos baseado na tecnologia de incorporação visual. Ele elimina a necessidade de reconhecimento óptico de caracteres (OCR) ou de extração de texto e evita os problemas de formulários quebrados ou imagens perdidas. O ColiVara é compatível com mais de 100 formatos de arquivo, incluindo PDF...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Recuperação de conhecimento e estrutura RAG

6 meses atrás

02.7K

Agentes atômicos: uma estrutura para criar inteligências de IA modulares e leves

Introdução geral O Atomic Agents é uma estrutura extremamente leve e modular projetada com base no conceito de atomicidade para a criação de pipelines e aplicativos de IA de agentes. A estrutura oferece um conjunto de ferramentas e agentes que podem ser combinados para criar aplicativos avançados. Ela se baseia no Instruc...

Recursos mais recentes de IA # Projeto de código aberto AI Java Estrutura de desenvolvimento do corpo inteligente #

8 meses atrás

02.7K

LongWriter：智谱推出生成超长文本的强大模型，支持一次对话生成10000+字

LongWriter: o Wisdom Spectrum lançou um modelo avançado para a geração de textos ultralongos, suportando a geração de mais de 10.000 palavras em uma única conversa.

Introdução abrangente O LongWriter é uma poderosa ferramenta de geração de textos longos desenvolvida pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM). A ferramenta é baseada no avançado Modelo de Linguagem de Contexto Longo (LLM) e é capaz de gerar textos longos com mais de 10.000 palavras.

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

02.7K

UltraPixel: tecnologia revolucionária de geração de imagens de altíssima resolução com riqueza de detalhes de imagem

Introdução geral O UltraPixel é uma tecnologia avançada de geração de imagens de resolução ultra-alta projetada para criar imagens de altíssima qualidade e ricas em detalhes. Ela foi desenvolvida pelo usuário catcathh do GitHub e apresentada no NeurIPS 2024.U...

Recursos mais recentes de IA Geração de imagens on-line # AI # Projeto de código aberto AI Java

10 meses atrás

02.7K

Austen: uma ferramenta de IA para analisar as relações entre personagens de livros e gerar gráficos

Introdução geral O Austen é uma ferramenta de IA de código aberto que usa a estrutura Angular e a inicialização Analogjs, combinada com a tecnologia Mermaidjs para gerar gráficos que ajudam os usuários a analisar as relações entre personagens em livros. Os usuários podem entrar no Open...

Recursos mais recentes de IA # Projeto de código aberto AI Java # Quadro branco de IA com infográfico

4 meses atrás

02.7K

magic-html：从HTML网址中提取主体数据，输出纯文本/markdown

magic-html: extrai dados do corpo do URL HTML, produz texto simples/markdown

Introdução geral magic-html é uma biblioteca Python projetada para simplificar o processo de extração do conteúdo da região do corpo do HTML. Seja lidando com estruturas complexas de HTML ou com páginas da Web simples, essa biblioteca tem como objetivo fornecer uma interface conveniente e eficiente para os usuários. Ela oferece suporte à extração multimodal...

Recursos mais recentes de IA # Projeto de código aberto AI Java

11 meses atrás

02.7K

Carregar mais