Recursos mais recentes de IA

共 2617 篇文章
ConsisID:一张人像参考图,生成人物一致的视频,多终端快速集成

ConsisID: um mapa de referência de retratos para gerar vídeos consistentes com caracteres, integração rápida de vários terminais

Introdução abrangente O ConsisID é um projeto de código-fonte aberto desenvolvido pelo grupo de Yuan Rong na Universidade de Pequim, com o objetivo de obter geração de texto para vídeo consistente com a identidade (IPT2V) por meio de técnicas de decomposição de frequência. O núcleo do projeto é um sistema DiT (Diffusion Transfor...
8 meses atrás
03.5K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: converta ebooks em audiolivros, ferramenta de código aberto com suporte multilíngue e clonagem de voz

Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter livros eletrônicos em vários formatos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão do formato do livro eletrônico usando o Co...
7 meses atrás
03.5K
天工AI:全能AI助手,助力高效工作与生活

Tiangong AI: assistente de IA completo para trabalho e vida eficientes

Introdução abrangente O Tiangong AI é o primeiro assistente de IA completo da China, que integra várias funções, como pesquisa, diálogo, redação, análise de documentos, desenho, produção de PPT e assim por diante. Com tecnologia avançada de IA, ele é capaz de entender a intenção do usuário, pesquisar informações de toda a Internet e generalizar, resumir e integrar para produzir informações de alta qualidade, sem...
5 meses atrás
03.5K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: projeto de código aberto de reparo de imagens danificadas e zoom de alta definição de imagens, memória de vídeo mínima de 16G

Descrição geral O InstantIR é um modelo inovador de restauração de imagem única desenvolvido pela equipe do InstantX, projetado para ressuscitar suas imagens danificadas com detalhes extremamente realistas e de alta qualidade, capaz de realizar a restauração de alta qualidade de imagens danificadas. A ferramenta não apenas restaura os detalhes da imagem...
9 meses atrás
03.5K
ALog:便携AI语音日记应用,支持语音转文字。

ALog: aplicativo portátil de diário de voz com IA e suporte de fala para texto.

Introdução geral O ALog é um aplicativo de diário de voz baseado em IA projetado para ajudar os usuários a registrar suas vidas diárias por voz. Ele foi desenvolvido pela duxins e tem código aberto no GitHub. Os usuários podem gravar entradas de diário por meio de entrada de voz, e o aplicativo converterá automaticamente a voz em texto...
7 meses atrás
03.5K
Le Chat Mistral:MISTRAL打造智能聊天机器人,免费大语言模型

Le Chat Mistral: MISTRAL cria chatbots inteligentes, modelos de linguagem grandes e gratuitos

Introdução geral LE CHAT MISTRAL é uma plataforma de assistente de diálogo multilíngue da empresa francesa Mistral AI. Essa plataforma permite que os usuários experimentem e interajam com os diferentes modelos da Mistral AI de uma forma educativa e divertida. Os usuários podem seguir os...
9 meses atrás
03.5K
PixPin:长截图和动态截图,内置本地文字识别(OCR)

PixPin: capturas de tela longas e dinâmicas, reconhecimento de texto nativo (OCR) integrado

Introdução geral O PixPin é uma poderosa ferramenta de captura de tela e postagem projetada para aumentar a produtividade dos usuários. Seja para necessidades diárias de escritório ou profissionais, o PixPin oferece funções convenientes de captura de tela, colagem, captura de tela longa, reconhecimento de texto (OCR) e captura de tela dinâmica. Sua interface simples e...
11 meses atrás
03.5K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流

RAGFlow: um mecanismo RAG de código aberto baseado na compreensão profunda de documentos, fornecendo fluxos de trabalho de geração aprimorados por recuperação eficientes

Introdução abrangente O RAGFlow é um mecanismo RAG (Retrieval Augmented Generation) de código aberto baseado na tecnologia de compreensão profunda de documentos. Ele fornece um fluxo de trabalho RAG eficiente para empresas de todos os portes, incorporando um modelo de linguagem em grande escala (LLM) que pode fornecer dados em formatos complexos com base em...
7 meses atrás
03.5K
Invideo AI:AI生成长视频工具|专业视频制作编辑平台

Invideo AI: ferramenta de vídeo nascida e desenvolvida com IA | plataforma profissional de produção e edição de vídeo

Invideo AI Introdução geral O InVideo é uma plataforma de edição de vídeo on-line projetada para simplificar o processo de criação de vídeo. Quer você seja iniciante na produção de vídeos ou um profissional, a InVideo o ajuda a criar vídeos de alta qualidade rapidamente. A plataforma oferece mais de 5.000...
8 meses atrás
03.5K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução abrangente O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração de recuperação aumentada que visa aprimorar a geração de conhecimento externo, incorporando-o diretamente ao espaço de parâmetros de um Modelo de Linguagem Grande (LLM)...
6 meses atrás
03.5K
Memo AI:视频转字幕、转换多语言字幕的本地客户端

Memo AI: cliente nativo para conversão de vídeo em legenda, convertendo legendas multilíngues

Descrição geral O MemoAI é uma poderosa ferramenta de tradução de vídeo projetada para converter arquivos de vídeo e áudio em texto, legendas e notas. Seja um vídeo do YouTube, um podcast ou um arquivo local, o MemoAI pode lidar com isso com facilidade. Ele suporta mais de 90 idiomas, como chinês, inglês, japonês...
8 meses atrás
03.5K
MasterGo(莫高设计):AI一键生成UI原型设计稿,设计稿秒转高可用代码

MasterGo: IA com um clique para gerar um protótipo de design de interface do usuário, design para código altamente utilizável em segundos!

Introdução abrangente O MasterGo (Mogo Design) é uma ferramenta profissional de design de UI/UX orientada para a equipe, criada para melhorar a eficiência do design e a colaboração da equipe. Como uma plataforma de design de produtos de nível empresarial na era da IA, a MasterGo percorre toda a cadeia de design e desenvolvimento de produtos, fornecendo produtos on-line...
8 meses atrás
03.4K
SciSpace:一站式学术研究与论文写作平台,为学生和研究人员提供一体化 AI 工具

SciSpace: uma plataforma completa de pesquisa acadêmica e redação de artigos com ferramentas de IA integradas para estudantes e pesquisadores

Introdução geral O SciSpace (anteriormente Typeset.io) é uma plataforma baseada em IA projetada para pesquisa e redação acadêmica. Ela oferece uma grande variedade de ferramentas e recursos para ajudar pesquisadores e estudantes a encontrar, entender e escrever sobre literatura com mais eficiência. A plataforma integra gerenciamento de literatura, classificação automáti...
9 meses atrás
03.4K
Rask AI:视频多语言翻译与专业语音克隆,视频本地化工具

Rask AI: tradução multilíngue de vídeo com clonagem de fala profissional, ferramenta de localização de vídeo

Introdução geral A Rask AI é uma plataforma inteligente de localização de vídeo projetada para fornecer soluções rápidas de produção de áudio e vídeo para criadores, educadores e empresas globais. A plataforma oferece suporte à tradução automática de vídeo e áudio em mais de 130 idiomas para ajudar os usuários a expandir para mercados globais. Seus recursos especiais incluem vídeo...
12 meses atrás
03.4K
Akash Network:去中心化GPU算力交易平台

Rede Akash: Plataforma de negociação aritmética de GPU descentralizada

Introdução geral A Akash Network é uma plataforma descentralizada de computação em nuvem baseada na tecnologia blockchain, com o objetivo de quebrar o monopólio dos gigantes tradicionais da computação em nuvem e oferecer um mercado mais eficiente, econômico e flexível para o comércio de recursos de computação. Ela faz isso conectando usuários que precisam de recursos de computação com usuários que têm recursos de computação ociosos...
5 meses atrás
03.4K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução

Introdução geral O Infinity é uma estrutura inovadora de geração de imagens de alta resolução desenvolvida pela equipe da FoundationVision. O projeto rompe as limitações dos modelos tradicionais de geração de imagens por meio de uma abordagem inovadora de modelagem autorregressiva visual em nível de bits...
8 meses atrás
03.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat: um assistente de bate-papo com IA localizado compatível com várias plataformas

Introdução geral O NextChat é um serviço revolucionário de bate-papo com IA que permite aos usuários implantar serviços de bate-papo com os melhores modelos de idiomas da categoria, como GPT-3, GPT-4, GPT-4.5 e Gemini Pro. Ele oferece uma interface de usuário elegante, recursos de colaboração, integrações, modelos e...
6 meses atrás
03.4K
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot: ferramenta inteligente de processamento de informações da Web, API gratuita para captura de conteúdo da Web

WebPilot Introdução geral O Webpilot é um "assistente da Web" gratuito e de código aberto que permite que você se comunique livremente com qualquer página da Web ou execute tarefas automatizadas. Não é necessário alternar entre páginas ou copiar e colar, basta selecionar o texto ou digitar comandos e o Webpilot...
12 meses atrás
03.4K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天

SiYuan (SiYuan Notes): software de gerenciamento de conhecimento pessoal que prioriza a privacidade com suporte a bate-papo de perguntas e respostas/escrita de IA

Geral: o SiYuan Notes (SiYuan) é um software de gerenciamento de conhecimento pessoal que prioriza a privacidade, é totalmente de código aberto e oferece suporte à auto-hospedagem. Ele é escrito em TypeScript e Golang, fornece referências refinadas em nível de bloco e Markdown WYSIWYG (WYSIWY...
6 meses atrás
03.4K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: um modelo unificado de geração de imagens com entradas multimodais para gerar imagens consistentes com caracteres

Introdução geral O OmniGen é um modelo "universal" de geração de imagens desenvolvido pela VectorSpaceLab que permite aos usuários criar efeitos visuais diversificados e contextualmente ricos com comandos de texto simples ou entradas multimodais. Ele é particularmente adequado para aplicativos que precisam reconhecer...
9 meses atrás
03.4K
MagicSchool:教育助手|教师辅助工具|学生辅助工具

MagicSchool: Assistente Educacional|Auxiliar do Professor|Auxiliar do Aluno

Introdução geral O MagicSchool é uma plataforma de IA projetada para educadores para ajudá-los a economizar tempo, reduzir o estresse e promover práticas sustentáveis, fornecendo ferramentas de IA personalizadas. A plataforma oferece mais de 60 ferramentas de IA, incluindo uma interface fácil de usar, recursos de treinamento abrangentes...
12 meses atrás
03.4K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人

NGCBot: Bot do WeChat para envio de notícias, diálogo com IA e gerenciamento de bate-papo em grupo

Introdução abrangente O NGCBot é um mecanismo HOOK baseado no desenvolvimento do projeto de código aberto do robô WeChat, criado pelo desenvolvedor ngc660sec (Yunshan/eXM) e hospedado no GitHub. Após dois anos de iteração, a versão atual do V2.3, a função do robô inicial simples ...
5 meses atrás
03.4K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): geração de ativos 3D de alta resolução, vários fluxos de trabalho de geração de material 3D

Introdução abrangente O Tencent Hunyuan3D (Hunyuan3D 2.0) é um sistema avançado de composição 3D em grande escala da Tencent, projetado para gerar ativos 3D texturizados de alta resolução. O sistema consiste em dois componentes principais: Hunyuan3D-DiT, um modelo de geração de formas em grande escala, e Hunyuan3D-DiT, uma textura em grande escala...
7 meses atrás
03.4K
Deepnote:人工智能驱动的专业数据分析与科学团队协作平台

Deepnote: plataforma com tecnologia de IA para análise de dados profissionais e colaboração de equipes científicas

Descrição geral O Deepnote é uma plataforma de notebook colaborativo projetada para equipes de análise de dados e ciência de dados. Ele combina Python, SQL e análise sem código com a capacidade de se conectar a mais de 50 fontes de dados. O Deepnote aproveita o GPT-4 para fornecer uma análise genera...
8 meses atrás
03.4K
DomoAI:智能视频艺术风格转换|图像转视频|文本转视频

DomoAI: Conversão inteligente de estilo de arte de vídeo|Imagem para vídeo|Texto para vídeo

Descrição geral A DomoAI lançou recentemente o recurso Video to Video que converte vídeos existentes em um estilo de arte completamente diferente com resultados surpreendentes. Ele permite que os usuários criem facilmente estilos exclusivos de arte visual. Outros recursos incluídos na plataforma podem converter imagens estáticas em vídeo em movimento, texto em imagem...
11 meses atrás
03.4K
通义万相:AI创意作画|文生图|图生图|虚拟模特|个人写真|涂鸦作画

Tongyiwanxiang: Pintura criativa com IA|Texto para imagem|Para imagem|Modelo virtual|Retrato pessoal|Pintura com rabiscos

Introdução abrangente Tongyi Wanxiang é uma plataforma de pintura criativa de IA da Aliyun, que oferece várias funções de criação de arte de IA. Os usuários podem criar de várias maneiras, como texto para gerar imagens, imagem para gerar imagens, pintura de grafite, modelos virtuais e retratos pessoais. A plataforma se baseia na combinação de geração de imagens do Composer desenvolvida pela própria...
11 meses atrás
03.4K
混元文生视频:生成写实镜头感的高质量视频,腾讯开源视频生成大模型

Vídeo híbrido de Vincennes: geração de imagens realistas de vídeo de alta qualidade, geração de vídeo de código aberto da Tencent de modelos grandes

Introdução abrangente O Tencent Mixed Yuan Text Generation Video (disponível no Yuanbao APP) é uma plataforma de geração de vídeo baseada na tecnologia de IA lançada pela Tencent. A plataforma utiliza o Tencent Mixed Yuan Big Model com um poderoso conhecimento de vários domínios e compreensão de linguagem natural para gerar vídeos de alta qualidade com base nas descrições de texto dos usuários...
7 meses atrás
03.4K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução abrangente O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala.
7 meses atrás
03.4K
Undetectable AI:绕过AI检测的文本人性化工具,免费AI查重检测器

IA indetectável: ferramenta de humanização de texto para contornar a detecção de IA, detector de verificação de IA gratuito

Descrição geral O Undetectable AI é uma ferramenta projetada para contornar detectores de conteúdo de IA. Ela usa algoritmos avançados e técnicas de reescrita para garantir que o texto de saída seja comparável à escrita humana e bom o suficiente para ser usado. Para escritores, blogueiros e pesquisadores que precisam produzir conteúdo indetectável de IA...
6 meses atrás
03.4K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

Genspark: pesquisa profunda e redação de relatórios de pesquisa com base nas inteligências Genspark

Introdução geral O Genspark é uma ferramenta de pesquisa baseada em inteligência artificial. Foi fundada em 2023 por um ex-executivo do Baidu e está sediada em Palo Alto, Califórnia. Ele difere dos mecanismos de pesquisa tradicionais porque o Genspark usa várias inteligências de IA para gerar pesquisas personalizadas em tempo real...
2 meses atrás
03.4K
Sourcery:AI代码审查自动改进代码质量,技术债务管理

Sourcery: a revisão de código com IA melhora automaticamente a qualidade do código e o gerenciamento da dívida técnica

Introdução geral O Sourcery é uma ferramenta de revisão de código baseada em IA projetada para ajudar os desenvolvedores a melhorar automaticamente a qualidade do código e aumentar a produtividade do desenvolvimento. Ela é integrada aos repositórios do GitHub e do GitLab e é capaz de revisar instantaneamente cada solicitação pull, fornecendo um substituto humano...
8 meses atrás
03.4K
llama.cpp:高效推理工具,支持多种硬件,轻松实现LLM推理

llama.cpp: ferramenta de inferência eficiente, compatível com vários hardwares, fácil de implementar a inferência LLM

Introdução geral llama.cpp é uma biblioteca implementada em C/C++ puro, projetada para simplificar o processo de inferência de modelos de linguagem grande (LLMs). Ela é compatível com uma ampla gama de plataformas de hardware, incluindo Apple Silicon, GPUs NVIDIA e GPUs AMD, e fornece uma variedade de...
6 meses atrás
03.4K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: uma plataforma de código aberto, sem código, que rastreia automaticamente os dados da Web e os converte em APIs ou planilhas

Introdução abrangente O Maxun é uma plataforma de extração de dados da Web de código aberto e sem código que permite aos usuários treinar robôs em minutos para rastrear automaticamente dados da Web e convertê-los em APIs ou planilhas. A plataforma oferece suporte a paginação e rolagem, adapta-se a alterações no layout do site, fornece rastreamento avançado de dados...
7 meses atrás
03.4K
星流:Star-3 Alpha图像生成模型,LiblibAI发布的新一代AI图像创作平台

Starflow: Modelo de geração de imagens Star-3 Alpha, a plataforma de criação de imagens de IA de última geração lançada pela LiblibAI

Introdução abrangente O Xingliu (Xingliu) é uma nova geração de ferramentas de criação de imagens de IA desenvolvida pela equipe da LiblibAI, que se baseia no modelo de geração de imagens Star-3 Alpha desenvolvido pela própria empresa e é capaz de fornecer serviços de geração de imagens diversificados e de alta precisão. Ele foi projetado para designers, fotógrafos...
8 meses atrás
03.4K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)

VSR: software de remoção de marca d'água de vídeo sem perdas e legendas rígidas com tecnologia de IA (cliente de remoção de marca d'água de vídeo 7G+)

Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas difíceis e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, L...
7 meses atrás
03.4K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

O GLM-PC (Smart Spectrum Bull) foi oficialmente lançado para download interno, a IA que pode realmente controlar o computador

GLM-PC (Bull) Introdução O GLM-PC é um aplicativo de desktop baseado no modelo CogAgent, capaz de executar tarefas complexas rapidamente por meio de comandos de linguagem natural. Ele tem a capacidade de planejar tarefas e entender a interface, e pode concluir de forma autônoma várias operações do computador de acordo com as instruções do usuário. Atenção ao uso...
8 meses atrás
03.4K
Uberduck:AI生成说唱音乐与声音克隆平台|文本转语音

Uberduck: música rap gerada por IA e plataforma de clonagem de voz | Text to Speech

Introdução geral O Uberduck AI é uma plataforma inovadora que fornece síntese de IA de vozes cantadas e faladas para agências criativas, produtores musicais e programadores. Os usuários podem escolher diferentes ritmos musicais, gerar letras usando IA ou escrever suas próprias letras, selecionar sons específicos e, por fim, criar músicas de rap...
11 meses atrás
03.4K
BuildIn.AI:适合 Notion 用户的知识管理工具

BuildIn.AI: uma ferramenta de gerenciamento de conhecimento para usuários do Notion

Introdução geral O BuildIn.AI é uma plataforma baseada em nuvem focada em colaboração em tempo real e gerenciamento de conhecimento, projetada para ajudar os usuários a criar, gerenciar e compartilhar informações com eficiência. Ela é adequada para indivíduos, equipes ou profissionais, fornecendo um local de trabalho digital que combina armazenamento de documentos, edição em tempo real e organização de informações...
5 meses atrás
03.4K
RenderNet:锁定面部特征,创建人物一致性的图像、视频运镜到口播视频

RenderNet: direcionamento de recursos faciais para criar imagens consistentes com o personagem, drible de vídeo para vídeo de palavras faladas

Introdução geral O RenderNet é uma ferramenta de geração que se concentra na criação de imagens e vídeos que mantêm a consistência dos caracteres com base na tecnologia de inteligência artificial. Os usuários podem gerar imagens e vídeos orientados por caracteres com instruções de texto simples. A ferramenta oferece suporte a uma ampla gama de opções de geração de imagens e vídeos que os usuários podem usar conforme necessário...
9 meses atrás
03.4K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de perguntas e respostas com base de conhecimento de IA pronto para uso para atendimento inteligente ao cliente e base de conhecimento interna

Introdução abrangente O MaxKB (Max Knowledge Base) é um sistema de Q&A de base de conhecimento de código aberto baseado em grandes modelos de linguagem e RAG (Retrieval Augmented Generation). O sistema é amplamente utilizado no atendimento inteligente ao cliente, na base de conhecimento interna da empresa, na pesquisa e educação acadêmica e em outros cenários.
7 meses atrás
03.4K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): mágica de controle de iluminação de imagem, controla a luz, a sombra e o plano de fundo da imagem

Introdução abrangente O IC-Light é um projeto de controle de iluminação de imagens que visa a manipular os efeitos de iluminação das imagens por meio de modelos avançados de IA. Desenvolvido por Lvmin Zhang et al, o projeto oferece dois modelos principais: um modelo de reiluminação condicional ao texto e um modelo condicional ao plano de fundo. Os usuários podem passar...
8 meses atrás
03.4K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts

Open Canvas: tela colaborativa de edição de código, versão de código aberto do OpenAI Canvas/Claude Artifacts

Introdução geral A LangChain apresenta o Open Canvas, um aplicativo da Web de código aberto projetado para aprimorar a experiência de edição e colaboração de documentos com funcionalidade de memória de agente duplo integrada e smith integrado para observar todos os detalhes da execução. A plataforma é alimentada pelo OpenA...
5 meses atrás
03.4K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA que controla páginas da Web, executa asserções e extrai dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando a medição da IU...
7 meses atrás
03.4K
GitIngest:快速将Github代码仓库转为适合LLM理解的文本

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub para se adequar ao LLM ...
8 meses atrás
03.4K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: plataforma completa de processamento de áudio/vídeo|geração de vídeo|legenda de IA|extração de áudio|fala para texto

Introdução abrangente O Record Cafe é uma plataforma completa de processamento de áudio/vídeo que oferece serviços de diálogo em vídeo com IA, legendas com IA e fala com IA para texto. As funções incluem gravação de tela, edição de vídeo, conversão de GIF/áudio, etc., e suporta armazenamento e compartilhamento em nuvem. A interface é intuitiva e fácil de usar, além de oferecer suporte à gravação em várias telas e ao uso inteligente em vários idiomas...
8 meses atrás
03.4K
PopAI:文档生成AI助手|PPT|流程图|文章|文档对话|解释图片

PopAI: Assistente de IA para geração de documentos|PPT|Flowchart|Artigo|Diálogo de documentos|Explicação de imagens

Introdução abrangente O PopAI se dedica a melhorar a aplicação de cenários educacionais e a proporcionar experiências de aprendizado personalizadas por meio de tecnologias inovadoras de IA; é uma plataforma de espaço de trabalho inteligente que integra uma variedade de ferramentas de IA para aprimorar sua interação com documentos, geração de imagens e criação de PPTs. O PopAI pode ser desenvolvido por uma das empresas mais importantes do país...
12 meses atrás
03.4K
GPT4All:支持CPU运行的大型语言模型客户端,重视本地化与数据安全

GPT4All: um cliente de modelo de idioma grande executado em CPUs com foco em localização e segurança de dados

GPT4All Introdução geral O GPT-4All é um projeto de código aberto desenvolvido pela Nomic para permitir que os usuários executem modelos de idiomas grandes (LLMs) em dispositivos locais. O projeto enfatiza a proteção da privacidade e pode ser usado sem conexão com a Internet, sendo adequado tanto para usuários pessoais quanto para usuários corporativos...
4 meses atrás
03.4K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução geral O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). O projeto foi desenvolvido pela Lumina...
8 meses atrás
03.4K
MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式

MarkItDown: Ferramenta de conversão inteligente de documentos da Microsoft, converte vários arquivos para o formato Markdown

Introdução geral O MarkItDown é uma ferramenta Python desenvolvida pela Microsoft e projetada para converter vários arquivos e documentos de escritório no formato Markdown. A ferramenta é compatível com uma ampla variedade de tipos de arquivos, incluindo PDF, PowerPoint, Word, Excel, diagramas...
8 meses atrás
03.4K
Segmind:生成式AI编排工作流与无服务器API,提供众多主流模型API

Segmind: fluxo de trabalho de orquestração de IA generativa com APIs sem servidor, oferecendo muitas APIs de modelos convencionais

Introdução abrangente A Segmind é uma plataforma on-line focada em IA generativa, fornecendo uma variedade de APIs sem servidor e ferramentas de fluxo de trabalho para ajudar os usuários a criar e implantar facilmente fluxos de trabalho multimodais. A plataforma oferece suporte a uma ampla variedade de modelos de IA generativa, incluindo Stable Diffusion X...
11 meses atrás
03.4K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes em tempo real da OpenAI: um aplicativo de interação de fala corporal multiinteligente (exemplo da OpenAI)

Introdução geral O OpenAI Realtime Agents é um projeto de código aberto que tem como objetivo mostrar como a API em tempo real do OpenAI pode ser usada para criar aplicativos de fala corporal multiinteligentes. Ele fornece um modelo de corpo inteligente de alto nível (emprestado do OpenAI Swarm) que permite...
7 meses atrás
03.4K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: mecanismo de física generativo de código aberto para simulação de mundo dinâmico 4D baseado em física real

Introdução geral O Genesis é um mundo de física generativa projetado para robótica de uso geral e aprendizado de IA incorporado. Ele fornece uma plataforma de simulação unificada que suporta a simulação de uma ampla gama de materiais e fenômenos físicos. O Genesis tem como objetivo desbloquear a IA generativa e a simulação física combinando...
8 meses atrás
03.4K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台

BISHENG: plataforma de DevOps de LLM de código aberto para criar aplicativos de IA corporativos

Introdução abrangente O BISHENG é uma plataforma DevOps de LLM (Large Language Model) de código aberto projetada para aplicativos de IA corporativos de próxima geração. A plataforma oferece recursos avançados e abrangentes, incluindo fluxos de trabalho de IA generativa, RAG (Retrieval Augmented Generation), agentes inteligentes, gerenciamento unificado de modelos...
8 meses atrás
03.3K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)

Diffusers Image Outpaint: ferramenta superpotente de código aberto de extensão de imagem AI, pintura de imagem (pintura de imagem)

Introdução geral Diffusers Image Outpaint é uma poderosa ferramenta de expansão de imagens de IA criada pelo membro da comunidade Hugging Face, fffiloni. A ferramenta utiliza técnicas avançadas de modelagem de difusão para trazer imagens para...
11 meses atrás
03.3K
腾讯智影:智能视频创作工具|AI数字人、动漫生成套件

Tencent Smart Shadow: Ferramenta de criação de vídeo inteligente | AI Digital Man, Kit de geração de anime

Introdução abrangente O Tencent Smart Shadow é uma plataforma de criação de vídeo inteligente on-line lançada pela Tencent, que pode oferecer suporte à dublagem de texto, transmissão digital humana, reconhecimento automático de legendas e outras funções por meio de poderosas ferramentas de IA fornecidas por serviços em nuvem.
1 ano atrás
03.3K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon: aplicativo iOS para bate-papo com modelos nativos de idiomas grandes

Descrição geral O Fullmoon é um aplicativo desenvolvido para dispositivos iOS e tem como objetivo oferecer a possibilidade de conversar de forma privada com modelos nativos de idiomas grandes. O aplicativo foi otimizado para o Apple Silicon e é compatível com iPhone, iPad e Mac. Os usuários do bate-papo...
6 meses atrás
03.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: adicionando iluminação a imagens com ferramentas de pintura inteligentes

Introdução geral O LuminaBrush é uma ferramenta inovadora e interativa de edição de imagens para efeitos de iluminação, com tecnologia de inteligência artificial. O projeto usa uma estrutura de dois estágios para processar imagens: o primeiro estágio transforma a imagem de entrada em uma aparência "uniformemente iluminada", enquanto o segundo estágio gera...
7 meses atrás
03.3K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。

Qwen-Agent: uma estrutura baseada em Qwen para aplicativos de agentes inteligentes, incluindo chamadas de ferramentas, interpretadores de código, RAGs e extensões do Chrome.

Introdução abrangente O Qwen-Agent é uma estrutura de aplicativo de agente inteligente desenvolvida com base no Qwen 2.0 e superior, com recursos como acompanhamento de comandos, uso de ferramentas, planejamento e memória. A estrutura fornece uma variedade de aplicativos de amostra, como assistentes de navegador, intérpretes de código e assistentes personalizados...
8 meses atrás
03.3K
Same:克隆网站UI生成生产级前端代码

O mesmo: clonar a interface do usuário do site para gerar código de front-end de nível de produção

Introdução geral O Same é uma ferramenta on-line simples e útil, projetada para fornecer aos designers e desenvolvedores a capacidade de replicar rapidamente interfaces da Web. Ao inserir um URL, ele gera uma réplica pixel a pixel da página da Web de destino, poupando aos usuários o tempo de redesenhá-la manualmente. O núcleo do site é a "cópia...
5 meses atrás
03.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

Deep Live Cam: ferramenta de troca de rosto de IA em tempo real de código aberto, uma foto para troca de rosto em tempo real

Introdução geral O Deep Live Cam é uma ferramenta de inteligência artificial de código aberto projetada para permitir a substituição de rostos em tempo real e a geração de vídeos falsos profundos a partir de uma única foto. Usando algoritmos avançados de aprendizagem profunda, a ferramenta é capaz de substituir rostos em tempo real durante a transmissão ao vivo ou chamadas de vídeo, protegendo a privacidade do usuário e adicionando diversão...
9 meses atrás
03.3K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI: Gere vídeos digitais de fala humana com apenas uma foto, várias ferramentas gratuitas de geração de vídeo

Descrição geral O Vidnoz é uma plataforma gratuita de geração de vídeos com IA para criar rapidamente vídeos com IA em menos de 1 minuto. Não é necessário nenhum custo, download ou experiência. A plataforma oferece mais de 500 avatares de IA, mais de 470 locuções realistas de IA e mais de 500 modelos. Com o vídeo de IA do Vidnoz...
12 meses atrás
03.3K
Decagon:企业级客户服务智能体解决方案

Decagon: Solução corporativa de inteligência de atendimento ao cliente empresarial

Introdução geral A Decagon é uma empresa focada em fornecer soluções de suporte ao cliente com IA generativa de nível empresarial. Seu principal produto são as inteligências inteligentes de atendimento ao cliente, capazes de lidar com problemas complexos, integrar-se perfeitamente aos sistemas existentes e aprender continuamente com os dados.
7 meses atrás
03.3K
Lenso.ai:智能反向图像搜索平台,面部识别搜图

Lenso.ai: plataforma inteligente de pesquisa reversa de imagens, reconhecimento facial para pesquisa de imagens

Introdução geral O Lenso.ai é uma plataforma inovadora de inteligência artificial projetada para pesquisa reversa de imagens. Os usuários podem explorar bilhões de imagens da Web fazendo o upload de uma imagem ou selecionando uma imagem de amostra. A plataforma utiliza tecnologia avançada de IA para fornecer resultados de pesquisa altamente precisos, incluindo locais...
10 meses atrás
03.3K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: ferramenta de quadro branco virtual com estilo de desenho à mão | fluxograma de geração de texto orientado por IA | tutoriais do Excalidraw

Excalidraw Descrição geral O Excalidraw é uma ferramenta de desenho de quadro branco virtual de código aberto que permite desenhar facilmente diagramas com estilo de desenho à mão. Você pode usar o Excalidraw para criar belas ilustrações desenhadas à mão, diagramas de estrutura de arame ou qualquer um de seus...
9 meses atrás
03.3K
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

One Shot LoRA: a plataforma completa para geração rápida de modelos de LoRA em vídeo

Introdução geral O One Shot LoRA é uma plataforma voltada para a geração de modelos de LoRA de vídeo de alta qualidade a partir de vídeos. Os usuários podem treinar modelos de LoRA de boutique de forma rápida e fácil a partir de vídeos sem fazer login ou armazenar dados privados. A plataforma é compatível com Hunyua...
6 meses atrás
03.3K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑

ZoSugar: ferramentas de processamento de fotos on-line, keying com um clique, remoção de marca d'água, restauração de fotos, edição de retratos

Introdução abrangente O ZuoSugar (PicWish) é uma plataforma inteligente de processamento de imagens com IA, que oferece uma grande variedade de ferramentas de edição de fotos on-line, suportando o uso de todas as plataformas. Os usuários podem realizar facilmente a codificação com um clique, a remoção de marcas d'água, a clarificação de fotos desfocadas, o zoom sem perdas, o corte de imagens, a compactação de imagens e a foto em preto e branco...
8 meses atrás
03.3K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: um assistente de IA para gerenciamento de conhecimento empresarial e pesquisa de documentos, integrando várias ferramentas de trabalho

Introdução geral O Danswer é um assistente de IA de recuperação de documentos corporativos de código aberto projetado para se conectar a documentos, aplicativos e pessoas da equipe para fornecer pesquisa unificada e respostas a consultas em linguagem natural por meio de uma interface de bate-papo inteligente e recursos de pesquisa unificada. Garantindo que os dados do usuário e os bate-papos sejam totalmente controlados...
5 meses atrás
03.3K
Artbreeder:超强图像控制与图像风格混合工具,适合教学使用

Artbreeder: Excelente ferramenta de controle de imagem e combinação de estilos de imagem para ensino!

Artbreeder Introdução O Artbreeder é um site de criação de arte colaborativa baseado em Inteligência Artificial (IA). Ele usa os modelos StyleGAN e BigGAN para ajudar os usuários a gerar e modificar imagens de rostos, paisagens, pinturas e muito mais. O controle deslizante "genes" opera...
2 meses atrás
03.3K
瑞达写作:一键生成论文,免费选题生成论文大纲, 论文润色,引用文献数据

Rida Writing: Gere uma redação em um clique, escolha um tópico gratuitamente para gerar um esboço de redação, aperfeiçoe a redação, cite dados da literatura

Introdução abrangente A Rida Writing é uma plataforma de IA que se concentra na redação de trabalhos acadêmicos, com o objetivo de ajudar os usuários a concluir com eficiência suas tarefas de redação de trabalhos. Ao inserir um título de dissertação, os usuários podem gerar conteúdo completo de dissertação com até 50.000 palavras em um clique. A plataforma oferece uma variedade de recursos, incluindo seleção gratuita de tópicos, esboço de ideias...
8 meses atrás
03.3K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: programa de código aberto para remoção em lote de fundos de imagens e vídeos, otimizado para o RMBG 2.0

Introdução geral O RMBG-2-Studio é um aplicativo aprimorado de remoção e substituição de plano de fundo desenvolvido com base no modelo BRIA-RMBG-2.0. O aplicativo foi projetado para oferecer aos usuários recursos eficientes e precisos de processamento de fundo de imagem para vários tipos de imagem, incluindo comércio eletrônico, jogos e...
8 meses atrás
03.3K
VidAU:视频换脸与视频多语言翻译工具

VidAU: ferramenta de tradução multilíngue de vídeo e troca de rosto de vídeo

Introdução geral O VidAU.AI é uma ferramenta de IA completa para geração de vídeo e áudio, que oferece uma ampla variedade de recursos, como porta-voz de vídeo, troca de rosto, tradução em vários idiomas, remoção de legendas e marcas d'água, mixagem e edição de vídeo e muito mais. Ele oferece suporte à criação de vídeos, incluindo esquetes, anúncios, argumentos de vendas, conteúdo de mídia social e treinamento...
11 meses atrás
03.3K
Project IDX:云端集成多开发环境的AI IDE,Google基于网页的免费AI代码编辑器

Projeto IDX: IDE de IA para ambientes de desenvolvimento múltiplo integrados à nuvem, editor de código de IA gratuito baseado na Web do Google

Introdução abrangente O Project IDX é um espaço de trabalho de desenvolvimento de aplicativos multiplataforma e de pilha completa assistido por IA fornecido pelo Google. Ele é baseado no Google Cloud, suporta várias estruturas e linguagens e integra vários produtos e serviços do Google...
4 meses atrás
03.3K
LensGo:创造独特风格的视频变得简单|视频风格转换工具

LensGo: Criação de estilos exclusivos de vídeo de forma simples|Ferramenta de conversão de estilo de vídeo

Introdução geral O LensGo é uma plataforma para criar facilmente vídeos que mudam o estilo usando a tecnologia de IA, fornecendo ferramentas para mudança de estilo, geração de imagens, texto para vídeo, treinamento e modelagem. Os usuários podem alterar estilos de vídeo usando modelos ou imagens, gerar imagens a partir de dicas de texto ou imagem ou usar suas próprias...
12 meses atrás
03.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelagem de linguagem multimodal MNN para Android

Introdução abrangente A MNN (Mobile Neural Network) é uma estrutura de aprendizagem profunda leve e eficiente, desenvolvida pela Alibaba e otimizada para dispositivos móveis. A MNN não só é capaz de fazer inferências rápidas em dispositivos móveis, mas também oferece suporte a tarefas multimodais, incluindo geração de texto...
6 meses atrás
03.3K
Midjourney Proxy:代理/逆向Midjourney Discord频道,实现AI绘图API调用(免费测试)

Midjourney Proxy: proxy/reversão do canal Midjourney Discord para chamadas de API de mapeamento de IA (teste gratuito)

Introdução abrangente O Midjourney Proxy é um projeto de código aberto desenvolvido para fornecer serviços de proxy para o canal Discord do Midjourney para converter funções de desenho de IA em formato de API. O projeto é totalmente gratuito e de código aberto, com suporte para troca de rosto com um clique, combinação de imagens, geração de gráficos ...
8 meses atrás
03.3K
Unscreen:自动移除视频背景,轻松制作无背景视频

Unscreen: remove automaticamente o plano de fundo do vídeo, facilitando a criação de um vídeo sem plano de fundo

O Unscreen é uma ferramenta on-line avançada que se concentra na remoção automática de planos de fundo de vídeos. Os usuários simplesmente carregam um vídeo ou fornecem um link para um vídeo e o Unscreen analisa e remove automaticamente o plano de fundo sem nenhuma complexidade. A ferramenta é compatível com uma grande variedade de formatos de vídeo, inclusive .mp...
8 meses atrás
03.3K