Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

向量数据库深度对比:Weaviate、Milvus 与 Qdrant

Comparação da profundidade do banco de dados vetorial: Weaviate, Milvus e Qdrant

No campo da inteligência artificial e do aprendizado de máquina, especialmente na criação de aplicativos como os sistemas RAG (Retrieval Augmented Generation) e a pesquisa semântica, o processamento e a recuperação eficientes de grandes quantidades de dados não estruturados tornam-se cruciais. Os bancos de dados vetoriais surgiram como uma tecnologia essencial para enfrentar esse desafio. Eles não servem apenas para armazenar dados de alta dimensão ...
7 meses atrás
015.7K
aiCoder:使用AST(抽象语法树)自动编写JavaScript代码

aiCoder: automatize a criação de código JavaScript usando AST (Árvore de sintaxe abstrata)

Introdução geral O aiCoder é uma ferramenta que utiliza técnicas de inteligência artificial para simplificar o desenvolvimento de bibliotecas JavaScript. Ela ajuda os desenvolvedores a economizar tempo e melhorar a qualidade do código por meio de sugestões inteligentes de código e fusão automatizada de códigos.
7 meses atrás
014.7K
解锁小红书营销密码:海外用户运营增长指南 (附PDF下载)

Unlocking the Little Red Book Marketing Code: A Guide to Growing Overseas User Operations (com download do PDF)

A Xiaohongshu, uma plataforma social de comércio eletrônico muito popular na China e até mesmo na Ásia, foi muito além de um simples aplicativo de compras e se tornou um cata-vento para o estilo de vida dos jovens e uma nova posição para o marketing de marcas. Para marcas e indivíduos estrangeiros que desejam entrar no mercado chinês ou atingir consumidores jovens, dominar o Xiaohongshu...
7 meses atrás
09.9K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: plug-in de assistente da Web para diálogo de modelo de IA nativo e recuperação de documentos

Introdução geral O Page Assist é uma extensão de navegador de código aberto criada para oferecer aos usuários uma maneira fácil de interagir com modelos locais de IA. Com essa extensão, os usuários podem abrir uma barra lateral em qualquer página da Web para interagir com modelos de IA em execução localmente.Page Assi...
5 meses atrás
020.6K
Decagon:企业级客户服务智能体解决方案

Decagon: Solução corporativa de inteligência de atendimento ao cliente empresarial

Introdução geral A Decagon é uma empresa focada em fornecer soluções de suporte ao cliente com IA generativa de nível empresarial. Seu principal produto são as inteligências inteligentes de atendimento ao cliente, capazes de lidar com problemas complexos, integrar-se perfeitamente aos sistemas existentes e aprender continuamente com os dados.
7 meses atrás
017K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: colaboração multiagente para assistente de operação de dispositivos móveis

Introdução geral O MobileAgent é um poderoso assistente de operação de dispositivos móveis projetado para melhorar a eficiência e a automação da operação de dispositivos móveis por meio da colaboração de vários agentes e de módulos de percepção visual aprimorados. Ele foi desenvolvido pela equipe do X-PLUG e é compatível com Android e ...
8 meses atrás
019.5K
OpenAI 推出首个L3级智能体Operator:开启人机交互新时代

OpenAI lança Operator, a primeira inteligência de nível L3: abrindo uma nova era de interação entre humanos e computadores

A área de Uso de Computadores está repleta de startups, competidores obscuros e grandes empresas gigantescas, e agora a OpenAI está arrasando. Você pode acompanhar o Desktop Automation Intelligentsia , coletamos dezenas de produtos relacionados. O campo da inteligência artificial está se tornando cada vez mais competitivo, não apenas com startups recém-chegadas...
8 meses atrás
011.2K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter: ferramenta de edição de imagens no estilo de rabiscos com tecnologia de IA

Introdução geral O FramePainter é uma ferramenta revolucionária de edição de imagens orientada por IA que utiliza tecnologia avançada de difusão de vídeo e controles intuitivos do Sketch para ajudar os usuários a realizar facilmente edições complexas de imagens. Seja um simples ajuste ou uma transformação criativa complexa, o Fr...
8 meses atrás
014.3K
[转]从零拆解一款火爆的浏览器自动化智能体,4步学会设计自主决策Agent

[Transferência] Desmontando uma inteligência de automação de navegador quente do zero, aprenda a projetar agentes autônomos de tomada de decisão em 4 etapas

A maioria das inteligências que desenvolvemos no passado estava em um modo de fluxo de trabalho fixo, e muito poucas delas seguiram a estrutura abaixo para desenvolver inteligências com tomada de decisão autônoma e uso autônomo de ferramentas. Há dois dias, compartilhei o browse, um agente de código aberto que pode automatizar tarefas simples usando um navegador...
8 meses atrás
010.7K
Fey: 金融市场研究工具,提升投资决策的智能助手

Fey: ferramentas de pesquisa do mercado financeiro e assistentes inteligentes para aprimorar as decisões de investimento

Introdução geral O Fey é um assistente inteligente projetado para o investidor moderno, fornecendo dados de mercado em tempo real e consultoria de investimento personalizada. Com uma interface simples e intuitiva, os usuários podem acessar facilmente informações financeiras importantes e tendências de mercado. Os principais recursos do Fey incluem rastreamento de ações, análise financeira, novas...
7 meses atrás
013.3K
Needle:接入私人数据源的AI搜索与工作自动化平台

Needle: uma plataforma de pesquisa de IA e automação de trabalho com acesso a fontes de dados privadas

Introdução geral A Needle é uma plataforma de inteligência artificial projetada para que as empresas aumentem sua produtividade por meio da busca eficiente de informações e de fluxos de trabalho automatizados. A plataforma é capaz de conectar várias fontes de dados em uma organização para fornecer recursos unificados de pesquisa e gerenciamento de dados. Os usuários podem simplesmente...
8 meses atrás
014K
Rapport Cloud:创建和部署AI驱动的数字动画角色

Rapport Cloud: criação e implementação de personagens animados digitalmente com base em IA

Introdução geral O Rapport Cloud é uma plataforma baseada em nuvem voltada para a criação e a implantação de personagens digitais interativos alimentados por inteligência artificial. Desenvolvida pela equipe da Speech Graphics, a plataforma utiliza sua premiada tecnologia de animação facial baseada em áudio, amplamente utilizada em jogos AAA...
8 meses atrás
014.8K
NewsBang:智能新闻与深度洞察APP,提供无偏见的新闻解读

NewsBang: aplicativo de notícias inteligentes e percepções profundas para interpretação imparcial de notícias

Descrição geral A NewsBang é uma plataforma de notícias inovadora que aproveita a tecnologia avançada de IA generativa para fornecer notícias inteligentes e insights profundos aos usuários. Com um simples "deslizar para a esquerda", os usuários podem obter uma compreensão mais profunda das notícias. A newsBang fornece IA interativa ...
8 meses atrás
014K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: um corpo inteligente que opera computadores por meio de voz e texto e fornece feedback de voz em tempo real

Introdução geral O TankWork é uma estrutura de agente de desktop de código aberto projetada para permitir que a IA perceba e controle seu computador por meio de visão computacional e interação no nível do sistema. A estrutura permite que os agentes controlem diretamente os computadores por meio de comandos de voz e texto, processem o conteúdo da tela em tempo real e forneçam...
8 meses atrás
013.9K
AI Auto Free:使用自动化工具无限制使用AI IDE(如Cursor和Windsurf)

AI Auto Free: uso ilimitado de IDEs de IA usando ferramentas de automação (por exemplo, Cursor e Windsurf)

Descrição geral O AI Auto Free é uma poderosa ferramenta de automação projetada para ajudar os usuários a fazer uso ilimitado de ambientes de desenvolvimento integrado (IDEs) orientados por IA, como o Cursor e o Windsurf. O projeto oferece suporte a várias plataformas e inclui vários recursos de linguagem...
8 meses atrás
015.8K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm: uma estrutura para colaboração em clusters de inteligência múltipla

O Quantum Swarm é uma estrutura de inteligência artificial de código aberto voltada para o desenvolvimento e a pesquisa de inteligência populacional de IA. O projeto é mantido pela equipe da Quarm AI no GitHub e tem como objetivo fornecer uma plataforma flexível e eficiente para criar e testar sistemas de inteligência múltipla.
8 meses atrás
014K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG: uma ferramenta de avaliação visual para otimizar os sistemas de geração de aprimoramento de recuperação

Introdução abrangente O XRAG (eXamining the Core) é uma estrutura de benchmarking projetada para avaliar os componentes subjacentes dos sistemas avançados de geração de aumento de recuperação (RAG). Ao traçar o perfil e analisar cada módulo central, o XRAG fornece informações sobre como diferentes configurações e componentes afetam o RAG...
8 meses atrás
014.9K
文颜:一键美化Markdown文章,适配多个自媒体平台格式(开源本地客户端)

Wenyan: embelezar artigos Markdown com um clique, adaptar-se a vários formatos de plataforma de mídia própria (cliente local de código aberto)

Introdução abrangente O WenYan é uma ferramenta projetada para a composição e o embelezamento de artigos Markdown, que oferece suporte à conversão de artigos Markdown editados em um formato adequado para WeChat, Zhihu, manchetes de hoje e outras plataformas. Os usuários podem copiar o artigo com um clique, o artigo diretamente...
8 meses atrás
011.7K
告别本地开发环境!腾讯、微软、谷歌免费在线 AI IDE 助你快速上手开发

Diga adeus aos ambientes de desenvolvimento local! IDEs de IA on-line gratuitos da Tencent, Microsoft e Google para ajudar você a começar!

Histórico Com o rápido desenvolvimento da computação em nuvem e das tecnologias de inteligência artificial (IA), os ambientes de desenvolvimento integrado (IDEs) on-line se tornaram ferramentas importantes para o trabalho de desenvolvimento moderno. Especialmente no atual desenvolvimento cada vez mais popular de IA e nuvem, os IDEs on-line podem não apenas eliminar a tediosa configuração do ambiente local, mas também fornecer...
8 meses atrás
011.8K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Ferramenta de resumo da linha do tempo de notícias para melhorar a eficiência da recuperação de notícias e da geração de linhas do tempo

Introdução geral O CHRONOS é uma ferramenta de resumo da linha do tempo de notícias desenvolvida pela equipe de NLP da Alibaba. A ferramenta gera resumos de linhas do tempo de eventos de notícias por meio de autoquestionamento iterativo. O CHRONOS não só é capaz de lidar com tarefas de resumo de linhas do tempo de domínio aberto, mas também em termos de eficiência e escalabilidade...
8 meses atrás
013.3K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: controla o movimento dos objetos no vídeo, adicionando ou subtraindo qualquer objeto em movimento no vídeo.

Introdução geral O Go-with-the-Flow é um projeto de código aberto desenvolvido pela equipe de pesquisa da Netflix Eyeline Studios para controlar os padrões de movimento dos modelos de difusão de vídeo distorcendo o ruído. O projeto permite que o usuário determine como a câmera da cena e...
8 meses atrás
013.5K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Introdução geral O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance que visa gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais em vídeos de unidades para animar imagens de retratos individuais, gerando efeitos de movimento realistas e sensíveis ao contexto.
8 meses atrás
014.5K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流

Tencent Hybrid 3D (Hunyuan3D): geração de ativos 3D de alta resolução, vários fluxos de trabalho de geração de material 3D

Introdução abrangente O Tencent Hunyuan3D (Hunyuan3D 2.0) é um sistema avançado de composição 3D em grande escala da Tencent, projetado para gerar ativos 3D texturizados de alta resolução. O sistema consiste em dois componentes principais: Hunyuan3D-DiT, um modelo de geração de formas em grande escala, e Hunyuan3D-DiT, uma textura em grande escala...
8 meses atrás
016.8K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI: Criando um sistema inteligente de perguntas e respostas sobre documentos e simplesmente criando uma base de conhecimento privada na Web

Introdução abrangente O RAG Web UI é um sistema de diálogo inteligente baseado na tecnologia RAG (Retrieval Augmented Generation). Ele ajuda empresas e indivíduos a criar sistemas inteligentes de perguntas e respostas com base em sua própria base de conhecimento. Combinando a recuperação de documentos e grandes modelos de linguagem, o RAG Web UI fornece informações precisas e confiáveis...
8 meses atrás
014.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.
8 meses atrás
023.9K
免费使用 Cursor/Windsur 生成各类实用信息图

Gere todos os tipos de infográficos úteis com o Cursor/Windsur gratuitamente!

Era uma vez para compartilhar um monte de exemplos divertidos de palavras de alerta de mapa de cartão, embora divertido, mas o trabalho real descobriu que não há uso de pássaros. A razão é muito simples: esse código de estilo de amostra de modelo de palavra de prompt de diagrama de cartão geralmente é fixo, a intenção real do usuário e o estilo de amostra não correspondem. Algumas pessoas fizeram uma adaptação mais geral da palavra prompt: mapa de cartões...
8 meses atrás
011.5K
使用 Phidata AI 快速构建股票分析智能体智能体

Crie rapidamente inteligência corporal para análise de ações com a IA da Phidata

A sobrecarga de informações na pesquisa de ações é real Um desafio comum ao avaliar o valor de uma ação é: lidar com uma grande quantidade de informações de várias fontes para tomar uma decisão de investimento informada. Os métodos tradicionais incluem: coleta de dados financeiros de diversas plataformas. Ler vários relatórios, notícias e outros artigos. ...
8 meses atrás
09.6K
Narrify:将书籍转化为音频摘要,随时随地聆听精华

Narrify: Transforme livros em resumos de áudio e ouça o melhor dos melhores a qualquer hora, em qualquer lugar!

Introdução geral O Narrify é uma plataforma inovadora projetada para transformar livros em resumos de áudio concisos e envolventes. Com o Narrify, os usuários podem acessar rapidamente o conteúdo principal e os insights dos livros, facilitando a audição dos destaques dos livros, seja no trajeto para o trabalho ou no lazer...
8 meses atrás
014.1K
不幸与DeepSeek-R1同时发布的Kimi k1.5技术报告,提升长上下文和多模态推理能力

Infelizmente, o relatório técnico do Kimi k1.5 lançado junto com o DeepSeek-R1 melhora o contexto longo e a inferência multimodal

Relatório técnico do Kimi k1.5 Leituras rápidas 1. Raciocínio multimodal avançado: O modelo Kimi k1.5 alcança desempenho de raciocínio de última geração em vários benchmarks e modalidades, incluindo tarefas de raciocínio matemático, de código, textual e visual. Ele não apenas lida com texto simples, mas também compreende...
8 meses atrás
016.6K
Repomix:打包代码库为一个文本文件以便大模型检索

Repomix: empacotamento da base de código em um arquivo de texto para recuperação de modelos grandes

Introdução geral O Repomix (anteriormente conhecido como Repopack) é uma ferramenta de código aberto projetada para empacotar toda uma base de código em um único arquivo compatível com IA. Essa ferramenta permite que os desenvolvedores disponibilizem facilmente sua base de código para grandes modelos de linguagem (como Claude, Chat...
8 meses atrás
018.8K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: leitura de arquivos de texto do repositório git e sua rápida divisão em pedaços para modelos grandes

Introdução geral O Yek é uma ferramenta rápida baseada em Rust para ler arquivos de texto de repositórios ou diretórios, dividi-los em pedaços e serializá-los para uso em modelos de linguagem grande (LLMs). Por padrão, a ferramenta usa a regra .gitignore para ignorar arquivos desnecessários e usa...
8 meses atrás
014.4K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果

Kheish: inteligências multifuncionais que revisam, validam e formatam os resultados para produzir resultados de alta qualidade

Introdução abrangente O Kheish é um agente de código aberto de múltiplas funções projetado para tarefas de modelagem de grandes linguagens (LLM) que exigem colaboração estruturada e passo a passo. O Kheish é mais do que um simples coordenador, ele é um agente inteligente por si só, solicitando módulos sob demanda, integrando a reversão do usuário...
8 meses atrás
013.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

AI ContentCraft: uma ferramenta versátil de criação de conteúdo de IA para gerar histórias curtas, roteiros de diálogos, narrações e gráficos

Descrição geral O AI ContentCraft é uma ferramenta versátil de criação de conteúdo que integra geração de texto, síntese de fala, geração de imagens e muito mais. Ela ajuda os criadores a gerar rapidamente histórias, roteiros de podcast e o conteúdo de áudio e vídeo que os acompanha. A ferramenta oferece suporte a conversões de vários idiomas e pode...
8 meses atrás
014.3K
Unigraph:构建本地运行的知识图谱和个人搜索引擎

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um...
8 meses atrás
014.4K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA).
8 meses atrás
015.7K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA que controla páginas da Web, executa asserções e extrai dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando a medição da IU...
8 meses atrás
019.6K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)

ReadKidz: Crie livros ilustrados de histórias infantis consistentes com os personagens, modelos avançados de estilo de livro ilustrado (pago)

Introdução geral A ReadKidz é uma plataforma inovadora que usa tecnologia de inteligência artificial para ajudar os usuários a criar livros de histórias e animações infantis personalizados. Se você é pai, professor ou aspirante a autor de livros infantis, o ReadKidz facilita a geração de conteúdo de histórias de alta qualidade...
8 meses atrás
015.3K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述

Video Analyzer: analisa o conteúdo do vídeo e gera descrições detalhadas

O Comprehensive Introduction Video Analyzer é uma ferramenta abrangente de análise de vídeo que combina visão computacional, transcrição de áudio e técnicas de processamento de linguagem natural para gerar descrições detalhadas do conteúdo do vídeo. A ferramenta transcreve o conteúdo de áudio extraindo quadros-chave do vídeo...
7 meses atrás
019K
实现 LLM 记忆系统的五种方式

Cinco maneiras de implementar o sistema de memória do LLM

Ao criar aplicativos de modelo de linguagem ampla (LLM), os sistemas de memória são uma das principais tecnologias para aprimorar o gerenciamento do contexto do diálogo, o armazenamento de informações de longo prazo e a compreensão semântica. Um sistema de memória eficiente pode ajudar o modelo a manter a consistência em diálogos longos, extrair informações importantes e até mesmo ter a capacidade de recuperar o histórico do diálogo...
8 meses atrás
010K
海螺语音国内上线,可能是最好的中文语音配音产品

Lançamento doméstico do Conch Voice, que pode ser o melhor produto chinês de dublagem de voz

Não há um único produto de dublagem bom feito para a produção de conteúdo na China, ou você só pode usar a API ou o produto é bom, o modelo de som não é bom. Por exemplo, o ElevenLabs estrangeiro, embora o inglês seja bom, mas o chinês é muito ruim, o principal problema com os modelos de código aberto é que a qualidade dos modelos é relativamente ruim...
8 meses atrás
010.7K
豆包端到端实时语音大模型上线!智商情商双在线,中文语音对话断崖式领先

O grande modelo de voz em tempo real de ponta a ponta do Beanbag está on-line! O QI e o QE estão on-line, e o diálogo de voz em chinês está saindo do precipício!

Hoje, o Beanbag APP anunciou que a nova função de chamada de voz em tempo real de ponta a ponta está oficialmente on-line, sem a função de "pré-lançamento", diretamente aberta ao volume máximo, livre para todos usarem, para atender ao teste de cada usuário. Site do grande modelo de voz em tempo real do Beanbag: https://team.doubao.com...
8 meses atrás
011K
为写作话题匹配合适的作家和写作风格

Combinar o escritor e o estilo de redação corretos com o tópico da redação

Histórico O mundo de língua inglesa está repleto de escritores que são bons em escrever para a Web, com estilos muito diferentes e um grande corpus de treinamento, e a IA é muito boa em imitá-los. Com o estilo de redação dessas pessoas, o conteúdo é mais compreensível ou tem uma estrutura lógica, e é mais fácil escrever textos explosivos. Recursos: Ao inserir o tópico de redação, a IA analisa automaticamente os tópicos mais adequados...
6 meses atrás
011.1K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de linguagem grandes

Introdução abrangente O Unsloth é um projeto de código aberto criado para fornecer ferramentas eficientes para o ajuste fino e o treinamento de grandes modelos de linguagem (LLMs). O projeto oferece suporte a vários modelos conhecidos, incluindo Llama, Mistral, Phi e Gemma.
7 meses atrás
016.9K
学习:用自然语言执行工作流“状态变更”(状态机)

Aprendizado: execução de "mudanças de estado" do fluxo de trabalho em linguagem natural (máquinas de estado)

Histórico No projeto de diálogos relacionados ao atendimento ao cliente, muitas vezes é necessário permitir que o usuário confirme a conclusão da ação atual antes de executar a próxima ação, e há duas maneiras de fazer isso: 1. roteamento 2. prompts 1. roteamento Geralmente, um modelo grande determina o estado do usuário e, em seguida, executa o serviço de nó correspondente, o que é o mesmo que orquestrar o "sistema inteligente"...
8 meses atrás
012.4K
JENOVA:整合多模型与搜索的AI对话助手,根据问题动态选择模型

JENOVA: Assistente de diálogo de IA que integra vários modelos e pesquisas, selecionando dinamicamente modelos com base em problemas

Introdução abrangente A JENOVA é uma plataforma líder global de IA projetada para fornecer aos usuários serviços avançados de integração de IA. Ao integrar modelos de IA de última geração (por exemplo, GPT-4o, Claude 3.5, Gemini 2), a JENOVA é capaz de atender às necessidades dos usuários...
8 meses atrás
015.5K
Traycer:开发者专用的AI编程助手,具有任务规划与实时代码审查功能

Traycer: assistente de programação de IA específico para desenvolvedores com planejamento de tarefas e revisão de código em tempo real

Introdução geral O Traycer é um assistente de programação com IA para desenvolvedores, projetado para melhorar significativamente a eficiência e a qualidade do desenvolvimento de software, analisando códigos sensíveis ao contexto e revisando-os em tempo real. Ele está integrado ao Visual Studio Code e é capaz de planejar automaticamente as tarefas...
8 meses atrás
015.8K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB: sistema de perguntas e respostas com base de conhecimento de IA pronto para uso para atendimento inteligente ao cliente e base de conhecimento interna

Introdução abrangente O MaxKB (Max Knowledge Base) é um sistema de Q&A de base de conhecimento de código aberto baseado em grandes modelos de linguagem e RAG (Retrieval Augmented Generation). O sistema é amplamente utilizado no atendimento inteligente ao cliente, na base de conhecimento interna da empresa, na pesquisa e educação acadêmica e em outros cenários.
8 meses atrás
021.7K
UnDatas.IO:精准解析各类非结构化数据的API服务(付费)

UnDatas.IO: serviço de API para análise precisa de vários tipos de dados não estruturados (pago)

Introdução abrangente O UnDatas.IO é uma plataforma voltada para a análise e o processamento de dados não estruturados. Ela utiliza tecnologia avançada para reconhecer automaticamente os layouts de documentos e classificar tabelas, imagens, fórmulas e textos, simplificando bastante o processo de processamento de dados. A plataforma não apenas economiza muito tempo na classificação de dados...
8 meses atrás
012.7K
OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树

OmniThink: uma estrutura de redação para gerar ensaios longos de alta qualidade, buscando conhecimento externo e, em seguida, refletindo sobre ele e criando uma árvore de conhecimento passo a passo

Introdução abrangente O OmniThink é uma estrutura inovadora de escrita automática projetada para gerar ensaios longos de alta qualidade, imitando a expansão iterativa e a reflexão dos processos cognitivos humanos. A estrutura se concentra em ampliar os limites do conhecimento e gerar informações ricas e profundas, o que o OmniThink faz construindo...
8 meses atrás
013.7K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes em tempo real da OpenAI: um aplicativo de interação de fala corporal multiinteligente (exemplo da OpenAI)

Introdução geral O OpenAI Realtime Agents é um projeto de código aberto que tem como objetivo mostrar como a API em tempo real do OpenAI pode ser usada para criar aplicativos de fala corporal multiinteligentes. Ele fornece um modelo de corpo inteligente de alto nível (emprestado do OpenAI Swarm) que permite...
7 meses atrás
012K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: renderização de luz natural de imagens de retrato (não publicado)

Descrição geral O SynthLight é uma ferramenta de reiluminação de retratos baseada em um modelo de difusão. Ela aprende a renderizar novamente imagens sintéticas de rostos para obter ajustes de efeitos de iluminação em fotos de retratos reais. A ferramenta usa um mecanismo de renderização física para gerar conjuntos de dados que simulam transformações de iluminação sob diferentes condições de iluminação...
8 meses atrás
014.6K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择

Kokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozes

Introdução abrangente O Kokoro-ONNX é uma ferramenta de conversão de texto em fala (TTS) de código aberto baseada no tempo de execução do ONNX. Desenvolvido pelo thewh1teagle, o projeto tem como objetivo fornecer soluções eficientes e rápidas de síntese de fala.
8 meses atrás
023.6K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR

Zerox: PDF, DOCX, conversão de imagem para Markdown, OCR de alta precisão de modelo visual

Introdução geral O Zerox é um projeto de código aberto desenvolvido para converter PDF, DOCX, imagens e outros documentos para o formato Markdown por meio de modelos visuais. O projeto foi desenvolvido pela equipe getomni-ai e oferece uma solução simples e eficiente de OCR (reconhecimento óptico de caracteres).
8 meses atrás
018.5K
AIVLOG:自动剪辑视频精彩片段,轻松制作专业Vlog

AIVLOG: edite automaticamente os destaques de vídeo e crie facilmente vlogs profissionais

Introdução abrangente O AIVLOG é uma ferramenta de edição de vídeo com IA projetada para criadores de Vlogs. Ele pode analisar automaticamente o conteúdo do vídeo e editar de forma inteligente os destaques, economizando o tempo de edição dos usuários. Seja um vídeo da vida cotidiana, registros de viagens ou conversas, o AIVLOG pode facilmente...
8 meses atrás
014.3K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: uma ferramenta minimalista de bate-papo com IA baseada em endpoint com integração nativa ao back-end do Ollama

Descrição geral O Charla é um aplicativo de bate-papo baseado em endpoint projetado para dialogar com modelos de idioma nativo. O aplicativo se integra ao back-end do Ollama, oferece suporte ao diálogo com reconhecimento de contexto e salva as sessões de bate-papo como arquivos Markdown. Os usuários podem simplesmente...
8 meses atrás
014.3K
Windsurf Wave 2 重大更新:引入网页搜索和自动化记忆功能,并提供企业级混合部署版本

Atualização principal do Windsurf Wave 2: apresenta a pesquisa na Web e a memória automatizada com a versão de implantação híbrida empresarial

A Codeium lançou recentemente a atualização Windsurf Wave 2, trazendo várias atualizações de recursos importantes para os desenvolvedores, incluindo pesquisa na Web, memórias automatizadas e otimização da execução de código. Como uma ferramenta de codificação de IA Top 2, essas atualizações foram projetadas para fornecer 20...
8 meses atrás
010K
谷歌发布 Vertex AI RAG 引擎:一站式构建可靠的检索增强生成应用

O Google lança o mecanismo Vertex AI RAG: um balcão único para a criação de aplicativos generativos confiáveis e aprimorados por pesquisa

A IA generativa e a Modelagem de Linguagem Ampla (LLM) estão transformando os setores, mas dois desafios principais podem impedir a adoção empresarial: desilusão (geração de informações incorretas ou sem sentido) e conhecimento limitado além dos dados de treinamento. A geração aumentada por recuperação (RAG) e a fundamentação ...
8 meses atrás
010.6K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa a permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) para abordar ...
8 meses atrás
014.7K
Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual

Introdução abrangente O Omni-RGPT é um modelo multimodal de linguagem grande projetado para permitir a compreensão de imagens e vídeos em nível de região. Com a introdução da técnica Token Mark, o Omni-RGPT é capaz de destacar a região-alvo no espaço de recursos visuais e indicar a região-alvo por meio de dicas de região (por exemplo, caixas ou...
8 meses atrás
013.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

Introdução abrangente O Bailing (Bailing) é um assistente de diálogo de voz de código aberto projetado para estabelecer um diálogo natural com os usuários por meio da fala. O projeto combina as tecnologias de reconhecimento de fala (ASR), detecção de atividade de voz (VAD), modelagem de linguagem ampla (LLM) e síntese de fala (TTS) para...
8 meses atrás
015.6K
元界AI:开源版AI数字人克隆与短视频生成工具

Metaverse AI: versão de código aberto da ferramenta de geração de vídeos curtos e clonagem digital de humanos por IA

Introdução abrangente O Metaverse AI (versão de código aberto) é um projeto hospedado no GitHub, desenvolvido pela equipe da libn-net. Ele pode clonar imagens e vozes humanas digitais por meio da tecnologia de IA para gerar vídeos curtos e também suporta dublagem e legendagem. Essa ferramenta oferece o Windo...
6 meses atrás
013.8K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia

Introdução geral O WikiChat é um chatbot experimental desenvolvido na Universidade de Stanford com o objetivo de aprimorar a factualidade de modelos de linguagem grandes recuperando dados da Wikipédia. Os grandes modelos de linguagem (como o ChatGPT e o GPT-4) tendem a processar informações atualizadas ou tópicos menos populares quando...
8 meses atrás
013.6K
阿里巴巴AI研究院发布CosyVoice 2:改进的流式语音合成模型

O Alibaba AI Research Institute lança o CosyVoice 2: um modelo aprimorado de síntese de fala em streaming

1.VISÃO GERAL Nos últimos anos, a tecnologia de síntese de fala teve um progresso significativo, especialmente na geração de fala natural e suave em tempo real. No entanto, em aplicativos reais, problemas como latência, precisão da pronúncia e consistência do locutor ainda atormentam o setor, especialmente em aplicativos de streaming que exigem...
8 meses atrás
010K