Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 910 artigos

Tags: ai projetos de código aberto Página 43

CogView3:智谱轻言开源的级联扩散文本生成图像模型-首席AI分享圈

CogView3: modelo de imagem de geração de texto de difusão em cascata de código aberto do Wisdom Spectrum

Introdução abrangente O CogView3 é um sistema avançado de geração de imagens de texto desenvolvido pela Universidade de Tsinghua e pela Think Tank Team (Chi Spectrum Qingyan). Ele se baseia no modelo de difusão em cascata e gera imagens de alta resolução por meio de vários estágios. Os principais recursos do CogView3 incluem geração em vários estágios, arquitetura inovadora e desempenho eficiente para a criação artística...

RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用-首席AI分享圈

RocketNotes: aplicativo de anotações Markdown com preenchimento de texto, diálogo de documentos e suporte à pesquisa semântica

Introdução abrangente O RocketNotes é um aplicativo de anotações Markdown baseado na Web que integra preenchimento de texto, bate-papo e pesquisa semântica orientados pelo Large Language Model (LLM). Criado usando o pipeline RAG (Relevant AI Guided) sem servidor 100%, o projeto tem como objetivo simplificar a...

F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音-首席AI分享圈

F5-TTS: clonagem de fala sem amostras para gerar vozes clonadas suaves e emocionalmente ricas

O Synthesis F5-TTS é um novo sistema não-autoregressivo de conversão de texto em fala (TTS) baseado em um transformador de difusão (DiT) compatível com o fluxo. O sistema melhora significativamente a qualidade da síntese usando o modelo ConvNeXt para otimizar a representação do texto e facilitar o alinhamento com a fala...

AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools: ferramenta de fala para legenda, cliente leve com interfaces integradas para Cutscene, Racer e Must-Cut

Introdução abrangente O AsrTools é uma ferramenta inteligente de conversão de voz em texto com interfaces integradas de grandes empresas, como Cutscene, Racer, Must Cut etc. Não requer GPU nem configurações complicadas e oferece suporte ao processamento eficiente de lotes com vários threads. Foi desenvolvido com base no PyQt5, com uma interface bonita e fácil de usar, capaz de gerar arquivos de legendas nos formatos SRT e TXT. A ferramenta funciona ajustando...

Surya:专业多语言文档OCR工具,开源本地部署-首席AI分享圈

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha a linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas. O desempenho do Surya é comparável ao dos serviços em nuvem para uma ampla gama de tipos de documentos, incluindo p...

Implementação da API gratuita do hugging face no cloudflare para oferecer suporte ao encaminhamento de interface

Como a implantação doméstica não pode acessar o hugging face, então, no programa de implantação do big brother, com base na transformação para poder implantar nos trabalhadores do cloudflare. Preparação 1, registre o cloudflare 2, registre o hugging face e solicite a chave api, solicite o endereço da chave api 3, copie o seguinte código para implantar ...

Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。-首席AI分享圈

Inbox Zero: alcance facilmente zero e-mails em sua caixa de entrada, com a ajuda da IA para ajudá-lo a categorizar, filtrar e processar seus e-mails.

Descrição geral O Inbox Zero é um aplicativo de gerenciamento de e-mail de código aberto projetado para ajudar os usuários a obter rapidamente zero e-mails na caixa de entrada com um assistente de IA. O aplicativo oferece uma variedade de recursos, incluindo resposta automática, arquivamento, rotulagem e encaminhamento de e-mails, gerenciamento e cancelamento de assinatura de boletins informativos, bloqueio de e-mails frios, rastreamento de atividade de e-mail e muito mais...

xyks: notas reversas de cálculo oral de macacos pequenos, engenharia reversa e algoritmos de descriptografia

Introdução abrangente O Ape Mouth Calculator Reverse Notes é um projeto de código aberto que visa documentar e compartilhar o processo e os métodos de engenharia reversa do aplicativo Ape Mouth Calculator. O projeto contém uma variedade de ferramentas e técnicas reversas para usar as instruções, como Frida, dexdump etc., para ajudar os usuários a entender e decifrar os algoritmos de criptografia e o número da Ape Mouth Calculator ...

XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目-首席AI分享圈

XiaoYuanKouSuan_Auto: ferramenta automática de perguntas e respostas do XiaoYuanKouSuan, que resolve com eficiência tópicos de aritmética oral

Introdução abrangente A Ape Mouth Calculator Automatic Question Answer Tool é um projeto de código aberto baseado em Python, desenvolvido para resolver com eficiência as perguntas no aplicativo Ape Mouth Calculator por meio de reconhecimento de OCR e scripts de automação. A ferramenta usa tecnologias como OpenCV e Tesseract para identificar as perguntas na tela em tempo real e preencher automaticamente as respostas, o que é ótimo.

Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人-首席AI分享圈

Telegram GPT Worker: um bot de IA do Telegram com vários modelos implantado no Cloudflare Workers

Introdução geral O GPT-Telegram-Worker é um bot de IA do Telegram multimodelo baseado no Cloudflare Workers, com suporte a várias APIs, como OpenAI, Claude, Azure etc. O projeto foi desenvolvido em TypeScript, com um design modular para fácil expansão, fornecendo serviços rápidos e dimensionáveis! ...

Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档-首席AI分享圈

Cloud Document Converter: plug-in de download de documentos do Flying Book, conversão de documentos na nuvem do Flying Book para documentos locais no formato Markdown

Introdução geral O Cloud Document Converter é uma extensão do Chrome projetada para converter documentos em nuvem do Flying Book para o formato Markdown. Os usuários podem facilmente baixar ou copiar documentos em nuvem do Flying Book em arquivos Markdown para edição e compartilhamento secundários. A ferramenta é compatível com vários ...

QuickPiperAudiobook: uma chave para gerar audiolivros com qualidade de som natural, suporte para PDF, epub, docx e outros formatos

Introdução abrangente O QuickPiperAudiobook é um projeto de código aberto criado para converter vários formatos de texto (por exemplo, epub, mobi, txt, PDF, HTML etc.) em audiolivros com som natural com um simples comando. A ferramenta usa o modelo Piper para conversão e gerencia a instalação do Piper e do ph...

Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据-首席AI分享圈

Crawl4AI: ferramenta de rastreamento assíncrono da Web de código aberto para extrair dados estruturados sem LLM

Introdução abrangente O Crawl4AI é uma ferramenta de rastreamento assíncrono da Web de código aberto projetada para modelos de linguagem grande (LLMs) e aplicativos de inteligência artificial (IA). Ele simplifica o processo de rastreamento da Web e de extração de dados, oferece suporte ao rastreamento eficiente da Web e fornece formatos de saída compatíveis com LLMs, como JSON, ...

Cloudflare Serverless Registry: um registro de contêineres sem servidor baseado em Cloudflare Workers

Introdução geral O Cloudflare Serverless Registry é um registro de contêineres sem servidor baseado no Cloudflare Workers e no armazenamento R2. Ele suporta push e pull de imagens e fornece autenticação JWT baseada em nome de usuário, senha e chave pública. O projeto é fácil de implantar e compatível com as operações do Docker...

AIHawk: assistente inteligente de busca de emprego, colocação automatizada de currículos (somente em inglês)

Introdução geral O Auto_Jobs_Applier_AIHawk é uma ferramenta para automatizar a busca de empregos usando tecnologia de inteligência artificial. Ela ajuda os usuários a enviar automaticamente um grande número de currículos em um curto período de tempo e personalizá-los de acordo com suas informações pessoais e intenções de busca de emprego. O objetivo da ferramenta é aumentar a eficiência da busca de emprego e reduzir o envio manual...

simple-one-api: integração com um clique de uma variedade de APIs de modelos grandes e gratuitos, interface OpenAI externa unificada

Introdução abrangente simple-one-api é um projeto de código aberto desenvolvido para simplificar a integração de várias APIs de modelo grande. Ele é compatível com modelos compatíveis com interfaces OpenAI, como Chifan Big Model Platform, Xunfei Starfire Big Model, Tencent Hybrid, MiniMax e Deep-Seek. O projeto requer apenas um arquivo executável, uma configuração...

Voice Changer: Um trocador de voz em tempo real para fazer seus personagens de anime favoritos cantarem!

Introdução geral O Voice Changer é uma ferramenta de transformação de voz em tempo real e de código aberto que oferece suporte a uma ampla variedade de modelos de fala de IA, como MMVC, so-vits-svc, RVC, DDSP-SVC e Beatrice. A ferramenta é compatível com várias plataformas, incluindo Windows, Mac, Linux e Google Colab, e permite que os usuários ...

VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度-首席AI分享圈

VoAPI: sistema de gerenciamento de interface de encaminhamento de modelo de IA de alto valor, o site oficial oferece cota de API gratuita diariamente

Introdução abrangente O VoAPI é um novo sistema de gerenciamento e distribuição de interface de modelo de IA de alto perfil e alto desempenho, usado principalmente para canais de distribuição e gerenciamento interno pessoal ou empresarial. Desenvolvido com base na NewAPI, o sistema oferece módulos funcionais avançados e interface de usuário otimizada, com o objetivo de aprimorar a experiência do usuário e a eficiência operacional...

MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音-首席AI分享圈

MockingBird: clonagem rápida de voz e treinamento de modelos, conversão de texto em fala com base no xtts v2

Introdução abrangente O MockingBird é um projeto de código aberto que visa à clonagem rápida de fala e à conversão de texto em fala por meio da tecnologia de IA. Os usuários só precisam fornecer 5 segundos de amostras de voz para gerar qualquer conteúdo de voz. O projeto é compatível com uma variedade de conjuntos de dados chineses e funciona bem em sistemas Windows e Linux ...

pt_BRPortuguês do Brasil