Projeto de código aberto de IA

Total de 1020 artigos
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP: um modelo de geração de vídeo híbrido com suporte para operação de GPU de baixo custo

Introdução geral O HunyuanVideoGP é um modelo de geração de vídeo em grande escala desenvolvido pela DeepBeepMeep e projetado para usuários de GPUs de baixo custo. O modelo é uma versão aprimorada do modelo original do Hunyuan Video, reduzindo significativamente os requisitos de memória e memória gráfica...
6 meses atrás
01.8K
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: implantação sem servidor de um site de diálogo multimodal Gemini

Introdução geral O Gemini Playground é um projeto de código aberto criado para ajudar os usuários a implementar rapidamente um site de diálogo multimodal. O projeto é desenvolvido por um técnico de rastreamento de camarão, com suporte ao uso da chave da API Gemini em 10 segundos para concluir a implantação. Se o usuário estiver ...
6 meses atrás
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recupere o conteúdo e resuma o conhecimento de documentos maciços e de várias fontes

Introdução abrangente O wdoc é um poderoso sistema RAG (Retrieval Augmentation Generation) projetado para processar e analisar grandes quantidades de documentos diversos. Ele é capaz de recuperar uma grande variedade de tipos de documentos, incluindo PDFs, páginas da Web, vídeos do YouTube, arquivos de áudio etc. O wdoc é especialmente adequado para processar...
6 meses atrás
02.4K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1: projeto de código aberto de geração eficiente de vídeo que alega gerar um vídeo de um minuto em um minuto

Introdução abrangente O Magic 1-For-1 é um modelo eficiente de geração de vídeo projetado para otimizar o uso da memória e reduzir a latência da inferência. O modelo decompõe a tarefa de geração de texto para vídeo em duas subtarefas: geração de texto para imagem e geração de imagem para vídeo, permitindo treinamento e destilação mais eficientes...
6 meses atrás
02.6K
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: cliente de análise e visualização de dados de IA para geração rápida de gráficos e relatórios

Introdução geral O DataLine é uma poderosa ferramenta de análise e visualização de dados de IA projetada para ajudar os usuários a interagir com uma variedade de fontes de dados por meio de operações simples. Seja um arquivo CSV ou um banco de dados convencional, como Postgres, MySQL, Snowflake, SQL...
6 meses atrás
02.8K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: um corpo inteligente para melhorar a eficiência da análise de dados financeiros e da pesquisa de investimentos

Introdução abrangente O FinRobot é uma plataforma de inteligência de IA de código aberto desenvolvida pela AI4Finance Foundation e projetada para análise financeira. Ela não só abrange modelos de linguagem tradicionais, mas também incorpora uma variedade de tecnologias de IA, com o objetivo de fornecer uma solução abrangente para o setor financeiro.
6 meses atrás
02.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

Simba: um sistema de gerenciamento de conhecimento para organizar documentos, perfeitamente integrado a qualquer sistema RAG.

Introdução geral O Simba é um sistema portátil de gerenciamento de conhecimento (KMS) projetado para se integrar perfeitamente a qualquer sistema RAG (Retrieval Augmentation Generation). Criado pelo usuário do GitHub GitHamza0206, o projeto oferece uma solução eficiente de gerenciamento de conhecimento para uma variedade de...
6 meses atrás
02.3K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG: ferramenta de bate-papo inteligente para dar suporte a perguntas e respostas sobre documentos PDF de várias fontes locais

Introdução abrangente O LocalPdfChatRAG é um projeto de código aberto que visa implementar a funcionalidade de bate-papo inteligente combinando documentos PDF locais com modelos RAG (Retrieval Augmented Generation). O projeto permite que os usuários façam upload de documentos PDF e façam perguntas por meio de linguagem natural para passar do documento para o modelo relativo...
6 meses atrás
02.3K
Deep Searcher:企业私有文档高效检索与智能问答

Deep Searcher: recuperação eficiente de documentos privados da empresa e perguntas e respostas inteligentes

Descrição geral O Deep Searcher é uma ferramenta que combina modelos avançados de big language (como o DeepSeek e o OpenAI) e bancos de dados vetoriais (como o Milvus) projetados para pesquisar, avaliar e raciocinar com base em dados privados, fornecendo respostas altamente precisas...
6 meses atrás
02K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

Flashcard: uma ferramenta de aprendizado de idiomas estrangeiros com flashcards de palavras criada com base no Dify, substituindo o Duolingo

Introdução geral O Flashcard é uma ferramenta de aprendizado de idiomas de código aberto criada para oferecer uma alternativa ao Duolingo. Desenvolvido por Steven Lynn (nome de usuário do GitHub: stvlynn), o projeto apresenta uma interface de usuário moderna e...
6 meses atrás
02.2K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

Goku: gera vídeos detalhados e consistentes, ideais para a criação de comerciais com personagens e objetos detalhados.

Introdução abrangente O Goku é um modelo de geração de imagem e vídeo federado baseado em técnicas de transformação de fluxo projetadas para obter desempenho de nível industrial. Ele integra técnicas avançadas de geração visual de alta qualidade, incluindo agrupamento de dados de granularidade fina, design de modelo e formulação de transformação de fluxo.
6 meses atrás
03.2K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor: um assistente inteligente de desktop com IA baseado no Gemini que pode ver, ouvir e falar

Introdução geral O Gemini Cursor é um assistente inteligente de desktop baseado no modelo Gemini 2.0 Flash (experimental) do Google. Ele permite interações visuais, auditivas e de voz por meio de uma API multimodal, proporcionando o uso em tempo real e com baixa latência...
6 meses atrás
04K
Data Formulator:AI驱动的数据可视化工具

Data Formulator: uma ferramenta de visualização de dados orientada por IA

Introdução geral O Data Formulator é uma ferramenta de visualização de dados orientada por IA de código aberto desenvolvida pela Microsoft Research. A ferramenta combina uma interface gráfica de usuário (GUI) e entrada de linguagem natural (NL) para permitir que os usuários criem e iterem rapidamente por meio de interações e comandos simples...
6 meses atrás
02.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE: um aplicativo de IA para iOS de código aberto baseado em modelos OLMoE executados off-line

Introdução geral O Ai2 OLMoE é um aplicativo iOS de código aberto desenvolvido pelo Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence) para fornecer modelos de IA que são executados inteiramente em dispositivos. O aplicativo aproveita o modelo de código aberto OLMoE do Ai2...
6 meses atrás
03.5K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily: um assistente de IA para gerar atas de reuniões, transcrever e gerar resumos de reuniões em tempo real

Descrição geral O Meetily é um assistente de reunião com tecnologia de IA desenvolvido pela Zackriya Solutions que captura o áudio da reunião em tempo real, realiza a transcrição de voz e gera resumos da reunião. Ele é único, pois todo o processamento é feito localmente no dispositivo, garantindo a privacidade do usuário...
6 meses atrás
03.1K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2: um modelo de linguagem visual especializado para compreensão multimodal avançada

Introdução abrangente O DeepSeek-VL2 é uma série de modelos avançados de linguagem visual Mixture-of-Experts (MoE) que melhoram significativamente o desempenho de seu antecessor, o DeepSeek-VL. Os modelos são úteis em perguntas e respostas visuais, reconhecimento óptico de caracteres,...
6 meses atrás
03K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: Plug-in de navegador para fazer o ChatGPT funcionar em outras páginas da Web

Introdução geral O ChatGPT Box é uma extensão de navegador de código aberto projetada para integrar profundamente o ChatGPT ao navegador do usuário. Desenvolvida pela josStorer, a ferramenta é compatível com vários idiomas e oferece uma variedade de recursos, como chamar pares de bate-papo em qualquer página...
4 meses atrás
02.5K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: um plug-in de assistente de IA do WordPress para diálogo, geração de posts e tradução

Introdução abrangente O WordPress AI Assistant Plugin (wp-ai-chat) é um plug-in de WordPress de código aberto projetado para fornecer aos usuários uma variedade de recursos de IA, incluindo diálogo de IA, geração de artigos, resumo de artigos, tradução de artigos e leitura de conteúdo. O plug-in suporta o acoplamento de vários ...
6 meses atrás
02.6K
promptfoo:提供安全可靠的LLM应用测试工具

Promptfoo: fornecendo uma ferramenta de teste de aplicativos LLM segura e confiável

Introdução abrangente O promptfoo é uma ferramenta de linha de comando de código aberto e uma biblioteca dedicada à avaliação e ao teste de equipe vermelha de aplicativos do Large Language Model (LLM). Ele fornece aos desenvolvedores um conjunto completo de ferramentas para a criação de prompts, modelos e geração baseada em recuperação (RAGs) confiáveis com...
6 meses atrás
02.6K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: um kit de ferramentas de código aberto para conectar inteligências de IA ao protocolo Solana

Introdução geral O Solana Agent Kit é um kit de ferramentas de código aberto projetado para conectar perfeitamente as inteligências de IA ao protocolo de blockchain Solana. O kit permite que tanto os pesquisadores de IA quanto os desenvolvedores de criptomoedas usem qualquer corpo inteligente treinado por modelo para realizar mais de...
6 meses atrás
02.4K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomas

Introdução abrangente O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA. Ele oferece suporte à extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas etc., e é capaz de processar off-line em lote com aceleração de GPU.
6 meses atrás
02.4K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock: ferramenta de análise de ações habilitada para IA, monitoramento em tempo real de cotações de ações escolhidas por você mesmo e análise aprofundada com base em IA

Introdução abrangente O go-stock é uma ferramenta de análise de ações habilitada para IA, desenvolvida com base no Wails e no NaiveUI. A ferramenta é capaz de monitorar em tempo real as cotações de ações, fornecendo exibição de custos e lucros/perdas e função de acionamento de alarme para cima/para baixo. Todos os dados são salvos localmente para garantir que os usuários...
6 meses atrás
02.8K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers: Mecanismo de desempenho de inferência de modelos grandes: aceleração extrema, capacitação flexível

KTransformers: uma estrutura Python de alto desempenho para romper o gargalo da inferência de modelos grandes. É mais do que uma simples ferramenta de execução de modelos, é um conjunto de mecanismos de otimização de desempenho extremo e uma plataforma flexível de capacitação de interface. KTransf...
6 meses atrás
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG: uma estrutura RAG para entender vídeos ultralongos com suporte para recuperação multimodal e construção de gráficos de conhecimento

Introdução abrangente O VideoRAG é uma estrutura generativa aprimorada por recuperação, projetada para processar e compreender vídeos contextuais muito longos. A ferramenta combina uma base de conhecimento textual orientada por gráficos com codificação de contexto multimodal hierárquico para processar com eficiência em uma única GPU NVIDIA RTX 3090...
6 meses atrás
03K
Instructor:简化大语言模型结构化输出工作流的Python库

Instrutor: uma biblioteca Python para simplificar fluxos de trabalho de saída estruturada para grandes modelos de linguagem

Introdução geral O Instructor é uma biblioteca Python popular projetada para processar a saída estruturada de modelos de linguagem grande (LLMs). Criada com base no Pydantic, ela fornece uma API simples, transparente e fácil de usar para gerenciar dados...
6 meses atrás
02.4K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX: um corpo inteligente para análise de radiografias de tórax usando macromodelos multimodais

Introdução abrangente O MedRAX é uma inteligência de IA de última geração projetada para análise de radiografia de tórax (CXR). Ele integra ferramentas de análise de CXR de última geração e modelos multimodais de linguagem ampla para processar dinamicamente consultas médicas complexas sem treinamento adicional.
5 meses atrás
02.7K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot: robô de mensagens instantâneas de modelo grande de código aberto, suporte para vários WeChat, QQ, Flybook e outras implementações multiplataforma de robôs de IA

O LangBot é uma plataforma de bot de mensagens instantâneas baseada em modelos grandes que oferece suporte a várias plataformas de mensagens e modelos grandes. A plataforma se adapta ao QQ, WeChat (WeChat corporativo, WeChat pessoal), Flybook, Discord, OneBot e outras plataformas de mensagens, e é compatível com o Open...
6 meses atrás
02.9K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: uma estratégia genérica de fragmentação semântica baseada no Llama-70B

Introdução abrangente O zChunk é uma nova estratégia de fragmentação desenvolvida pela ZeroEntropy que visa a fornecer uma solução para a fragmentação semântica genérica. A estratégia se baseia no modelo Llama-70B, que otimiza o processo de fragmentação de documentos, solicitando a geração de blocos, garantindo que a recuperação de informações seja mantida em um alto nível...
6 meses atrás
02.3K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki: um modelo de tradução de fala em tempo real, tradução de fluxo contínuo que preserva as características da voz original

Introdução geral O Hibiki é um modelo de tradução de fala em tempo real de alta fidelidade desenvolvido pela Kyutai Labs. Diferentemente dos tradutores off-line tradicionais, o Hibiki é capaz de gerar traduções naturais de fala no idioma de destino em tempo real enquanto o usuário fala, além de fornecer traduções de texto. O modelo...
6 meses atrás
03.2K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: um assistente de IA off-line executado em seu telefone, adaptado para o DeepSeek-R1 (5,37 GB)

Introdução geral O Pocket AI (PocketPal AI versão chinesa) é um poderoso assistente de IA off-line projetado para permitir que os usuários conversem com a IA a qualquer hora e em qualquer lugar. Ele se baseia em modelos de linguagem pequenos (SLMs) e é executado em telefones celulares sem conexão com a Internet, especialmente adaptado à experiência do usuário chinês. Boca...
6 meses atrás
03.1K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll: assistente de IA para gerenciamento de dados pessoais de saúde, upload de relatórios de exames para um plano de saúde personalizado

Introdução geral O OpenHealthForAll é um projeto de código aberto criado para ajudar os usuários a gerenciar e entender seus dados pessoais de saúde. Ao aproveitar a tecnologia de inteligência artificial, o OpenHealthForAll fornece um assistente de saúde executado localmente para ajudar os usuários a gerenciar melhor...
6 meses atrás
02K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统

OpenPilot: sistema de direção autônoma de código aberto, faça você mesmo um conjunto de seu próprio sistema de direção inteligente para seu carro

Introdução geral O OpenPilot é um sistema de direção autônoma de código aberto desenvolvido pela comma.ai para aprimorar a experiência de direção e a segurança dos veículos existentes com recursos avançados de assistência ao motorista. Desde seu primeiro lançamento em 2016, o OpenPilot já suportou mais de 2...
6 meses atrás
02.6K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: ferramenta de varredura de vulnerabilidades LLM de código aberto que fornece técnicas de ataque e testes de fuzz abrangentes

Introdução geral O Agentic Security é uma ferramenta de código aberto de varredura de vulnerabilidades do LLM (Large Language Model) projetada para fornecer aos desenvolvedores e profissionais de segurança técnicas abrangentes de teste e ataque de fuzz. A ferramenta é compatível com conjuntos de regras personalizadas ou ataques baseados em agentes e é capaz de integrar o LLM AP...
6 meses atrás
02.7K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: modelo multimodal de código aberto para apoiar a compreensão de vídeos e várias rodadas de diálogo

Introdução abrangente O CogVLM2 é um modelo multimodal de código aberto desenvolvido pelo Grupo de Pesquisa em Mineração de Dados da Universidade de Tsinghua (THUDM), com base na arquitetura Llama3-8B e com o objetivo de oferecer desempenho comparável ou até melhor que o GPT-4V. O modelo oferece suporte à compreensão de imagens, ao diálogo em várias rodadas e à...
6 meses atrás
02.4K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: software de edição e de melhoria de fotos e vídeos potente e fácil de usar

Introdução geral O VisoMaster é uma ferramenta de edição e troca de faces de vídeo poderosa e fácil de usar que utiliza tecnologia de inteligência artificial para obter efeitos naturais e realistas de troca de faces. Seja em uma imagem ou em um vídeo, o VisoMaster pode gerar resultados de troca de rosto de alta qualidade com operações simples, adequadas para...
6 meses atrás
04.1K
基于RAG构建提供健康建议的小助手(实验项目)

Construção, com base em RAG, de um mini-assistente que fornece orientação sobre saúde (projeto piloto)

Introdução geral O LLM-RAG-Longevity-Coach é um chatbot baseado nas tecnologias Large Language Modelling (LLM) e Retrieval Augmented Generation (RAG), projetado para fornecer conselhos personalizados sobre saúde e longevidade aos usuários. O projeto foi desenvolvido por Tyler Burle...
6 meses atrás
02.5K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro: uma ferramenta para simplificar o processo de ajuste fino dos modelos das principais linguagens visuais de código aberto

Introdução abrangente O Maestro é uma ferramenta desenvolvida pela Roboflow para simplificar e acelerar o processo de ajuste fino de modelos multimodais, para que todos possam treinar seus próprios macromodelos visuais. Ele fornece receitas prontas para o ajuste fino de modelos populares de linguagem visual (VLMs), como o F...
6 meses atrás
02.5K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

Bilingual Book Maker: Use a tradução de IA para criar e-books bilíngues, ferramenta de tradução automática de livros completos

Introdução geral O Bilingual Book Maker é um projeto de código aberto criado para ajudar os usuários a criar versões multilíngues de eBooks usando a tecnologia de IA. A ferramenta usa principalmente o ChatGPT para tradução e suporta vários formatos de arquivo, incluindo epub, txt e srt...
6 meses atrás
02.7K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extração em lote de informações estruturadas de documentos e análise automatizada

Introdução geral O Rowfill é uma plataforma de processamento de documentos de código aberto projetada para profissionais do conhecimento. Ele usa técnicas avançadas de inteligência artificial para extrair, analisar e processar dados de documentos, imagens e PDFs complexos. O Rowfill é compatível com o Native Large Language Model (LLM) e o Ope...
6 meses atrás
02.3K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Parametric Retrieval Augmentation Generation Tool for Improving the Performance of Q&A Systems (Ferramenta de geração de aumento de recuperação paramétrica para melhorar o desempenho dos sistemas de perguntas e respostas)

Introdução abrangente O PRAG (Parametric Retrieval-Augmented Generation) é uma ferramenta inovadora de geração de recuperação aumentada que visa aprimorar a geração de conhecimento externo, incorporando-o diretamente ao espaço de parâmetros de um Modelo de Linguagem Grande (LLM)...
6 meses atrás
03.5K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

Pesquisador GPT: gere relatórios de pesquisa abrangentes e detalhados usando dados locais e baseados na Web

Introdução abrangente O GPT Researcher é uma ferramenta de agente autônomo baseada no Large Language Model (LLM), projetada para realizar pesquisas locais e na Web e gerar relatórios de pesquisa detalhados. A ferramenta oferece desempenho estável e velocidade mais rápida ao paralelizar o trabalho do agente, garantindo que as informações sejam precisas...
4 meses atrás
02.1K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker: sistema de diálogo inteligente para pessoas digitais, combinando grandes modelos de linguagem e modelos visuais para novas experiências interativas

Introdução geral O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem ampla (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra uma variedade de tecnologias, como Whisper, Linly, Micros...
6 meses atrás
02.6K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: Integre facilmente vários modelos de IA e crie aplicativos multimodais com base no Gradio

Introdução geral O ai-gradio é um kit de ferramentas Python de código aberto projetado para ajudar os desenvolvedores a integrar e usar facilmente vários modelos de IA. Criado com base no Gradio, o projeto oferece uma interface unificada para dar suporte a vários modelos e serviços de IA. Seja texto, fala ou vídeo...
6 meses atrás
02.9K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher: ferramenta automatizada de pesquisa aprofundada para escrever relatórios de pesquisa completos

Introdução geral O OpenDeepResearcher é uma ferramenta de pesquisa profunda automatizada de código aberto projetada para melhorar a eficiência da pesquisa por meio de técnicas de inteligência artificial. O projeto foi desenvolvido por mshumer e hospedado no GitHub.OpenDeepResear...
4 meses atrás
02.7K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara: serviço de armazenamento e recuperação de documentos baseado em incorporação visual

Introdução geral O ColiVara é um serviço de armazenamento e recuperação de documentos baseado na tecnologia de incorporação visual. Ele elimina a necessidade de reconhecimento óptico de caracteres (OCR) ou de extração de texto e evita os problemas de formulários quebrados ou imagens perdidas. O ColiVara é compatível com mais de 100 formatos de arquivo, incluindo PDF...
6 meses atrás
02.4K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: um modelo de código aberto para criar rapidamente um ambiente local de IA

Introdução abrangente O n8n Self-Hosted AI Starter Kit é um modelo de código aberto do Docker Compose projetado para inicializar rapidamente um ambiente local abrangente de desenvolvimento de IA e de baixo código. Criado pela equipe da n8n, o pacote combina a plataforma n8n auto-hospedada com uma variedade de soluções de IA compatíveis...
6 meses atrás
03.2K
Gemini Teacher:英语口语发音纠正助手

Gemini Teacher: Assistente de correção de pronúncia em inglês

Introdução geral O Gemini Teacher é um assistente de prática de conversação em inglês baseado na IA do Google Gemini. Ele reconhece a pronúncia em inglês do usuário em tempo real e fornece feedback instantâneo e sugestões de correção. A ferramenta foi projetada para ajudar os usuários a melhorar suas habilidades de fala em inglês por meio de...
6 meses atrás
02.7K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive: gravação ao vivo sem supervisão e corte automático, ferramenta de upload para a estação B

Introdução abrangente O bilive é uma ferramenta projetada para gravação ao vivo de estações B, oferecendo gravação ao vivo extremamente rápida, corte automático, renderização de pop-ups e geração de legendas. A ferramenta é compatível com máquinas de configuração ultrabaixa, suporta gravação autônoma de 7x24 horas, identifica e renderiza automaticamente pop-ups e legendas, corta e...
6 meses atrás
02.6K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: Aprendizado de reforço de baixo custo para a capacidade de generalização de modelos de linguagem visual

Introdução abrangente O R1-V é um projeto de código aberto que visa a obter avanços na modelagem de linguagem visual (VLM) por meio da aprendizagem por reforço (RL) de baixo custo. O projeto utiliza mecanismos de recompensa verificáveis para motivar os VLMs a aprender habilidades genéricas de contagem. Surpreendentemente, o 2B do R1-V ...
6 meses atrás
02.8K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: ferramenta especial para converter arquivos PPTX em Markdown

Introdução geral O PPTX2MD é uma ferramenta de código aberto projetada para converter arquivos PPTX do PowerPoint para o formato Markdown. Desenvolvida pelo usuário ssine do GitHub, a ferramenta suporta a preservação de títulos, listas, formatação de texto (por exemplo, negrito, itálico, cores e super...
6 meses atrás
02.3K
DSPy Examples:展示DSPy功能的实用示例

Exemplos de DSPy: Exemplos práticos que demonstram a funcionalidade do DSPy

Introdução geral A base de código de exemplo do DSPy é uma base de código do GitHub mantida pela equipe de IA da Langtrace que apresenta uma variedade de exemplos de programas de IA criados usando o DSPy. A base de código foi projetada para demonstrar os vários recursos do DSPy por meio de exemplos do mundo real para ajudar os desenvolvedores a entender melhor...
6 meses atrás
02.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab: uma ferramenta de diálogo experimental para explorar o pensamento iterativo sobre a colaboração entre humanos e computadores

O CoT-Lab é uma interface experimental para explorar novos paradigmas na colaboração entre humanos e computadores. Com base na Teoria da Carga Cognitiva e nos Princípios de Aprendizagem Ativa, o CoT-Lab facilita o alinhamento cognitivo profundo entre humanos e a Inteligência Artificial (IA) por meio da criação de relacionamentos de "parceiros pensantes". O projeto tem como objetivo...
6 meses atrás
02.2K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Introdução geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar...
6 meses atrás
02.8K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Exemplos do Reflex LLM: uma coleção de aplicativos de IA que demonstram a aplicação prática de grandes modelos de linguagem

Introdução geral O Reflex LLM Examples é um projeto de código aberto criado pela equipe de desenvolvimento do Reflex para demonstrar aplicações práticas do Large Language Model (LLM). O projeto reúne vários aplicativos de IA criados com base no Reflex, apresentando aplicativos do Googl...
6 meses atrás
02.1K
DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面

DeepClaude: uma interface de bate-papo que funde o raciocínio de cadeia R1 do DeepSeek com a criatividade do Claude

Introdução abrangente O DeepClaude é uma API de inferência de modelo de linguagem grande (LLM) de alto desempenho e uma interface de bate-papo que integra os recursos de inferência encadeada (CoT) do DeepSeek R1 com a criatividade e a geração de código do modelo Anthropic Claude...
6 meses atrás
03.5K
BEN2:从图像、视频中快速移除背景的深度学习模型

BEN2: Modelo de aprendizagem profunda para remoção rápida de fundo de imagens e vídeos

Introdução abrangente O BEN2 (Background Erase Network 2) é um modelo de aprendizagem profunda desenvolvido pela Prama LLC, projetado especificamente para remover automaticamente o plano de fundo de uma imagem e gerar uma imagem em primeiro plano. O modelo usa uma inovadora tecnologia Confiden...
2 meses atrás
03.6K
LLM API Engine:通过自然语言快速生成和部署API

Mecanismo de API do LLM: geração e implementação rápidas de APIs por meio de linguagem natural

Introdução geral O LLM API Engine é um projeto de código aberto criado para ajudar os desenvolvedores a criar e implantar rapidamente APIs com tecnologia de IA. O projeto aproveita o Large Language Model (LLM) e a tecnologia inteligente de rastreamento da Web para permitir que os usuários criem APIs personalizadas por meio de descrições de linguagem natural.
6 meses atrás
02.2K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3

Introdução abrangente O PengChengStarling (PengCheng Labs) é uma ferramenta de reconhecimento automático de fala (ASR) multilíngue capaz de converter a fala em diferentes idiomas em texto correspondente. Esse kit de ferramentas foi desenvolvido com base no projeto icefall e fornece um processo completo de reconhecimento de fala...
6 meses atrás
02.2K
Doc2XAPITranslate:文档全文翻译:快速将英文PDF/MD论文翻译为中文文档

Doc2XAPITranslate: tradução de documentos em texto completo: traduza rapidamente documentos PDF/MD em inglês para documentos em chinês.

Introdução abrangente O Doc2XAPITranslate é uma poderosa ferramenta de tradução de documentos de texto completo projetada para traduzir rapidamente documentos PDF ou Markdown em inglês para documentos chineses. A ferramenta oferece suporte a vários tradutores, incluindo DeepSeek, OpenAI, O...
6 meses atrás
02.6K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-preview: um macromodelo de diálogo de fala antropomórfico de ponta a ponta para interação em tempo real

O SpeechGPT 2.0-preview é o primeiro sistema de interação antropomórfica em tempo real introduzido pelo OpenMOSS, que é treinado com base em milhões de horas de dados de fala. O sistema é equipado com expressão falada antropomórfica e resposta de baixa latência de 100 ms, oferecendo suporte à interação natural e suave em tempo real...
6 meses atrás
02.8K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose: inteligências de programação escalonáveis de código aberto que automatizam tarefas de programação de processo completo

Introdução geral O Goose é uma ferramenta de agente de IA de código aberto desenvolvida pela Block, Inc., projetada para ajudar os desenvolvedores a automatizar as tarefas diárias de desenvolvimento. Ele é compatível com uma ampla variedade de modelos de linguagem grande (LLMs) e interage com os usuários por meio da linha de comando ou de interfaces de aplicativos de desktop.
6 meses atrás
03.8K
Fullmoon:本地大语言模型聊天的iOS应用

Fullmoon: aplicativo iOS para bate-papo com modelos nativos de idiomas grandes

Descrição geral O Fullmoon é um aplicativo desenvolvido para dispositivos iOS e tem como objetivo oferecer a possibilidade de conversar de forma privada com modelos nativos de idiomas grandes. O aplicativo foi otimizado para o Apple Silicon e é compatível com iPhone, iPad e Mac. Os usuários do bate-papo...
6 meses atrás
03.3K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: Cursor de código aberto para design de front-end, design e publicação de código em aplicativos React

Introdução geral O Onlook é uma ferramenta de design de código aberto criada para designers e desenvolvedores que permite aos usuários projetar diretamente em um aplicativo React em execução e converter alterações de design em código. A ferramenta oferece uma experiência de edição visual intuitiva semelhante à do Figma ou do Webf...
6 meses atrás
02.4K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格

YuE: Transforma as letras em um modelo básico de uma música completa, suportando uma ampla variedade de estilos musicais

Introdução geral O YuE é um modelo básico de geração de músicas completas de código aberto que se concentra na transformação de letras em músicas completas. Diferentemente de outros modelos que geram apenas trechos curtos de músicas sem vocais, o YuE é capaz de gerar músicas completas com vocais principais e de apoio de até vários minutos de duração. O modelo aborda a geração de música em...
6 meses atrás
03.2K
Supermemory:导入书签和网页内容构建个人知识库

Supermemória: importação de favoritos e conteúdo da Web para criar uma base de conhecimento pessoal

Introdução geral O Supermemory é um projeto de código aberto criado para ajudar os usuários a construir seu "segundo cérebro". Com uma poderosa extensão do Chrome e tecnologia de IA, ele permite que os usuários salvem, organizem e recuperem facilmente dados de páginas da Web, favoritos do Twitter...
6 meses atrás
02.9K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: converte PDF em podcasts de ferramentas de código aberto

Introdução geral O Open NotebookLM é um projeto de código aberto desenvolvido para converter qualquer documento PDF em um podcast. A ferramenta usa modelos de código aberto Large Language Model (LLM) e Text-to-Speech (TTS) para processar o conteúdo do PDF e gerar um diálogo natural adequado para podcasts de áudio...
6 meses atrás
02.7K
Lux:几乎支持所有视频平台的命令行视频下载器

Lux: downloader de vídeo com linha de comando compatível com quase todas as plataformas de vídeo

Introdução geral Lux é uma biblioteca de download de vídeo rápida e simples e uma ferramenta de linha de comando escrita em Go. Ele suporta o download de vídeos de vários sites, incluindo YouTube, Bilibili, Youku etc. O Lux oferece uma variedade de opções e recursos de download, como o download multi-threaded...
6 meses atrás
02.2K
Langui:开源的AI用户界面组件库

Langui: uma biblioteca de código aberto de componentes de interface de usuário de IA

Introdução geral A Langui da LangbaseInc é uma biblioteca de componentes de interface de usuário de código aberto projetada para projetos de IA generativa e Modelagem de Linguagem Grande (LLM). A biblioteca é baseada no Tailwind CSS e oferece uma coleção de componentes de interface do usuário pré-criados para ajudar os desenvolvedores a construir rapidamente...
7 meses atrás
02.3K
MNN-LLM-Android:MNN 多模态语言模型的安卓应用

MNN-LLM-Android: modelagem de linguagem multimodal MNN para Android

Introdução abrangente A MNN (Mobile Neural Network) é uma estrutura de aprendizagem profunda leve e eficiente, desenvolvida pela Alibaba e otimizada para dispositivos móveis. A MNN não só é capaz de fazer inferências rápidas em dispositivos móveis, mas também oferece suporte a tarefas multimodais, incluindo geração de texto...
6 meses atrás
03.3K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具

AI RSS Generator: uma ferramenta para converter conteúdo da Web em feeds RSS por meio de IA

Introdução geral O AI RSS é uma ferramenta inovadora que converte conteúdo da Web em feeds RSS por meio da tecnologia de IA. Ela consiste em duas partes principais: um plug-in de navegador e um lado do servidor. O plug-in do navegador permite que os usuários selecionem listas de páginas da Web e gerem arquivos de descrição de dados estruturados (SDD)...
7 meses atrás
02.5K
UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调

UltraRAG: uma solução completa do sistema RAG para simplificar a construção de dados e o ajuste fino do modelo

Introdução abrangente O UltraRAG é uma solução de sistema RAG (Retrieval Augmented Generation) proposta em conjunto pelo grupo THUNLP da Universidade de Tsinghua, pelo grupo NEUIR da Universidade Northeastern, pela Modelbest.Inc e pela equipe 9#AISoft. A estrutura é baseada na implantação ágil e na construção modular...
7 meses atrás
02.2K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型

Llasa 1~8B: um modelo de conversão de texto em fala de código aberto para geração e clonagem de fala de alta qualidade

Introdução geral O Llasa-3B é um modelo de conversão de texto em fala (TTS) de código aberto desenvolvido pelo Laboratório de Áudio da Universidade de Ciência e Tecnologia de Hong Kong (HKUST Audio). O modelo se baseia na arquitetura Llama 3.2B, que foi cuidadosamente ajustada para oferecer geração de fala de alta qualidade que não só oferece suporte a várias...
6 meses atrás
03.2K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具

Fast GraphRAG: uma ferramenta de geração de aprimoramento de pesquisa gráfica altamente precisa e de baixo custo

Introdução abrangente O Fast GraphRAG é uma ferramenta de código aberto desenvolvida pela Circlemind AI para permitir a geração de aumento de recuperação (RAG) eficiente e precisa por meio de algoritmos de gráfico de conhecimento e PageRank. A ferramenta se adapta de forma inteligente ao uso do usuário...
7 meses atrás
02.4K
Cerebr:与网页内容对话的开源浏览器插件

Cerebr: plug-in de navegador de código aberto que se comunica com o conteúdo da Web

Descrição geral O Cerebr é uma poderosa extensão de assistente de IA para o Chrome, projetada para aprimorar sua produtividade e experiência de aprendizado. O Cerebr foi projetado desde o início com a necessidade de um assistente de IA de navegador limpo e eficiente, com um design minimalista e...
4 meses atrás
02.6K