Projeto de código aberto de IA

Total de 1020 artigos
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: a ferramenta de IA que restaura de forma inteligente fotos antigas amareladas e desgastadas

O Bringing Old Photos Back to Life é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da Microsoft que se concentra na restauração de fotos antigas usando a tecnologia de IA. Ele se baseia em uma abordagem de aprendizagem profunda que pode lidar com problemas graves de degradação em fotos, como arranhões...
5 meses atrás
01.7K
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: uma ferramenta de código aberto para otimizar palavras de prompt para modelos de IA convencionais

Introdução geral O Prompt Optimizer é uma ferramenta de código aberto voltada para a otimização de palavras de alerta, desenvolvida por linshenkx no GitHub. Ele ajuda os usuários a otimizar as palavras de alerta dos modelos de IA por meio de algoritmos inteligentes, melhorando assim a qualidade do conteúdo gerado...
5 meses atrás
02.6K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: uma ferramenta de código aberto para detectar possíveis riscos de segurança em sistemas de IA

Introdução abrangente O AI-Infra-Guard é uma ferramenta de avaliação de segurança de infraestrutura de IA de código aberto desenvolvida pela equipe de segurança híbrida da Tencent, Zhuqiao Labs, que foi projetada para ajudar os usuários a descobrir e detectar rapidamente possíveis riscos de segurança em sistemas de IA. A ferramenta é compatível com mais de 30 estruturas e componentes de IA para...
5 meses atrás
02K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: instruções de texto geram um vídeo em loop contínuo

Introdução geral O Mobius Diffusion é uma ferramenta on-line inovadora voltada para a geração de conteúdo de vídeo em loop contínuo a partir de entrada de texto. Ela se baseia em modelos de difusão de vídeo pré-treinados e não requer treinamento do usuário nem dados de anotação para ser iniciada rapidamente. A tecnologia principal do site é a ...
5 meses atrás
02.2K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: uma inteligência visual para resolver várias tarefas de detecção visual de alvos

Introdução geral O Vision Agent é um projeto de código aberto desenvolvido pela LandingAI (Equipe Enda Wu) e hospedado no GitHub, projetado para ajudar os usuários a gerar código rapidamente para resolver tarefas de visão computacional. Ele usa uma estrutura de agente avançada e modelos multimodais...
5 meses atrás
02.3K
MyCoder:自动修复代码、生成测试用例的命令行AI工具

MyCoder: ferramenta de IA de linha de comando para corrigir automaticamente o código e gerar casos de teste

Introdução geral O MyCoder é um projeto de código aberto desenvolvido pela equipe do drivecore e hospedado no GitHub, com o objetivo de fornecer aos desenvolvedores assistência inteligente à programação por meio de uma interface de linha de comando. Ele se baseia no sistema de programação Claude AP...
5 meses atrás
02.2K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: um modelo de áudio de ponta a ponta que oferece suporte à interação de voz em tempo real

Introdução abrangente O Baichuan-Audio é um projeto de código aberto desenvolvido pela Baichuan Intelligence (baichuan-inc), hospedado no GitHub, com foco na tecnologia de interação de voz de ponta a ponta. O projeto fornece uma estrutura completa de processamento de áudio que permite a fala ...
5 meses atrás
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastreie e resuma notícias de IA em tempo real e publique-as automaticamente no WeChat

Introdução geral ai-trend-publish é um projeto de código-fonte aberto hospedado no GitHub, desenvolvido pela equipe do OpenAISpace, focado no rastreamento e na publicação das últimas tendências em inteligência artificial em tempo real. Essa ferramenta foi projetada para ajudar desenvolvedores, amadores de tecnologia...
5 meses atrás
02.3K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Gere vídeos animados explicativos de matemática de mais de 5 minutos com o Manim

Introdução geral O TheoremExplainAgent é um projeto inovador desenvolvido pelo TIGER AI Lab para transformar teoremas matemáticos e científicos complexos em animações de vídeo fáceis de entender usando técnicas de inteligência artificial. A ferramenta é baseada no Modelo de Linguagem Grande (LLM)...
5 meses atrás
02.2K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat: cliente de diálogo de IA que suporta sessões simultâneas com vários bate-papos

Introdução geral O DeepChat é um projeto de assistente inteligente de código aberto desenvolvido pela equipe ThinkInAIXYZ no GitHub. Seu objetivo é conectar os usuários ao mundo digital por meio de uma poderosa tecnologia de IA para proporcionar uma experiência de bate-papo eficiente e natural. Ele é compatível com o Win...
5 meses atrás
03.1K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe: um algoritmo paralelo bidirecional em pipeline para melhorar a eficiência do treinamento de modelos de IA em grande escala (DeepSeek Open Source Week Day 4)

Introdução geral O DualPipe é uma tecnologia de código aberto desenvolvida pela equipe do DeepSeek-AI com o objetivo de melhorar a eficiência do treinamento de modelos de IA em grande escala. É um inovador algoritmo paralelo bidirecional em pipeline usado principalmente no DeepSeek-V3 e R1...
5 meses atrás
02.3K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev: ferramenta automatizada de geração de código e depuração com suporte a vários idiomas

Introdução geral O AutoDev é um projeto de código aberto desenvolvido pela equipe do Unit Mesh e hospedado no GitHub, com o objetivo de melhorar a eficiência de programação dos desenvolvedores por meio da tecnologia de inteligência artificial. Ele é um assistente de codificação avançado que oferece suporte a várias linguagens de programação, incluindo Ja...
6 meses atrás
02.6K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: reprodutor de vídeo que gera legendas em tempo real com tradução bilíngue

Introdução geral O LLPlayer é um reprodutor de mídia de código aberto para alunos de idiomas, hospedado no GitHub e criado pelo desenvolvedor umlx5h. Ele integra uma variedade de recursos úteis, como exibição de legendas bilíngues, legendas geradas automaticamente por IA, tradução em tempo real e pesquisa de palavras...
2 meses atrás
03.8K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: um assistente de ensino inteligente que fornece orientação de programação personalizada

Introdução geral O Coding-Tutor é um projeto de código aberto hospedado no GitHub e criado pelo desenvolvedor iwangjian para oferecer aos alunos uma experiência de ensino de programação personalizada. Ele usa tecnologia de IA conversacional para aprender com base no histórico de conhecimento do usuário e...
6 meses atrás
02K
Flock:低代码工作流编排快速构建聊天机器人

Flock: orquestração de fluxo de trabalho com pouco código para criar chatbots rapidamente

Introdução geral O Flock é uma plataforma de código aberto de baixo código para fluxo de trabalho, hospedada no GitHub e desenvolvida pela equipe da Onelevenvy. Ela se baseia nas tecnologias LangChain e LangGraph e se concentra em ajudar os usuários a criar rapidamente máquinas de bate-papo...
6 meses atrás
02.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPT Agent: ferramenta inteligente projetada para analisar dados tabulares complexos

Introdução abrangente O TableGPT Agent é uma ferramenta inteligente baseada no projeto de código aberto do GitHub, projetado para processar e analisar dados tabulares. Ele se baseia no TableGPT2 Big Language Model e usa a interação de linguagem natural para permitir que os usuários consultem, manipulem e...
6 meses atrás
02.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Geração rápida de vídeos de apresentação a partir de slides/PPTs e notas explicativas

Introdução geral O TRV é uma ferramenta de código aberto, hospedada no GitHub, projetada para ajudar os usuários a converter rapidamente slides e notas de apresentação em vídeos com narração. Ele gera automaticamente conteúdo de áudio e vídeo a partir de arquivos de apresentação de entrada por meio de operações simples de linha de comando, adequadas para quem precisa criar rapidamente apresentações...
6 meses atrás
02.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM: a ferramenta de desenvolvimento de código reduzido de código aberto da Shangtang para a criação de aplicativos corporais multiinteligentes

Introdução abrangente O LazyLLM é uma ferramenta de código aberto desenvolvida pela equipe do LazyAGI, com foco na simplificação do processo de desenvolvimento de aplicativos de modelos grandes de inteligência múltipla. Ela ajuda os desenvolvedores a criar rapidamente aplicativos complexos de IA por meio da implantação com um clique e de mecanismos de gateway leves, poupando a tediosa configuração de engenharia...
6 meses atrás
02.5K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: geração de ativos de animação de estrutura esquelética a partir de modelos 3D estáticos

Introdução abrangente O MagicArticulate é uma estrutura de IA desenvolvida pela ByteDance em colaboração com a Nanyang Technological University (NTU), com foco na transformação rápida de modelos 3D estáticos em ativos digitais habilitados para animação. Ele faz isso por meio de um transformador autorregressivo avançado e de um modelo de difusão funcional, auto...
6 meses atrás
02.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk: instalação com um clique de modelos de IA e interfaces de bate-papo em computadores pessoais (com DeepSeek)

Introdução geral O AingDesk é um software gratuito e de código aberto projetado para ajudar os usuários a implementar e executar facilmente vários modelos de IA em seus computadores locais. Seja um modelo DeepSeek ou Llama, o AingDesk permite uma implementação simples, passo a passo...
6 meses atrás
02.7K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

Introdução abrangente O PDF-Extract-Kit é um projeto de código aberto desenvolvido pela equipe do OpenDataLab, com foco na extração eficiente de conteúdo de alta qualidade de documentos PDF complexos e diversos. Ele integra tecnologia avançada de análise de documentos para oferecer suporte à detecção de layout, reconhecimento de fórmulas ...
6 meses atrás
03K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D: uma plataforma de IA para gerar ativos digitais modelados em 3D de alta resolução

Introdução geral O Neural4D é uma plataforma inovadora baseada em IA, focada em ajudar os usuários a gerar rapidamente modelos e animações em 3D de alta qualidade com uma simples entrada de texto ou imagem. Desenvolvida pela DreamTech, ela se baseia na tecnologia líder mundial de geração de modelos grandes em 3D de ponta a ponta...
6 meses atrás
02.5K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense: uma ferramenta de anotação de imagens de uso gratuito para aumentar a eficiência do projeto de visão computacional

Introdução geral O Make Sense é uma ferramenta gratuita de anotação de imagens on-line criada para ajudar os usuários a preparar rapidamente conjuntos de dados para projetos de visão computacional. Ela não requer instalação complicada, basta abrir um acesso ao navegador para usá-la, é compatível com vários sistemas operacionais e é ideal para pequenos projetos de aprendizagem profunda. Os usuários podem...
6 meses atrás
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: Interface de bate-papo com IA para visualizar conversas baseadas em árvores

Introdução geral O TreeGPT é um aplicativo de bate-papo de código aberto baseado no Next.js, que se concentra na visualização de conversas com grandes modelos de linguagem (LLMs, por exemplo, GPTs) por meio de estruturas de gráficos em árvore (gráficos acíclicos direcionados, DAGs), substituindo os métodos de bate-papo lineares tradicionais para melhorar a velocidade e a...
6 meses atrás
02.9K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot: um assistente de IA para geração de descrição de texto Fluxos de trabalho do ComfyUI

Introdução abrangente O ComfyUI-Copilot é um nó personalizado orientado por IA projetado para a estrutura ComfyUI, com o objetivo de melhorar a eficiência da depuração e da implementação de algoritmos de IA por meio da interação de linguagem natural. Ele foi desenvolvido pela equipe AIDC-AI (Alibaba) e derivado do GitHu...
6 meses atrás
02.6K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

Auto-Deep-Research: colaboração de vários agentes para realizar consultas à literatura e gerar relatórios de pesquisa

Introdução geral O Auto-Deep-Research é uma ferramenta de IA de código aberto desenvolvida pelo Laboratório de Inteligência de Dados da Universidade de Hong Kong (HKUDS), cujo objetivo é ajudar os usuários a automatizar tarefas de pesquisa profunda. Ela foi desenvolvida com base na estrutura do AutoAgent e oferece suporte a vários modelos de linguagem grandes...
4 meses atrás
05.5K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek: uma ferramenta de código aberto para gerar materiais de estudo de palavras da 4ª série usando o DeepSeek

Introdução abrangente O "Vocabulary Book by DeepSeek" é um projeto de código aberto desenvolvido com base no grande modelo do DeepSeek, com o objetivo de ajudar os alunos de inglês a dominar o vocabulário do College English Level 4 (CET-4) de forma eficiente. O projeto está hospedado no GitHub...
6 meses atrás
03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent: uma estrutura para criação e implementação rápidas de inteligências de IA por meio de linguagem natural

Introdução geral O AutoAgent é uma estrutura de inteligências de IA de código aberto desenvolvida pelo Laboratório de Inteligência de Dados da Universidade de Hong Kong (HKUDS) e hospedada no GitHub. Ele permite que os usuários criem e implementem rapidamente inteligências de IA personalizadas, descrevendo seus requisitos em linguagem puramente natural, sem qualquer base de programação...
2 meses atrás
03K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: uma ferramenta eficiente de rastreamento da Web para pré-treinamento de LLM

Introdução abrangente O Crawl4LLM é um projeto de código-fonte aberto desenvolvido em conjunto pela Universidade de Tsinghua e pela Universidade Carnegie Mellon, com foco na otimização da eficiência do rastreamento da Web para pré-treinamento de modelos grandes (LLM). Ele reduz significativamente o rastreamento ineficaz por meio da seleção inteligente de dados da Web de alta qualidade, alegando ser capaz de rastrear originalmente 1...
6 meses atrás
02.4K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de treinamento de aprendizado por reforço de raciocínio em larga escala de código aberto

Introdução geral O Open-Reasoner-Zero é um projeto de código aberto voltado para a pesquisa de aprendizagem por reforço (RL), desenvolvido pela equipe do Open-Reasoner-Zero no GitHub. Seu objetivo é fornecer treinamento eficiente, dimensionável e fácil de usar ...
6 meses atrás
02.2K
Deep Research Web UI:支持多语言深度研究的AI助手

Deep Research Web UI: um assistente de IA que oferece suporte à pesquisa profunda multilíngue

Introdução abrangente A Deep Research Web UI é uma ferramenta de assistente de pesquisa de código aberto baseada em tecnologia de IA, projetada para ajudar os usuários a realizar pesquisas iterativas profundas sobre qualquer tópico. Ele combina o poder dos mecanismos de pesquisa, o rastreamento da Web e a modelagem de linguagem em larga escala por meio de uma interface intuitiva na Web...
4 meses atrás
02.5K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar: retratos 2D orientados por áudio de pessoas digitais interativas em tempo real, executados a 30 fps na CPU

Introdução geral O LiteAvatar é uma ferramenta de código aberto desenvolvida pela equipe HumanAIGC (parte do Ali) que se concentra na geração de animações faciais a partir de avatares 2D acionados por áudio em tempo real. Ele é executado a 30 quadros por segundo (fps), dependendo apenas da CPU, e é especialmente adequado para...
6 meses atrás
02.5K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat: um aplicativo de bate-papo em grupo com vários personagens de IA interagindo em tempo real

Introdução geral O Botgroup.chat é um aplicativo de bate-papo em grupo de IA de código aberto desenvolvido com base em React e Cloudflare Pages, com o objetivo de oferecer aos usuários uma experiência interativa semelhante ao bate-papo em grupo do WeChat. Ele suporta a participação simultânea de vários personagens de IA...
6 meses atrás
03.7K
Open Deep Research:LangChain开源的深度研究智能助手

Open Deep Research: o assistente inteligente de código aberto da LangChain para pesquisa profunda

Introdução abrangente O Open Deep Research é um assistente de pesquisa baseado na Web capaz de gerar relatórios de pesquisa abrangentes sobre qualquer tópico. O sistema usa um fluxo de trabalho de planejar e fazer que permite aos usuários planejar e revisar a estrutura do relatório antes de passar para a fase de pesquisa demorada...
4 meses atrás
03.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen: uma ferramenta de código aberto para geração automática de gráficos de conhecimento a partir de texto simples

Introdução geral O KGGen é uma ferramenta de código aberto desenvolvida pelo Stanford Trusted Artificial Intelligence Research Laboratory (STAIR Lab), hospedada no GitHub, projetada para gerar automaticamente gráficos de conhecimento a partir de texto arbitrário. Ele usa algoritmos avançados de modelagem e agrupamento de linguagem para obter texto não estruturado...
6 meses atrás
03.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension: extensão de navegador para sincronizar conteúdo gerado por IA com plataformas de autopublicação em um clique

Introdução geral O MultiPost-Extension é uma poderosa extensão de navegador desenvolvida para ajudar os usuários a publicar conteúdo em várias plataformas de mídia social com apenas um clique. A extensão suporta a publicação simultânea em mais de 10 plataformas principais, incluindo Zhihu, Weibo, Xiaohongshu, TikTok ...
6 meses atrás
02.7K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: Modelos de vídeo de código aberto para geração de vídeos de ação humana de alta qualidade

Introdução geral O SkyReels-V1 é um projeto de código aberto desenvolvido pela equipe da SkyworkAI com o objetivo de gerar conteúdo de vídeo de alta qualidade e centrado no ser humano. O projeto é baseado no modelo HunyuanVideo, por meio de dezenas de milhões de filmes e clipes de televisão de alta qualidade de micro...
6 meses atrás
02.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente do assistente inteligente de bate-papo em grupo do WeChat para Windows

Introdução abrangente O WeChatAI é um assistente inteligente pessoal e de bate-papo em grupo do WeChat baseado em Python, que oferece suporte a uma variedade de modelos de linguagem grandes (como DeepSeek, Gemini, Tongyi Thousand Questions), que podem proporcionar diálogo inteligente, resposta automática e outras funções. O projeto usa modelos modernos de ...
6 meses atrás
02.4K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: um mecanismo de recuperação para dados não estruturados e consultas complexas

Introdução geral O dsRAG é um mecanismo de recuperação de alto desempenho projetado para lidar com consultas complexas em dados não estruturados. Ele tem um desempenho particularmente bom com consultas desafiadoras em textos densos, como relatórios financeiros, documentos jurídicos e artigos acadêmicos. O dsRAG emprega três abordagens principais para melhorar o desempenho: linguagem...
6 meses atrás
02.2K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: um transformador autorregressivo de estágio único para geração automática de músicas

Introdução abrangente O SongGen é um modelo transformador autorregressivo de estágio único de código aberto projetado para tarefas de geração de texto para música. O modelo é capaz de gerar músicas com vocais e faixas de apoio a partir da entrada de texto. O SongGen oferece controle refinado sobre uma ampla gama de atributos musicais...
6 meses atrás
02.2K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ferramenta dinâmica de construção e consulta de gráficos de conhecimento (programa de memória longa com reconhecimento de tempo)

Introdução geral O Graphiti é uma ferramenta desenvolvida pela getzep para criar e consultar gráficos de conhecimento dinâmicos e sensíveis ao tempo. Ela é capaz de representar relações complexas e evolutivas entre entidades e consultá-las por meio de uma variedade de métodos, como algoritmos temporais, de texto completo, semânticos e de gráficos.
6 meses atrás
03.8K
Memobase:为AI应用提供基于用户画像的长期记忆方案

Memobase: uma solução de memória de longo prazo baseada no perfil do usuário para aplicativos de IA

Introdução geral O Memobase é um sistema de memória baseado no perfil do usuário, projetado para oferecer suporte à memória duradoura do usuário para aplicativos de IA generativa. Quer esteja criando um companheiro virtual, uma ferramenta educacional ou um assistente personalizado, o Memobase ajuda sua IA a lembrar, entender e crescer com o uso de...
6 meses atrás
02.2K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, compatível com o conjunto de dados SFT de destilação R1 chinês

Introdução abrangente O conjunto de dados chinês de destilação DeepSeek-R1 é um conjunto de dados chinês de código aberto que contém 110 mil dados projetados para dar suporte à pesquisa de aprendizado de máquina e processamento de linguagem natural. O conjunto de dados foi lançado pela equipe de NLP de Cong Liu e contém não apenas dados matemáticos, mas também um grande número de tipos gerais...
6 meses atrás
02.5K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: uma plataforma de agregação de comercialização que integra vários produtos de IA

Introdução abrangente O AIBot PRO é um cliente de agregação de IA baseado em .NET 6, projetado para oferecer aos usuários uma plataforma conveniente para a integração de vários produtos de IA. O cliente oferece suporte ao diálogo de troca sem sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
6 meses atrás
02.3K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Introdução abrangente O ColossalAI é uma plataforma de código aberto desenvolvida pela HPC-AI Technologies, com o objetivo de fornecer uma solução eficiente e econômica para treinamento e inferência de modelos de IA em grande escala. Ao oferecer suporte a várias estratégias paralelas, gerenciamento de memória heterogênea e treinamento de precisão mista, o ColossalAI...
6 meses atrás
01.9K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT: um grande modelo médico para apoiar a análise de imagens médicas e as perguntas e respostas de diagnóstico

Introdução abrangente O HealthGPT é um modelo avançado de linguagem visual médica que visa a obter recursos unificados de geração e compreensão visual médica por meio da adaptação de conhecimento heterogêneo. O objetivo do projeto é integrar os recursos de geração e compreensão visual médica em uma estrutura autorregressiva unificada que aprimora significativamente o gráfico médico...
6 meses atrás
01.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ferramenta de código aberto para extrair o vídeo para especificar o retrato de destino, gerar o vídeo do retrato de destino

Introdução geral O MatAnyone é um projeto de código aberto com foco em codificação de vídeo, desenvolvido e lançado no GitHub por uma equipe de pesquisa do S-Lab, da Universidade Tecnológica de Nanyang, em Cingapura. Ele fornece aos usuários recursos de processamento de vídeo estáveis e eficientes por meio de técnicas de propagação de memória coerente, especialmente...
6 meses atrás
02.5K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool: a caixa de ferramentas dos entusiastas de IA para gerenciar, conectar e usar todos os seus modelos de IA em um único desktop!

General Omnitool.ai é um "laboratório de IA" de código aberto projetado para fornecer um ambiente de desktop extensível baseado em navegador para alunos, amadores e qualquer pessoa interessada nas inovações atuais de IA. Ele permite que os usuários colaborem por meio de uma interface unificada com uma ampla gama de especialistas em IA da OpenAI,...
6 meses atrás
02.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V: um modelo de vídeo de Vincennes que suporta entrada multilíngue e geração de vídeos longos

Introdução abrangente O Step-Video-T2V é um modelo avançado de conversão de texto em vídeo da StepFun AI (StepFun Star). O modelo tem 3 bilhões de parâmetros e é capaz de gerar vídeos de até 204 fps. Com um Variable Auto-Encoder (VAE) profundamente compactado, o modelo...
6 meses atrás
02.3K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: capturas de tela da interface do usuário analisadas em elementos estruturados para facilitar a compreensão e a manipulação de modelos grandes

Introdução geral O OmniParser é uma ferramenta desenvolvida pela Microsoft para analisar as capturas de tela da interface do usuário em elementos estruturados e fáceis de entender. Essa ferramenta melhora significativamente a capacidade do GPT-4V de gerar ações precisas na área de interface correspondente.
6 meses atrás
02.2K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: geração de vídeo baseada em silício para controle de movimento de objetos sólidos em imagens

Introdução geral O DragAnything é um projeto de código aberto que visa a obter o controle de movimento de objetos arbitrários por meio da representação de entidades. O projeto é desenvolvido pela equipe do Showlab e foi aceito pelo ECCV 2024. O DragAnything oferece uma maneira de usar ...
6 meses atrás
02.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: uma estrutura de interação de voz multimodal que reconhece a fala e se comunica usando a fala clonada, entre outros recursos

Introdução abrangente O Step-Audio é uma estrutura de interação de fala inteligente de código aberto projetada para fornecer recursos de geração e compreensão de fala prontos para uso em ambientes de produção. A estrutura oferece suporte a conversas em vários idiomas (por exemplo, chinês, inglês, japonês), discurso emocional (por exemplo, feliz, triste), dialetos regionais (por exemplo, cantonês, sichuanês ...
6 meses atrás
02.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Remoção de marca d'água: ferramenta de remoção de marca d'água de imagem de código aberto, recuperação de marca d'água de imagem original

Introdução geral O Watermark Removal é um projeto de código aberto que usa técnicas de aprendizado de máquina e aprendizado profundo para restauração de imagens, especificamente para remover marcas d'água de imagens. O projeto foi desenvolvido por Chimzuruoke Okafor e é inspirado no Con...
6 meses atrás
03.2K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp: Plataforma de entrevista de voz com IA de código aberto gera perguntas personalizadas para entrevistas e realiza análises inteligentes

Introdução geral O FoloUp é uma plataforma de código aberto projetada para fornecer soluções de entrevista por voz com tecnologia de IA para empresas. Com a FoloUp, as empresas podem gerar rapidamente perguntas de entrevista personalizadas para descrições de cargos e realizar entrevistas naturais de conversação com IA. A plataforma também fornece análise detalhada da entrevista...
5 meses atrás
02.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: assistente de programação Vim nativo orientado por LLM, programação inteligente off-line com segurança

Introdução geral O VimLM é um plug-in do Vim que fornece um assistente de código orientado pelo LLM (Large Language Model) nativo. Ao interagir com o modelo LLM nativo por meio de comandos do Vim, ele obtém automaticamente o contexto do código e ajuda os usuários a editar o código no Vim.
6 meses atrás
02.7K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: uma estrutura para avaliação automatizada de modelos de idiomas grandes, comparando a qualidade do resultado de diferentes palavras-chave de modelos grandes

Introdução abrangente O DeepEval é uma estrutura de avaliação de LLM de código aberto fácil de usar para avaliar e testar grandes sistemas de modelagem de linguagem. Ele é semelhante ao Pytest, mas se concentra em testes de unidade de saída LLM. O DeepEval combina os resultados das pesquisas mais recentes por meio do G-Eval, do phantom...
6 meses atrás
02.8K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formulários de análise de dados on-line que integram diálogo de IA e execução de código

Descrição geral O Quadratic é uma ferramenta de planilha inteligente de código aberto que combina recursos de IA, código e conectividade de dados projetados para fornecer aos usuários recursos avançados de processamento e análise de dados. Ao oferecer suporte a linguagens de programação como Python, SQL e Rust, o Quadratic...
6 meses atrás
02.6K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer: Integrando serviços de síntese de fala ao software de leitura

Introdução geral O TTS Importer é um projeto de código aberto desenvolvido para importar facilmente os serviços de síntese de fala do Azure TTS (Text-to-Speech) para uma variedade de softwares de leitura. A ferramenta é compatível com vários softwares de leitura populares, incluindo o Read (legado...
6 meses atrás
02.2K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: um modelo que oferece suporte à interpretação de papéis e a diálogos complexos, com desempenho superior a 32b (com instalador de um clique)

Introdução abrangente O Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 é um modelo de linguagem eficiente projetado para oferecer suporte a diálogos complexos de interpretação de papéis e de várias rodadas. Profundamente otimizado com base no Qwen 2.5-7B, ele tem excelente geração de texto e diálogo...
6 meses atrás
03.3K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: a inteligência de IA que automatiza as ações do desktop em dispositivos macOS

Introdução geral O mac assistant é um projeto de corpo de inteligência de IA desenvolvido para o macOS, com o objetivo de simplificar as operações do usuário combinando software nativo e recursos da Web. Atualmente, o projeto oferece suporte às APIs OpenAI e GEMINI, e planeja oferecer suporte a futuras ...
6 meses atrás
02.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: gere automaticamente documentos Markdown a partir da estrutura e do conteúdo do código.

Introdução geral O CodeWeaver é uma ferramenta de linha de comando projetada para criar bibliotecas de código em documentos Markdown únicos e fáceis de navegar. Ele gera uma representação estruturada da hierarquia de arquivos de um projeto, examinando recursivamente os diretórios e incorporando o conteúdo de cada arquivo em blocos de código. Essa ferramenta...
6 meses atrás
02.1K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI: uma estrutura de corpo multiinteligente de baixo código para simplificar as soluções de automação para tarefas complexas

Introdução abrangente O PraisonAI é uma estrutura de corpo de inteligência múltipla pronta para uso em ambientes de produção, projetada para criar inteligências de IA para automatizar e resolver problemas que variam de tarefas simples a desafios complexos. A estrutura oferece uma solução de baixo código que simplifica a criação de sistemas LLM de corpo multiinteligente e...
6 meses atrás
03.8K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

Podcast em chinês da HN: coleta automaticamente artigos populares de tecnologia, a IA gera resumos em chinês e os converte em podcasts

Introdução geral O projeto do podcast chinês do Hacker News é uma plataforma inovadora baseada na tecnologia de IA, com o objetivo de obter automaticamente artigos populares do Hacker News todos os dias e gerar resumos em chinês e conteúdo de podcast por meio de IA. O projeto é liderado por ccbikai ...
6 meses atrás
02K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraph Supervisor: uma ferramenta para gerenciar a colaboração de várias inteligências usando inteligências de supervisão

Introdução geral O LangGraph Supervisor é uma biblioteca Python baseada na estrutura LangGraph, projetada para criar e gerenciar sistemas corporais multiinteligentes. A biblioteca coordena o trabalho de vários agentes especializados por meio de um agente de supervisão central, garantindo que os fluxos de comunicação e as tarefas sejam divididos...
6 meses atrás
02.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: projeto de código aberto para pesquisa de inferência profunda usando conhecimento local

Introdução abrangente O Deep Searcher é uma ferramenta avançada que combina modelos de linguagem grande (LLMs) e bancos de dados vetoriais projetados para pesquisar, avaliar e raciocinar com base em dados privados, fornecendo respostas altamente precisas e relatórios abrangentes. Ele é adequado para a gestão de conhecimento empresarial...
6 meses atrás
02.6K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

Deep Research: um assistente de pesquisa profunda baseado em IA que fornece ferramentas de pesquisa eficientes e recursos de geração de relatórios

Introdução geral O Deep Research é um assistente de pesquisa baseado em IA projetado para realizar pesquisas profundas iterativas combinando mecanismos de pesquisa, rastreamento da Web e modelos de linguagem grandes. O projeto foi lançado por dzhng no GitHub com o objetivo de fornecer um gerador de pesquisa profunda fácil de usar...
4 meses atrás
02.2K