Projeto de código aberto de IA

Total de 1020 artigos
Agent S:像人类一样操作电脑的开源智能体框架

Agente S: uma estrutura de código aberto para que corpos inteligentes operem computadores como seres humanos

Introdução geral O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo multimodal de linguagem ampla e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos, usar software...
4 meses atrás
02.1K
BabelDOC:将PDF文档翻译成双语对照的开源工具

BabelDOC: documentos PDF serão traduzidos para ferramentas bilíngues de código aberto

Introdução geral O BabelDOC é uma ferramenta de código aberto projetada para traduzir documentos PDF em um formato bilíngue. Ela foi desenvolvida pela equipe funstory-ai, hospedada no GitHub, atendendo principalmente à necessidade de lidar com usuários de documentos em idiomas estrangeiros, como pesquisadores ...
2 meses atrás
02.2K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice: uma interface gráfica de conversão de texto em fala baseada em APIs de fluxo baseadas em silício

Introdução geral O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ela foi criada pelo desenvolvedor Sheldon Lee no GitHub para permitir...
4 meses atrás
02K
Serena:语义检索和编辑代码的免费MCP工具

Serena: uma ferramenta MCP gratuita para recuperação semântica e edição de código

Introdução geral O Serena é uma ferramenta de programação gratuita e de código aberto desenvolvida pela equipe Oraios AI e hospedada no GitHub. É um assistente de código avançado que funciona diretamente em sua base de código para ajudar os desenvolvedores a analisar, editar e executar o código.
4 meses atrás
04.3K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl: uma ferramenta gratuita para transformar retratos em imagens no estilo Ghibli

Introdução geral O EasyControl é um projeto de código aberto, baseado na arquitetura do transformador de difusão (DiT) para fornecer um controle eficiente e flexível de geração de imagens. Entre eles, o Ghibli Control LoRA é um de seus recursos especiais, pois utiliza apenas 100 subprocessadores...
4 meses atrás
02.8K
YOLOE:实时视频检测和分割物体的开源工具

YOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetos

O YOLOE é um projeto de código aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch, pertence à série YOLO de extensões ...
4 meses atrás
01.9K
集成多种先进语音合成服务的开源运营项目

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala

Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o Ope...
4 meses atrás
01.9K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a compreensão humana do vídeo...
2 meses atrás
02K
SegAnyMo:从视频中自动分割任意运动物体的开源工具

SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos

Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou...
4 meses atrás
02K
GenXD:生成任意3D和4D场景视频的开源框架

GenXD: estrutura de código aberto para gerar vídeos de cenas arbitrárias em 3D e 4D

Introdução geral O GenXD é um projeto de código aberto, desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, para resolver a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto foi desenvolvido pela ...
4 meses atrás
01.9K
ChatAnyone:从照片生成半身数字人肖像视频的工具

ChatAnyone: uma ferramenta para gerar vídeos de retratos humanos digitais de meio corpo a partir de fotografias

Introdução geral O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto baseia-se em um modelo de difusão de movimento hierárquico que gera movimentos da cabeça...
4 meses atrás
02K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: orquestração de tarefas de vários modelos e encapsulamento em uma interface de API

Introdução geral O DeepGemini é um projeto de código aberto criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar de forma flexível uma variedade de modelos de IA e, por meio da compatibilidade com o OpenAI, ...
2 meses atrás
02K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: Compute...
4 meses atrás
02.2K
II-Researcher:深度搜索与分步推理解答复杂问题

II-Researcher: pesquisa profunda e raciocínio por etapas para responder a perguntas complexas

Descrição geral O II-Researcher é uma ferramenta de pesquisa de IA de código aberto desenvolvida pela equipe da Intelligent-Internet e hospedada no GitHub. Ele foi projetado para pesquisa profunda e raciocínio complexo, com a capacidade de pesquisar em páginas da Web inteligentes e sub...
4 meses atrás
01.7K
Paper to Podcast:把学术论文转换为多人对话播客

Paper to Podcast: conversão de artigos acadêmicos em podcasts de conversas com várias pessoas

Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada na transformação de artigos de pesquisa acadêmica em podcasts animados e divertidos. Ela usa tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens - o anfitrião, o aluno e o especialista - para tornar a pesquisa complexa...
4 meses atrás
02K
OmniSQL:将自然语言转化为高质量SQL查询的模型

OmniSQL: um modelo para transformar a linguagem natural em consultas SQL de alta qualidade

Introdução geral O OmniSQL é um projeto de código aberto desenvolvido pela equipe do RUCKBReasoning e hospedado no GitHub. Sua função principal é transformar perguntas de linguagem natural inseridas pelo usuário em instruções de consulta SQL de alta qualidade, para ajudar os usuários a lidar facilmente com o número de ...
4 meses atrás
02K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: uma ferramenta de código aberto para gerar vídeo com sincronização labial diretamente do áudio

Introdução geral O LatentSync é uma ferramenta de código aberto desenvolvida pela ByteDance e hospedada no GitHub. Ela aciona os movimentos labiais dos personagens em um vídeo diretamente pelo áudio, de modo que o formato da boca corresponda precisamente à voz. O projeto é baseado no Stable Di...
2 meses atrás
03.7K
VirtualWife:支持B站直播和语音互动的二次元数字人

VirtualWife: uma pessoa digital secundária que suporta a transmissão ao vivo da estação B e a interação por voz

O VirtualWife é um projeto de pessoa digital virtual de código aberto criado pelo desenvolvedor yakami129. Atualmente, está em fase de incubação. O objetivo é criar um personagem virtual com uma "alma", com o qual o usuário possa interagir como um amigo. O projeto é apoiado pela B Station Live...
4 meses atrás
02.2K
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês

Introdução abrangente O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em cooperação com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de discursos mistos em chinês e inglês e a clonagem de discursos. O projeto está hospedado em ...
4 meses atrás
02.3K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandes

O KBLaM é um projeto de código aberto desenvolvido pela Microsoft, cujo nome completo é "Knowledge Base augmented Language Model" (Modelo de linguagem aumentada da base de conhecimento). É por meio da conversão de conhecimento externo em vetores e incorporado em um grande modelo de ...
4 meses atrás
02.2K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: uma ferramenta de código aberto para completar todo o processo de pesquisa científica com agentes inteligentes

Introdução geral O AgentLaboratory é uma ferramenta de código aberto hospedada no GitHub e desenvolvida por Samuel Schmidgall. Ela usa agentes inteligentes orientados pelo Modelo de Linguagem Grande (LLM) para ajudar os pesquisadores com todo o processo de...
5 meses atrás
02K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: uma ferramenta de código aberto para conexão e gerenciamento flexíveis de inteligências de IA

Introdução geral O AgentIQ é uma ferramenta de código aberto da NVIDIA projetada para ajudar os desenvolvedores a conectar e gerenciar eficientemente as inteligências de IA. Ela permite que inteligências de diferentes estruturas colaborem perfeitamente, conectem dados e ferramentas empresariais e criem fluxos de trabalho como funções de chamada. O maior destaque da ferramenta...
5 meses atrás
01.8K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具

MIDI-3D: uma ferramenta de código aberto para gerar rapidamente cenas 3D com vários objetos a partir de uma única imagem

Introdução geral O MIDI-3D é um projeto de código aberto desenvolvido pela equipe do VAST-AI-Research para gerar rapidamente cenas 3D contendo vários objetos a partir de uma única imagem para desenvolvedores, pesquisadores e criadores. Essa ferramenta é baseada na técnica de modelagem de difusão de várias instâncias...
5 meses atrás
02.4K
TripoSF:快速生成高分辨率3D模型的实用工具

TripoSF: uma ferramenta prática para a geração rápida de modelos 3D de alta resolução

Introdução geral O TripoSF é um projeto de código aberto criado pela equipe do VAST-AI-Research, projetado especificamente para gerar rapidamente modelos 3D de alta resolução a partir de uma única imagem. Ele usa uma tecnologia chamada SparseFlex, de alta eficiência de processamento, que pode ser ...
5 meses atrás
01.9K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: geração de ativos digitais modelados em 3D de alta resolução a partir de uma única imagem

Introdução geral O TripoSG é um projeto de código aberto desenvolvido pela equipe de pesquisa VAST AI para gerar modelos 3D de alta qualidade a partir de uma única imagem. O projeto usa tecnologia de conversor de fluxo retificador em grande escala, combinada com treinamento supervisionado híbrido e conjuntos de dados de alta qualidade, para permitir que os modelos 3D gerados tenham...
5 meses atrás
02K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: ferramenta API para acesso gratuito aos resultados de pesquisa do Google em tempo real

Introdução geral O Free-Search é uma ferramenta de API de código aberto desenvolvida por Hanzla Javaid e hospedada no GitHub. Sua principal função é fornecer resultados de pesquisa do Google em tempo real por meio de um mecanismo de pesquisa personalizado e rastrear o conteúdo da Web para retornar resultados...
5 meses atrás
01.4K
OpenDeepSearch:支持智能推理的开源搜索工具

OpenDeepSearch: uma ferramenta de pesquisa de código aberto que suporta raciocínio inteligente

Introdução geral O OpenDeepSearch é uma ferramenta de pesquisa de código aberto desenvolvida pela equipe sentient-agi. Ela combina Large Language Modelling (LLM) e Intelligent Reasoning Agents para permitir que os usuários pesquisem informações em páginas da Web e obtenham respostas precisas de forma simples. Esse ...
5 meses atrás
02.1K
Vibe Draw:将手绘草图转化为3D模型的创意工具

Vibe Draw: uma ferramenta criativa para transformar esboços desenhados à mão em modelos 3D

Introdução geral O Vibe Draw é um projeto de código aberto, desenvolvido por Martin Sit, que permite aos usuários transformar esboços desenhados à mão em belos modelos 3D. O objetivo dessa ferramenta é simples: facilitar a modelagem em 3D para qualquer pessoa, sem a necessidade de grandes habilidades artísticas ou de re...
5 meses atrás
02.2K
FlowGram.AI:快速创建节点式工作流的开源引擎

FlowGram.AI: um mecanismo de código aberto para a criação rápida de fluxos de trabalho nodais

Introdução abrangente O Flowgram.ai é um mecanismo de criação de processos de código aberto desenvolvido pela ByteDance. Ele se baseia na edição de nós, para ajudar os desenvolvedores a criar fluxos de trabalho rapidamente, com suporte para layout fixo e dois modos de vinculação livre. O projeto foi escrito em TypeScript ...
5 meses atrás
02.6K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型

Qwen2.5-Omni: um modelo de medição final para entrada multimodal e interação de fala em tempo real

Introdução abrangente O Qwen2.5-Omni é um modelo de IA multimodal de código aberto desenvolvido pela equipe do Alibaba Cloud Qwen. Ele pode processar várias entradas, como texto, imagens, áudio e vídeo, e gerar respostas em texto ou fala natural em tempo real. O modelo foi lançado em 2025 em 3 de ...
5 meses atrás
02.8K
Dify-Plus:为Dify开发的企业内部管理后台

Dify-Plus: um back-end de gerenciamento no local para a Dify

Introdução abrangente O Dify-Plus é uma plataforma de desenvolvimento de aplicativos de IA baseada no desenvolvimento secundário do projeto de código aberto Dify. Ele adiciona um novo centro de gerenciamento baseado no Dify e otimiza a funcionalidade para cenários corporativos. O projeto era inicialmente para uso interno das empresas, mas depois descobriu que a comunidade tinha necessidades semelhantes...
5 meses atrás
01.7K
Rankify:支持信息检索与重排序的Python工具包

Rankify: um kit de ferramentas Python que oferece suporte à recuperação e reordenação de informações

Introdução geral O Rankify é um kit de ferramentas Python de código aberto desenvolvido pelo Data Science Group da Universidade de Innsbruck, na Áustria. Ele se concentra na recuperação de informações, reordenação e geração de aumento de recuperação (RAG), fornecendo uma estrutura unificada. O kit de ferramentas vem com 40 benchmarks integrados pré-obtidos...
5 meses atrás
02.5K
CFG-Zero-star:提升图像和视频生成质量的开源工具

CFG-Zero-star: uma ferramenta de código aberto para melhorar a qualidade da geração de imagens e vídeos

Introdução abrangente O CFG-Zero-star é um projeto de código aberto desenvolvido por Weichen Fan e pela equipe do S-Lab da Universidade Tecnológica de Nanyang. Ele se concentra no aprimoramento da técnica CFG (Classifier Free Guidance) em modelos de correspondência de fluxo por meio da otimização da estratégia de orientação e do zero-inicial ...
5 meses atrás
02.2K
Motia:用代码快速构建智能体的开发框架

Motia: uma estrutura de desenvolvimento para a criação rápida de inteligências em código

Introdução geral O Motia é uma estrutura de agente de IA de código aberto para engenheiros de software, hospedada no GitHub e desenvolvida pela equipe do MotiaDev. Ele permite que os desenvolvedores usem linguagens de programação conhecidas (por exemplo, Python, TypeScript, Rub...
5 meses atrás
02.3K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎

DiffSynth-Engine: Mecanismo de código aberto para baixa implantação existente do FLUX, Wan 2.1

Introdução geral O DiffSynth-Engine é um projeto de código aberto lançado pela ModelScope, hospedado no GitHub. Ele se baseia na tecnologia de modelagem de difusão, concentra-se na geração eficiente de imagens e vídeos e é adequado para que os desenvolvedores implantem modelos de IA em ambientes de produção...
5 meses atrás
02.4K
RF-DETR:实时视觉对象检测开源模型

RF-DETR: um modelo de código aberto para detecção de objetos visuais em tempo real

Introdução abrangente O RF-DETR é um modelo de detecção de objetos de código aberto desenvolvido pela equipe do Roboflow. Ele se baseia na arquitetura Transformer e seu principal recurso é a eficiência em tempo real. Pela primeira vez, o modelo atinge mais de 60 APs em tempo real no conjunto de dados Microsoft COCO...
5 meses atrás
02.7K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: uma ferramenta de código aberto para facilitar a implantação de modelos de IA multimodais

Introdução geral O Aana SDK é uma estrutura de código aberto desenvolvida pela Mobius Labs, batizada com o nome da palavra malaiala ആന (elefante). Ele ajuda os desenvolvedores a implementar e gerenciar rapidamente modelos de IA multimodais, oferecendo suporte ao processamento de texto, imagens, áudio e vídeo e outros dados...
5 meses atrás
02.7K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agente TARS: uma inteligência de código aberto que usa visão e comandos para operar computadores

Introdução abrangente O agente TARS é uma inteligência de IA multimodal de código aberto da ByteDance, com recursos principais que ajudam os usuários a realizar tarefas complexas no computador, compreendendo visualmente o conteúdo da Web e combinando operações de linha de comando e sistema de arquivos. Em vez de exigir operações manuais como as ferramentas tradicionais, ele pode se...
5 meses atrás
02.2K
Qlib:微软开发的AI量化投资研究工具

Qlib: uma ferramenta de pesquisa de investimento quantitativo de IA desenvolvida pela Microsoft

Introdução abrangente O Qlib é uma plataforma de código aberto desenvolvida pela Microsoft que se concentra no uso da tecnologia de IA para ajudar os usuários a pesquisar investimentos quantitativos. Ela começa com o processamento de dados mais básico e ajuda os usuários a explorar ideias de investimento e transformá-las em estratégias utilizáveis. A plataforma é simples e fácil de usar e é adequada para aqueles que desejam usar o aprendizado de máquina para aprimorar suas pesquisas de investimento...
5 meses atrás
02.8K
Oliva:语音控制的多智能体产品搜索助手

Oliva: um assistente de pesquisa de produtos com inteligência múltipla controlado por voz

Introdução geral O Oliva é uma ferramenta de assistente de inteligência múltipla de código aberto desenvolvida pela Deluxer no GitHub. Ela ajuda os usuários a pesquisar informações sobre produtos no banco de dados Qdrant por meio da colaboração de várias inteligências de IA. O principal recurso é que ele oferece suporte à operação por voz...
5 meses atrás
02K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e está hospedada no GitHub para usuários que gostam de organizar seus livros eletrônicos. A ferramenta funciona por meio desta ...
5 meses atrás
02.5K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou: uma ferramenta de geração e edição de fotos que preserva as características faciais

Introdução geral O InfiniteYou é um projeto de código aberto desenvolvido pela equipe da ByteDance Intelligent Creation. Ele se baseia na tecnologia Diffusion Transformers (DiTs), usando o modelo FLUX.1-dev. A função principal é permitir que os usuários carreguem uma foto e insiram uma descrição de texto, gerando...
5 meses atrás
02.1K
Grok-Mirror:一键部署可盈利的Grok镜像站

Grok-Mirror: implantação com um clique de sites espelho lucrativos do Grok

Introdução abrangente O Grok-Mirror é uma estação de espelho doméstica Grok3 de implantação rápida sem servidor, baseada na construção de uma estação de espelho Grok operável. Ele permite que os usuários implementem quiosques Grok locais com um clique via Docker.Grok é uma inteligência artificial da xAI...
5 meses atrás
02.1K
Second Me:本地训练拥有个人记忆和习惯的AI分身

Second Me: doppelgangers de IA treinados localmente com memórias e hábitos pessoais

O Second Me é um projeto de código aberto desenvolvido pela equipe do Mindverse que permite criar uma IA em seu computador que atua como um "sósia digital", aprendendo seus padrões e hábitos de fala por meio de suas palavras e memórias e tornando-se uma pessoa inteligente que entende suas...
5 meses atrás
02.8K
StarVector:从图像和文字生成SVG矢量图的基础模型

StarVector: um modelo básico para gerar gráficos vetoriais SVG a partir de imagens e texto

Introdução geral O StarVector é um projeto de código aberto criado por desenvolvedores como Juan A. Rodriguez para converter imagens e textos em SVG (Scalable Vector Graphics, gráficos vetoriais escaláveis). Essa ferramenta usa um modelo de linguagem visual para entender o conteúdo da imagem e do texto...
5 meses atrás
02.1K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: uma ferramenta fácil para criar grandes conjuntos de dados com ajuste fino de modelos

Introdução abrangente O Easy Dataset é uma ferramenta de código aberto projetada especificamente para o ajuste fino de modelos grandes (LLMs), hospedada no GitHub. Ela oferece uma interface fácil de usar que permite que os usuários carreguem arquivos, segmentem automaticamente o conteúdo, gerem perguntas e respostas e, por fim, produzam um modelo adequado...
5 meses atrás
02.3K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型

Skywork-R1V: um modelo de raciocínio multimodal híbrido gráfico de código aberto por Kunlun Wanwen

Introdução geral O Skywork-R1V é um modelo de raciocínio multimodal de código aberto desenvolvido pela equipe do SkyworkAI (Kunlun Wanwei) e publicado no GitHub. Ele é capaz de processar imagens e textos simultaneamente, realizar raciocínio lógico em várias etapas e é particularmente bom na análise de problemas complexos de imagens. Esse...
5 meses atrás
01.9K
AI Logo:AI快速生成定制化品牌Logo

Logotipo da IA: a IA gera rapidamente logotipos de marca personalizados

Introdução geral O AI Logo é um projeto de aplicativo de IA de código aberto com o objetivo de ajudar os usuários a gerar rapidamente logotipos de marcas personalizados por meio de inteligência artificial. Ele combina técnicas avançadas de IA, como Stable Diffusion e DeepAI, para permitir que os usuários insiram logotipos simples de marcas...
5 meses atrás
01.8K
Docs:开源的协作笔记和文档管理工具

Docs: notas colaborativas de código aberto e ferramentas de gerenciamento de documentos

Introdução geral O Docs é uma plataforma de código aberto para anotações colaborativas e gerenciamento de documentos desenvolvida pela equipe suitenumerique. Ela foi criada usando as tecnologias Django e React com o objetivo de fornecer uma ferramenta fácil de usar para ajudar os usuários a fazer anotações, gerenciar...
5 meses atrás
02.5K
SmartRead:自动标注技术PDF文档并提供相关引用源

SmartRead: Anote automaticamente documentos técnicos em PDF e forneça citações relevantes

Introdução abrangente O SmartRead é uma ferramenta de código aberto baseada em IA projetada para documentos técnicos. Ele pode analisar automaticamente arquivos PDF e marcar o conteúdo principal, como termos importantes, títulos ou ideias centrais, para ajudar os usuários a entender rapidamente documentos complexos. Ao mesmo tempo, ele também pode fornecer e documentar os principais...
5 meses atrás
02.5K
Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具

Hunyuan3D-2: ferramenta de geração de modelos 3D de alta resolução de código aberto da Tencent

Introdução geral O Hunyuan3D-2 é um projeto de código aberto desenvolvido pela Tencent para gerar modelos 3D de alta resolução a partir de texto ou imagens. Ele consiste em dois componentes principais: modelo de geração de forma (Hunyuan3D-DiT) e modelo de geração de textura (Hunyuan3D...
5 meses atrás
01.8K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: uma estrutura de automação de IA de código aberto que oferece suporte à colaboração com várias inteligências

Introdução geral O LangManus é uma estrutura de automação de IA de código aberto hospedada no GitHub. Desenvolvido por um grupo de ex-colegas em seu tempo livre, é um projeto acadêmico com o objetivo de combinar modelos de linguagem e ferramentas especializadas para pesquisa na Web, rastreamento de dados e execução de código...
5 meses atrás
02.2K
闲鱼卖家全天自动值守的AI客服机器人

Bots de atendimento ao cliente com IA que são automaticamente operados por vendedores da Idle Fish 24 horas por dia

Introdução abrangente O XianyuAutoAgent é um sistema de robô inteligente de atendimento ao cliente projetado para a plataforma Idlefish, de código aberto pelo desenvolvedor shaxiu no GitHub. Ele usa a tecnologia de IA para realizar um serviço automático de 7×24 horas para ajudar os vendedores de peixe ocioso a responder...
5 meses atrás
02K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: um projeto de código aberto para criar aplicativos de inteligência múltipla de nível empresarial

Introdução geral O PilottAI é uma estrutura Python de código aberto hospedada no GitHub e criada pelo desenvolvedor anuj0456. Ele se concentra em ajudar os usuários a criar sistemas corporais multiinteligentes de classe empresarial, oferece suporte à integração do Modelo de Linguagem Grande (LLM), fornece qualquer...
5 meses atrás
01.7K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni: um macromodelo multimodal para análise de emoções e ações em vídeos humanos

Introdução geral O HumanOmni é um grande modelo multimodal de código aberto desenvolvido pela equipe HumanMLLM e hospedado no GitHub. Ele se concentra na análise de vídeos humanos e pode processar imagens e sons para ajudar a entender emoções, ações e conteúdo de diálogos. O projeto usou 2...
5 meses atrás
01.9K
TxAgent:帮医生分析药物作用和治疗方案的AI工具

TxAgent: uma ferramenta de IA para ajudar os médicos a analisar os efeitos dos medicamentos e as opções de tratamento

Introdução abrangente O TxAgent é uma ferramenta de IA de código aberto desenvolvida pela Equipe de Inteligência Artificial Médica e Científica (MIMS) da Universidade de Harvard para ajudar os médicos a analisar interações medicamentosas e desenvolver planos de tratamento personalizados. Ele combina situações específicas do paciente por meio de raciocínio em várias etapas e recuperação em tempo real de conhecimento biomédico...
5 meses atrás
01.9K
OpenSearch-SQL:将自然语言转为SQL查询的开源工具

OpenSearch-SQL: uma ferramenta de código aberto para transformar linguagem natural em consultas SQL

Introdução abrangente O OpenSearch-SQL é um projeto de código aberto, uma ferramenta poderosa de conversão de texto em SQL que pode transformar as descrições de linguagem natural do usuário em instruções de consulta SQL, para ajudar as pessoas que não estão familiarizadas com o banco de dados a acessar facilmente os dados. Esse projeto foi desenvolvido pela O...
5 meses atrás
02.2K
Moffee:将Markdown转为PPT幻灯片

Moffee: Converter Markdown em apresentação de slides PPT

Introdução geral O Moffee é uma ferramenta de código aberto que transforma arquivos Markdown em apresentações de slides profissionais de forma rápida, simples e eficiente. Os usuários só precisam escrever o conteúdo do Markdown, e a Moffee pode lidar automaticamente com o layout, a paginação e o estilo, eliminando a necessidade de digitar manualmente...
4 meses atrás
01.8K