Projeto de código aberto de IA

Total de 1020 artigos
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e fornece uma interface gráfica de usuário intuitiva e fácil de usar (G...
8 meses atrás
02.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução abrangente O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem ampla (LLMs). Ela verifica o modelo quanto a vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo prejudicial etc., por meio de sondagem estática, dinâmica e adaptativa...
9 meses atrás
02.7K
Coding Agent:基于Langgraph构建的简单编程助手

Coding Agent: um assistente de programação simples baseado em Langgraph

Introdução geral O Coding Agent é um assistente de programação inteligente desenvolvido por AbhinavTheDev, projetado para ajudar os desenvolvedores a melhorar sua eficiência de programação. A ferramenta usa tecnologia de inteligência artificial para gerar código automaticamente, fornecer sugestões de programação e ajudar os desenvolvedores com vários códigos...
7 meses atrás
02.7K
AIEvo:创建多智能体协作应用的高效框架

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos multiinteligentes

Introdução geral AIEvo é a estrutura multiagente de código aberto do Ant Group, projetada para criar aplicativos multiagentes com eficiência. A estrutura segue rigorosamente o gráfico de tarefas SOP para melhorar a taxa de sucesso da execução de tarefas complexas e garante alta flexibilidade e escalabilidade por meio de mecanismos de feedback e monitoramento.
7 meses atrás
02.7K
MangaNinjia:自动化线稿上色工具,为动漫黑白线稿快速填色

MangaNinjia: uma ferramenta automatizada de coloração de linhas para colorir rapidamente desenhos de anime em preto e branco.

Introdução abrangente O MangaNinjia é um projeto de código aberto desenvolvido pelo Alibaba Tongyi Visual Intelligence Lab (Ali-Vilab), com foco no processamento automatizado de coloração de desenhos de linha. Essa ferramenta consegue a correspondência precisa de cores de imagens de referência por meio de técnicas de aprendizagem profunda, melhorando muito...
7 meses atrás
02.7K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

Conjunto de dados de destilação DeepSeek-R1 de sangue puro baseado na China, compatível com o conjunto de dados SFT de destilação R1 chinês

Introdução abrangente O conjunto de dados chinês de destilação DeepSeek-R1 é um conjunto de dados chinês de código aberto que contém 110 mil dados projetados para dar suporte à pesquisa de aprendizado de máquina e processamento de linguagem natural. O conjunto de dados foi lançado pela equipe de NLP de Cong Liu e contém não apenas dados matemáticos, mas também um grande número de tipos gerais...
6 meses atrás
02.7K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: documentos digitalizados em PDF para ferramentas de código aberto Markdown

Introdução geral O PDF Craft é uma ferramenta de código aberto projetada para digitalizar PDFs de livros e convertê-los para o formato Markdown. Ela foi desenvolvida pelo oomol-lab e está hospedada no GitHub para usuários que gostam de organizar seus livros eletrônicos. A ferramenta funciona por meio desta ...
5 meses atrás
02.7K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: cliente do assistente inteligente de bate-papo em grupo do WeChat para Windows

Introdução abrangente O WeChatAI é um assistente inteligente pessoal e de bate-papo em grupo do WeChat baseado em Python, que oferece suporte a uma variedade de modelos de linguagem grandes (como DeepSeek, Gemini, Tongyi Thousand Questions), que podem proporcionar diálogo inteligente, resposta automática e outras funções. O projeto usa modelos modernos de ...
6 meses atrás
02.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: um cliente de visualização de fluxo de trabalho para modelos de IA com base na orquestração de nós

Introdução geral O NodeTool é uma plataforma inovadora de criação de IA projetada para fornecer uma interface simples e intuitiva para entusiastas de IA, desenvolvedores, cientistas de dados e criativos. Seja você um artista, desenvolvedor ou iniciante, o NodeTool o ajuda a criar protótipos criativos rapidamente...
8 meses atrás
02.7K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: um kit de ferramentas de código aberto para conectar inteligências de IA ao protocolo Solana

Introdução geral O Solana Agent Kit é um kit de ferramentas de código aberto projetado para conectar perfeitamente as inteligências de IA ao protocolo de blockchain Solana. O kit permite que tanto os pesquisadores de IA quanto os desenvolvedores de criptomoedas usem qualquer corpo inteligente treinado por modelo para realizar mais de...
6 meses atrás
02.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev: upload de wireframes para gerar código de front-end com base no Llama4

Introdução geral O Napkins.dev é um projeto de código aberto gratuito, cuja função principal é permitir que os usuários carreguem capturas de tela ou wireframes da interface para gerar automaticamente um código de front-end executável. Os usuários só precisam fornecer um desenho de projeto, a ferramenta será feita por meio do modelo Llama 4 (por Together ...
4 meses atrás
02.7K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAI Agents SDK: uma estrutura Python para criar fluxos de trabalho colaborativos de inteligência múltipla

Introdução geral O OpenAI Agents SDK é uma ferramenta de desenvolvimento leve da OpenAI projetada para criar fluxos de trabalho com várias inteligências. Ele é baseado em Python e é fácil de usar, permitindo que os desenvolvedores configurem agentes, cortem tarefas...
5 meses atrás
02.7K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Editor WeChat Markdown: ferramentas simples e eficientes de layout gráfico do WeChat, uma chave para colar o artigo no número público do WeChat

Introdução abrangente O WeChat Markdown Editor (WeChat Markdown Editor) é uma ferramenta de layout gráfico do WeChat altamente concisa, projetada para ajudar os usuários a criar facilmente belas postagens no WeChat. O editor é compatível com todos os recursos básicos do Markdown ...
7 meses atrás
02.7K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: um mecanismo de recuperação para dados não estruturados e consultas complexas

Introdução geral O dsRAG é um mecanismo de recuperação de alto desempenho projetado para lidar com consultas complexas em dados não estruturados. Ele tem um desempenho particularmente bom com consultas desafiadoras em textos densos, como relatórios financeiros, documentos jurídicos e artigos acadêmicos. O dsRAG emprega três abordagens principais para melhorar o desempenho: linguagem...
6 meses atrás
02.7K
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: recupere o conteúdo e resuma o conhecimento de documentos maciços e de várias fontes

Introdução abrangente O wdoc é um poderoso sistema RAG (Retrieval Augmentation Generation) projetado para processar e analisar grandes quantidades de documentos diversos. Ele é capaz de recuperar uma grande variedade de tipos de documentos, incluindo PDFs, páginas da Web, vídeos do YouTube, arquivos de áudio etc. O wdoc é especialmente adequado para processar...
6 meses atrás
02.7K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号

TrendPublish: rastreie e resuma notícias de IA em tempo real e publique-as automaticamente no WeChat

Introdução geral ai-trend-publish é um projeto de código-fonte aberto hospedado no GitHub, desenvolvido pela equipe do OpenAISpace, focado no rastreamento e na publicação das últimas tendências em inteligência artificial em tempo real. Essa ferramenta foi projetada para ajudar desenvolvedores, amadores de tecnologia...
5 meses atrás
02.7K
Agno:构建具备记忆、知识和工具的多模态智能体框架

Agno: uma estrutura para a criação de inteligências multimodais com memória, conhecimento e ferramentas

Introdução geral Agno é uma biblioteca Python de código aberto desenvolvida pela equipe agno-agi e hospedada no GitHub, dedicada a facilitar aos desenvolvedores a criação de inteligências de IA com memória, conhecimento e ferramentas. Ela é compatível com texto multimodal, imagem, áudio e vídeo...
5 meses atrás
02.6K
CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

Introdução geral A CodeArena é uma plataforma exclusiva projetada para apresentar os melhores modelos de geração de código-fonte aberto (LLMs) por meio de confrontos em tempo real. Os usuários podem assistir a diferentes LLMs competindo nas mesmas tarefas de programação e ver os modelos com melhor desempenho por meio de tabelas de classificação em tempo real. A plataforma utiliza o Tog...
8 meses atrás
02.6K
Anon-Kode:命令行AI代码助手(Claude Code代码反编译)

Anon-Kode: assistente de código de IA de linha de comando (decompilação de código do Claude Code)

Introdução geral O Anon-Kode é um assistente de código de IA de código aberto para operações baseadas em terminal, lançado no GitHub pelo desenvolvedor Daniel Nakov. Ele foi projetado para que os programadores ofereçam suporte a APIs no estilo OpenAI, integrando modelos de linguagem que suportam...
5 meses atrás
02.6K
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: ferramenta de gerenciamento de linha de comando do YouTube, acesso à IA para automatizar totalmente os canais do YouTube

Introdução geral O Yutu é uma poderosa ferramenta de linha de comando de código aberto projetada para usuários do YouTube, hospedada no GitHub e desenvolvida pela equipe eat-pray-ai. Ele opera por meio do terminal para obter os vídeos do YouTube, as listas de reprodução, a frequência...
5 meses atrás
02.6K
CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率

CHRONOS: Ferramenta de resumo da linha do tempo de notícias para melhorar a eficiência da recuperação de notícias e da geração de linhas do tempo

Introdução geral O CHRONOS é uma ferramenta de resumo da linha do tempo de notícias desenvolvida pela equipe de NLP da Alibaba. A ferramenta gera resumos de linhas do tempo de eventos de notícias por meio de autoquestionamento iterativo. O CHRONOS não só é capaz de lidar com tarefas de resumo de linhas do tempo de domínio aberto, mas também em termos de eficiência e escalabilidade...
7 meses atrás
02.6K
Audibit:将热门科技文章转为随时收听的音频播客

Audibit: transformando artigos populares de tecnologia em podcasts de áudio prontos para serem ouvidos

Introdução geral O Audibit é um projeto de código aberto, cuja função principal é transformar automaticamente os artigos do Hacker News, TechCrunch e outros artigos populares sobre tecnologia em podcasts de áudio, para que os usuários possam ouvir informações pela Web ou por dispositivos móveis durante o trajeto para o trabalho, o exercício físico ou quando estiverem ocupados. O projeto faz ...
3 meses atrás
02.6K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: serviços MCP para controle de software CAD por meio de comandos de linguagem natural

Introdução geral O CAD-MCP é um projeto de código aberto que permite aos usuários controlar o software CAD por meio de comandos de linguagem natural para operações de desenho. Ele combina processamento de linguagem natural e tecnologia de automação de CAD, de modo que os usuários não precisam operar manualmente a interface de CAD, basta inserir comandos de texto simples que ...
3 meses atrás
02.6K
InternVL:开源多模态大模型,支持图像、视频和文本处理

InternVL: grandes modelos multimodais de código aberto para processamento de imagens, vídeos e textos

Introdução abrangente O InternVL é um grande projeto de modelo multimodal de código aberto desenvolvido pelo Shanghai Artificial Intelligence Lab (OpenGVLab) e hospedado no GitHub. Ele integra recursos de processamento visual e linguístico para apoiar a compreensão e a geração abrangentes de imagens, vídeos e textos.
4 meses atrás
02.6K
ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量

ColorFlow: sombreamento de desenhos animados, sombreamento automático de imagens em preto e branco para melhorar a consistência e a qualidade da cor da imagem

Introdução abrangente O ColorFlow é uma ferramenta de coloração automática de sequências de imagens desenvolvida pela equipe do Tencent ARC para resolver o problema de coloração automática de sequências de imagens em preto e branco. A ferramenta usa um pipeline de sombreamento aprimorado por recuperação para gerar com precisão as cores de vários elementos por meio de um conjunto de imagens de referência, incluindo cores de cabelo de personagens e serviços...
8 meses atrás
02.6K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: habilite qualquer LLM para automatizar as operações do Android e do PC

Introdução geral O ClickClickClick é uma estrutura desenvolvida pelo BandarLabs que visa automatizar as operações do Android e do PC usando qualquer modelo de linguagem grande (LLM) local ou remoto. Atualmente, o projeto está em uma fase altamente experimental e oferece suporte a uma variedade de modelos, como...
8 meses atrás
02.6K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: experimente um editor de código com tecnologia de IA, transforme cada conversa em um commit do Git!

Introdução geral O Melty é um editor de código de IA revolucionário que combina conversas de bate-papo com o controle de versão do Git. Desenvolvida por Charlie e Jackson da Replicate, essa ferramenta tem como objetivo resolver os pontos problemáticos das ferramentas tradicionais de codificação de IA. Seu maior ...
7 meses atrás
02.6K
AnimatedDrawings:儿童手绘涂鸦转换动画,自动化儿童绘画动画生成工具

AnimatedDrawings: rabiscos infantis desenhados à mão convertidos em animação, ferramenta automatizada de geração de animação de desenhos infantis

Introdução geral O AnimatedDrawings é um projeto de código aberto desenvolvido pelo Facebook Research para transformar desenhos de crianças em personagens animados por meio de técnicas de automação. O projeto é baseado no artigo "A Method for A...
8 meses atrás
02.6K
ChatFree(ChatAnywhere-2):使用GPT API创建的本地Copilot,支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): copiloto nativo criado usando a API GPT, com suporte para diálogos complementares em qualquer janela.

Introdução geral O ChatFree é um projeto de código aberto que visa a liberar os aplicativos de IA dos usuários das restrições dos navegadores para serem executados localmente. Criado usando a API GPT, o Copilot foi projetado para oferecer suporte a uma ampla variedade de softwares de escritório, como Office, Word, WPS e outros. O projeto foi desenvolvido por ...
8 meses atrás
02.6K
Easy Dataset:创建大模型微调数据集的简易工具

Easy Dataset: uma ferramenta fácil para criar grandes conjuntos de dados com ajuste fino de modelos

Introdução abrangente O Easy Dataset é uma ferramenta de código aberto projetada especificamente para o ajuste fino de modelos grandes (LLMs), hospedada no GitHub. Ela oferece uma interface fácil de usar que permite que os usuários carreguem arquivos, segmentem automaticamente o conteúdo, gerem perguntas e respostas e, por fim, produzam um modelo adequado...
5 meses atrás
02.6K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO: uma plataforma de agregação de comercialização que integra vários produtos de IA

Introdução abrangente O AIBot PRO é um cliente de agregação de IA baseado em .NET 6, projetado para oferecer aos usuários uma plataforma conveniente para a integração de vários produtos de IA. O cliente oferece suporte ao diálogo de troca sem sentido e integra ChatGPT, Gemini, Claude, Wenxin Yiyin...
6 meses atrás
02.6K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: geração de vídeos com controle preciso da postura humana, criando damas dançantes

Introdução geral O DisPose é um projeto inovador de inteligência artificial de código aberto voltado para a geração controlada de animação de imagens de personagens. Desenvolvido por uma equipe de pesquisadores e com código aberto no GitHub, o projeto usa técnicas avançadas de aprendizagem profunda para obter um controle preciso da animação de personagens decompondo as informações de pose do esqueleto.
8 meses atrás
02.6K
Gemini Next Chat:一键免费部署您的私人多模态Gemini应用

Gemini Next Chat: Implemente seu aplicativo Gemini multimodal privado gratuitamente com um clique!

Introdução geral O Gemini Next Chat é um projeto de código aberto criado para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implantá-lo com um clique no Vercel...
7 meses atrás
02.6K
RooFlow:基于 Roo Code 扩展的记忆增强系统

RooFlow: um sistema de aprimoramento de memória baseado na extensão de código Roo

Introdução abrangente O RooFlow é uma ferramenta de programação assistida por IA de código aberto com a funcionalidade principal de preservar o código, as decisões e o progresso das tarefas durante o desenvolvimento por meio do registro de projetos. Ele se baseia na extensão Roo Code e integra cinco modos: arquitetura, codificação, teste, depuração e perguntas e respostas. Esses modos interagem...
4 meses atrás
02.6K
Basic Memory:从AI对话中构建持久知识图谱的MCP服务

Memória básica: um serviço MCP para criar gráficos de conhecimento persistentes a partir de conversas de IA

Introdução geral O Basic Memory é uma ferramenta para criar gráficos de conhecimento por meio de conversas com assistentes de IA, como o Claude. Ela foi desenvolvida pela Basic Machines e seu principal recurso é salvar o conteúdo do diálogo como um arquivo Markdown, salvar...
5 meses atrás
02.6K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a compreensão humana do vídeo...
2 meses atrás
02.6K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: Transforme seus repositórios do GitHub em podcasts e ouça as atualizações de código a qualquer hora, em qualquer lugar!

Introdução geral O GitPodcast é uma ferramenta inovadora projetada para transformar os repositórios do GitHub em podcasts, permitindo que os desenvolvedores ouçam as atualizações de código a qualquer momento e em qualquer lugar. Usando o OpenAI e o Azure Speech SDK, o GitPodca...
7 meses atrás
02.6K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: ferramenta especial para converter arquivos PPTX em Markdown

Introdução geral O PPTX2MD é uma ferramenta de código aberto projetada para converter arquivos PPTX do PowerPoint para o formato Markdown. Desenvolvida pelo usuário ssine do GitHub, a ferramenta suporta a preservação de títulos, listas, formatação de texto (por exemplo, negrito, itálico, cores e super...
6 meses atrás
02.6K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open: geração automatizada de documentação de IA para repositórios do GitHub e do GitLab

Introdução abrangente O DeepWiki-Open é um projeto de código aberto desenvolvido para gerar automaticamente documentação estruturada para repositórios de código no GitHub, GitLab e Bitbucket. Ele usa a tecnologia de IA para analisar a estrutura do código, o conteúdo do arquivo e as relações lógicas, gerando rapidamente ...
3 meses atrás
02.6K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio: processamento de áudio de código aberto e modelo de base de diálogo

Introdução geral O Kimi-Audio é um modelo de base de áudio de código aberto desenvolvido pela Moonshot AI, com foco na compreensão, geração e diálogo de áudio. Ele oferece suporte a uma ampla gama de tarefas de processamento de áudio, como reconhecimento de fala, P&R de áudio e reconhecimento de emoção de fala. O modelo foi testado em mais de 130...
3 meses atrás
02.6K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...
7 meses atrás
02.6K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天

OpenAOE: Estrutura de bate-papo de grupo de modelos grandes: bate-papo com vários modelos de idiomas grandes simultaneamente

Introdução abrangente O OpenAOE é uma estrutura de bate-papo em grupo de modelo grande de código aberto, com o objetivo de resolver o problema da falta de estruturas de bate-papo no mercado atual com vários modelos respondendo em paralelo. Com o OpenAOE, os usuários podem conversar com vários LLMs (Large Language Models) ao mesmo tempo e obter resultados paralelos. A estrutura é compatível com ...
6 meses atrás
02.6K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers: uma biblioteca leve para observabilidade de IA que rastreia dados de solicitação de API compatíveis com OpenAI

Introdução geral O Observers é um SDK Python de código aberto projetado para fornecer observabilidade abrangente para APIs de IA generativas. A biblioteca permite que os usuários acompanhem e registrem facilmente as interações com modelos de IA e armazenem essas observações em vários back-ends. Seja...
8 meses atrás
02.6K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练

LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais

Introdução geral O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa de Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele se baseia em modelos genéricos chineses (como o Chinese-LLaMA e o ChatGLM)...
5 meses atrás
02.6K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

Flashcard: uma ferramenta de aprendizado de idiomas estrangeiros com flashcards de palavras criada com base no Dify, substituindo o Duolingo

Introdução geral O Flashcard é uma ferramenta de aprendizado de idiomas de código aberto criada para oferecer uma alternativa ao Duolingo. Desenvolvido por Steven Lynn (nome de usuário do GitHub: stvlynn), o projeto apresenta uma interface de usuário moderna e...
6 meses atrás
02.6K
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: instruções de texto geram um vídeo em loop contínuo

Introdução geral O Mobius Diffusion é uma ferramenta on-line inovadora voltada para a geração de conteúdo de vídeo em loop contínuo a partir de entrada de texto. Ela se baseia em modelos de difusão de vídeo pré-treinados e não requer treinamento do usuário nem dados de anotação para ser iniciada rapidamente. A tecnologia principal do site é a ...
5 meses atrás
02.6K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf: projeto experimental para executar um modelo de linguagem em grande escala em um arquivo PDF

Introdução geral O llm.pdf é um projeto de código aberto que permite aos usuários executar modelos de linguagem grandes (LLMs) diretamente em arquivos PDF. Desenvolvido por EvanZhouDev e hospedado no GitHub, esse projeto demonstra uma abordagem inovadora: por meio do Em...
3 meses atrás
02.6K
Langfuse:开源的 LLM 应用观测与调试平台

Langfuse: Plataforma de observação e depuração de código aberto para aplicativos LLM

Introdução geral O Langfuse é uma plataforma de engenharia de LLM (Large Language Model) de código aberto. Ela ajuda os desenvolvedores a rastrear, depurar e otimizar aplicativos LLM, fornecendo ferramentas para observar chamadas, gerenciar palavras-chave, executar experimentos e avaliar resultados. A plataforma é desenvolvida pela equipe do Langfuse...
5 meses atrás
02.6K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC: ferramenta de aprimoramento da função de microcrédito de computador de código aberto, suporte para desenvolvimento secundário

Introdução abrangente O SuperWeChatPC é uma ferramenta de aprimoramento do WeChat de código aberto para computadores, cujo objetivo principal é oferecer conveniência para usuários e desenvolvedores. Inicialmente, ele resolve o problema de que o WeChat só pode ser aberto sozinho e, posteriormente, adicionou o WeChatSDK, para que os desenvolvedores possam chamar as funções do WeChat, como o envio de mensagens...
5 meses atrás
02.6K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV: Geração rápida de vídeos de apresentação a partir de slides/PPTs e notas explicativas

Introdução geral O TRV é uma ferramenta de código aberto, hospedada no GitHub, projetada para ajudar os usuários a converter rapidamente slides e notas de apresentação em vídeos com narração. Ele gera automaticamente conteúdo de áudio e vídeo a partir de arquivos de apresentação de entrada por meio de operações simples de linha de comando, adequadas para quem precisa criar rapidamente apresentações...
6 meses atrás
02.6K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: criador de fluxo de trabalho de código aberto para agentes de IA

Introdução abrangente O Sim Studio é uma plataforma de código aberto para a criação de fluxos de trabalho de agentes de IA, focada em ajudar os usuários a projetar, testar e implementar rapidamente fluxos de trabalho de modelo de linguagem (LLM) em grande escala por meio de uma interface visual leve e intuitiva. Os usuários podem criar fluxos de trabalho complexos sem programação profunda, arrastando e soltando...
3 meses atrás
02.6K
KBLaM:为大模型嵌入外部知识的开源增强工具

KBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandes

O KBLaM é um projeto de código aberto desenvolvido pela Microsoft, cujo nome completo é "Knowledge Base augmented Language Model" (Modelo de linguagem aumentada da base de conhecimento). É por meio da conversão de conhecimento externo em vetores e incorporado em um grande modelo de ...
5 meses atrás
02.6K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: geração de vídeo baseada em silício para controle de movimento de objetos sólidos em imagens

Introdução geral O DragAnything é um projeto de código aberto que visa a obter o controle de movimento de objetos arbitrários por meio da representação de entidades. O projeto é desenvolvido pela equipe do Showlab e foi aceito pelo ECCV 2024. O DragAnything oferece uma maneira de usar ...
6 meses atrás
02.6K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast: uma ferramenta eficiente para aprender e prever previsões meteorológicas globais de médio prazo com base em modelos de difusão

Introdução geral O GraphCast é uma ferramenta avançada de previsão do tempo desenvolvida pelo Google DeepMind com o objetivo de melhorar a precisão das previsões meteorológicas globais de médio prazo por meio de técnicas de aprendizagem profunda. O projeto fornece uma variedade de modelos pré-treinados e código de amostra, que os usuários podem utilizar para...
8 meses atrás
02.6K
VACE:视频创作和编辑的开源模型(未开放)

VACE: modelo de código aberto para criação e edição de vídeo (não aberto)

Introdução abrangente O VACE é um projeto de código-fonte aberto desenvolvido pelo Alitongyi Visual Intelligence Lab (ali-vilab), com foco na criação e edição de vídeos. É uma ferramenta completa que integra várias funções, como geração de vídeos com base em referências, edição de conteúdo de vídeo existente, modificações de localização e outras...
5 meses atrás
02.6K
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot: um corpo inteligente para melhorar a eficiência da análise de dados financeiros e da pesquisa de investimentos

Introdução abrangente O FinRobot é uma plataforma de inteligência de IA de código aberto desenvolvida pela AI4Finance Foundation e projetada para análise financeira. Ela não só abrange modelos de linguagem tradicionais, mas também incorpora uma variedade de tecnologias de IA, com o objetivo de fornecer uma solução abrangente para o setor financeiro.
6 meses atrás
02.6K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台

Open-Reasoner-Zero: plataforma de treinamento de aprendizado por reforço de raciocínio em larga escala de código aberto

Introdução geral O Open-Reasoner-Zero é um projeto de código aberto voltado para a pesquisa de aprendizagem por reforço (RL), desenvolvido pela equipe do Open-Reasoner-Zero no GitHub. Seu objetivo é fornecer treinamento eficiente, dimensionável e fácil de usar ...
6 meses atrás
02.6K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI: um assistente de engenharia de IA para criar rapidamente bases de código proprietárias

Introdução abrangente A Potpie AI é uma plataforma de código aberto focada em fornecer aos desenvolvedores assistentes de engenharia de IA personalizados. Ela permite que os agentes de IA compreendam profundamente a estrutura e a lógica do código e automatizem tarefas como depuração, teste e geração de código, criando um gráfico de conhecimento da base de código. Os usuários podem usar...
4 meses atrás
02.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

Vision Agent: uma inteligência visual para resolver várias tarefas de detecção visual de alvos

Introdução geral O Vision Agent é um projeto de código aberto desenvolvido pela LandingAI (Equipe Enda Wu) e hospedado no GitHub, projetado para ajudar os usuários a gerar código rapidamente para resolver tarefas de visão computacional. Ele usa uma estrutura de agente avançada e modelos multimodais...
5 meses atrás
02.6K
Vexa:实时会议转录与智能知识提取工具

Vexa: uma ferramenta inteligente de extração de conhecimento e transcrição de reuniões em tempo real

Introdução abrangente O Vexa é uma plataforma de código aberto de transcrição de reuniões em tempo real e de gerenciamento de conhecimento projetada para fornecer serviços eficientes de gravação de reuniões e extração inteligente de conhecimento para empresas e indivíduos. Ele se une automaticamente a plataformas como Google Meet, Zoom etc. por meio de robôs de reunião orientados por API...
4 meses atrás
02.6K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate: geração de ativos de animação de estrutura esquelética a partir de modelos 3D estáticos

Introdução abrangente O MagicArticulate é uma estrutura de IA desenvolvida pela ByteDance em colaboração com a Nanyang Technological University (NTU), com foco na transformação rápida de modelos 3D estáticos em ativos digitais habilitados para animação. Ele faz isso por meio de um transformador autorregressivo avançado e de um modelo de difusão funcional, auto...
6 meses atrás
02.6K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: gere dados de treinamento de IA usando a API de modelo grande gratuita, geração de dados de treinamento de modelo grande de custo 0

Introdução abrangente O SFT-data-builder é um projeto de código aberto desenvolvido para gerar dados de treinamento SFT de alta qualidade usando a API Big Model gratuita combinada com os dados de domínio privado dos usuários. A ferramenta é compatível com vários formatos de modelos de IA e oferece geração com um clique, geração em lote, edição flexível e...
9 meses atrás
02.6K
Ruyi-Models:生成图像到视频开源模型,支持镜头控制与运动幅度控制

Ruyi-Models: gere modelos de código aberto de imagem para vídeo que suportam controle de lente e controle de amplitude de movimento.

Introdução geral O Ruyi-Models é um projeto de código aberto criado para gerar vídeos de alta qualidade a partir de imagens. Desenvolvido pela equipe IamCreateAI, o projeto suporta a geração de vídeos cinematográficos com resolução de 768, 24 quadros por segundo, 120 quadros em 5 segundos...
8 meses atrás
02.6K
Swarms:多智能体编排框架,企业级生产工具

Swarms: estrutura de orquestração de inteligência múltipla, ferramenta de produção empresarial

Introdução geral O Swarms é uma estrutura de orquestração de vários agentes pronta para produção de nível empresarial, projetada para aumentar a produtividade dos negócios por meio do gerenciamento eficiente de agentes e do processamento de tarefas. Com suporte para vários modelos, vários sistemas de memória e criação de agentes personalizados, a estrutura oferece um design modular e recursos abrangentes de registro para garantir que o sistema...
8 meses atrás
02.6K
LangManus:支持多智能体协作的开源AI自动化框架

LangManus: uma estrutura de automação de IA de código aberto que oferece suporte à colaboração com várias inteligências

Introdução geral O LangManus é uma estrutura de automação de IA de código aberto hospedada no GitHub. Desenvolvido por um grupo de ex-colegas em seu tempo livre, é um projeto acadêmico com o objetivo de combinar modelos de linguagem e ferramentas especializadas para pesquisa na Web, rastreamento de dados e execução de código...
5 meses atrás
02.5K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: uma ferramenta eficiente de rastreamento da Web para pré-treinamento de LLM

Introdução abrangente O Crawl4LLM é um projeto de código-fonte aberto desenvolvido em conjunto pela Universidade de Tsinghua e pela Universidade Carnegie Mellon, com foco na otimização da eficiência do rastreamento da Web para pré-treinamento de modelos grandes (LLM). Ele reduz significativamente o rastreamento ineficaz por meio da seleção inteligente de dados da Web de alta qualidade, alegando ser capaz de rastrear originalmente 1...
6 meses atrás
02.5K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow: controla o movimento dos objetos no vídeo, adicionando ou subtraindo qualquer objeto em movimento no vídeo.

Introdução geral O Go-with-the-Flow é um projeto de código aberto desenvolvido pela equipe de pesquisa da Netflix Eyeline Studios para controlar os padrões de movimento dos modelos de difusão de vídeo distorcendo o ruído. O projeto permite que o usuário determine como a câmera da cena e...
7 meses atrás
02.5K
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG: ferramenta de bate-papo inteligente para dar suporte a perguntas e respostas sobre documentos PDF de várias fontes locais

Introdução abrangente O LocalPdfChatRAG é um projeto de código aberto que visa implementar a funcionalidade de bate-papo inteligente combinando documentos PDF locais com modelos RAG (Retrieval Augmented Generation). O projeto permite que os usuários façam upload de documentos PDF e façam perguntas por meio de linguagem natural para passar do documento para o modelo relativo...
6 meses atrás
02.5K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

Pesquisa o1: Capacitar modelos de inferência para pesquisar ativamente, permitindo que modelos grandes pesquisem conhecimento externo enquanto pensam

Introdução abrangente O Search-o1 é um projeto de código aberto que visa aprimorar o desempenho de modelos de raciocínio em larga escala (LRMs) por meio da integração de mecanismos de pesquisa avançados. A ideia central é resolver o problema do déficit de conhecimento encontrado no processo de raciocínio por meio da busca dinâmica e da integração do conhecimento. O projeto é patrocinado pela Sunn...
7 meses atrás
02.5K
Rowfill:批量提取文档结构化信息并自动化分析

Rowfill: extração em lote de informações estruturadas de documentos e análise automatizada

Introdução geral O Rowfill é uma plataforma de processamento de documentos de código aberto projetada para profissionais do conhecimento. Ele usa técnicas avançadas de inteligência artificial para extrair, analisar e processar dados de documentos, imagens e PDFs complexos. O Rowfill é compatível com o Native Large Language Model (LLM) e o Ope...
6 meses atrás
02.5K
PR Agent:自动化拉取请求分析工具

PR Agent: ferramenta automatizada de análise de solicitações pull

Introdução geral O PR-Agent é uma ferramenta de código aberto desenvolvida pela Qodo para automatizar o processamento de solicitações pull (Pull Requests) por meio da tecnologia de IA. A ferramenta é capaz de fornecer feedback, sugestões e análises automatizadas para ajudar os desenvolvedores a realizar revisões de código com mais eficiência...
7 meses atrás
02.5K