Projeto de código aberto de IA

Total de 1020 artigos
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika: inteligência de engenharia de software de IA de código aberto que entende, divide instruções em subtarefas e escreve código

Introdução geral O Devika é um engenheiro de software de IA avançado que entende instruções humanas de alto nível, divide-as em etapas, estuda as informações relevantes e escreve códigos para atingir um determinado objetivo. Ele desenvolve software de forma inteligente usando modelos de linguagem em grande escala, algoritmos de planejamento e raciocínio e recursos de navegação na Web.
5 meses atrás
03.3K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: uma ferramenta de IA para fornecer tutoria personalizada, um projeto de tutor pessoal de IA de código aberto baseado no Llama 3.1

Introdução geral O Llama Tutor é um projeto de tutor pessoal de IA de código aberto criado com base no Llama 3.1, projetado para oferecer aos usuários uma experiência de aprendizado personalizada. Ao integrar várias pilhas de tecnologia, como Together AI, Next.js e T...
9 meses atrás
02.7K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。

EXO: execução de clusters de IA distribuídos usando dispositivos domésticos ociosos, com suporte a vários mecanismos de inferência e descoberta automatizada de dispositivos.

Introdução geral O Exo é um projeto de código aberto desenvolvido para executar seu próprio cluster de IA usando dispositivos cotidianos (por exemplo, iPhone, iPad, Android, Mac, Linux etc.). Por meio do particionamento dinâmico de modelos e da descoberta automatizada de dispositivos, o Exo é capaz de unificar vários dispositivos em um único...
9 meses atrás
05.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: um kit de ferramentas para criar rapidamente interfaces de bate-papo de IA com suporte para integração de modelos e gerenciamento de fluxo de dados.

Introdução abrangente O Ant Design X é um kit de ferramentas de código aberto do Ant Group, projetado para ajudar os desenvolvedores a criar rapidamente interfaces de diálogo orientadas por IA. Ele oferece um rico conjunto de componentes e modelos, suporta a integração de modelos compatível com os padrões OpenAI e é adequado para uma variedade de aplicativos, como atendimento inteligente ao cliente, assistentes de IA e outros...
9 meses atrás
03.5K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução abrangente O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem ampla (LLMs). Ela verifica o modelo quanto a vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo prejudicial etc., por meio de sondagem estática, dinâmica e adaptativa...
9 meses atrás
02.7K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: ferramenta de código aberto de gerenciamento de favoritos de IA, suporte para vários formatos, classificação inteligente de tags, pesquisa de texto completo

Descrição geral O Hoarder é uma ferramenta de gerenciamento de favoritos auto-hospedada que suporta o armazenamento de links, notas, PDFs e imagens. Ele usa tecnologia de IA para marcação automática e oferece recursos de pesquisa de texto completo. Os usuários podem usar o plug-in do Chrome e o plug-in do Firefox...
8 meses atrás
03.2K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: o estilo de interface OpenAI unificado chama vários modelos grandes, troca rápida de modelos e testes de comparação

Introdução abrangente O aisuite é uma interface simples e unificada projetada para permitir que os desenvolvedores invoquem facilmente os serviços de vários provedores de IA generativa. Com uma interface semelhante à do OpenAI, o aisuite facilita a interação com os LLMs (Large Language Models) mais populares...
9 meses atrás
03.1K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版

pdf2htmlEX: Conversão sem perdas de PDF para HTML, mantendo a formatação do texto, adequada para trabalhos acadêmicos e composição de revistas

Introdução abrangente pdf2htmlEX é uma ferramenta de código aberto projetada para converter arquivos PDF para o formato HTML, analisando o conteúdo do arquivo PDF e usando HTML + CSS para restaurar com precisão seu efeito visual, o documento PDF será convertido em um navegador ...
9 meses atrás
03.3K
Higress:提供高效的AI网关解决方案,简化微服务管理,增强安全防护

Higress: fornecendo uma solução eficiente de gateway de IA para simplificar o gerenciamento de microsserviços e aumentar a segurança

Introdução abrangente O Higress é um gateway de API nativo da nuvem desenvolvido pela Alibaba, com base no Istio e no Envoy, projetado para fornecer soluções eficientes de agendamento de tráfego, governança de serviços e segurança. Ele oferece suporte a extensões de plug-in Wasm para várias linguagens de programação para negócios de IA...
9 meses atrás
03K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发

Dynamiq: estrutura de orquestração de corpos inteligentes com suporte a agentes RAG e LLM para simplificar o desenvolvimento de aplicativos de IA

Introdução abrangente O Dynamiq é uma estrutura de orquestração de IA de código aberto projetada para aplicativos de IA de agentes e Modelagem de Linguagem Ampla (LLM). Seu objetivo é simplificar o desenvolvimento de aplicativos orientados por IA, especialmente na área de Retrieval Augmented Generation (RAG) e na orquestração de agentes LLM.
9 meses atrás
03.7K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream: um modelo de linguagem visual leve e de código aberto para retropropagação em lote de palavras-chave de imagens

Introdução abrangente O Moondream é um modelo de linguagem visual leve e de código aberto projetado para permitir recursos de descrição de imagens por meio de técnicas de aprendizagem profunda e visão computacional. O modelo é capaz de ser executado com eficiência em uma variedade de plataformas e é particularmente adequado para dispositivos de borda.
7 meses atrás
03K
PicMenu:文字菜单转换为美观的图文菜单

PicMenu: Converta menus de texto em belos menus gráficos

Introdução abrangente O PicMenu é uma ferramenta inovadora de IA que transforma os cardápios tradicionais de papel em cardápios com imagens vívidas e intuitivas por meio de uma simples operação fotográfica. A ferramenta não apenas gera automaticamente imagens de alta qualidade de cada prato, mas também fornece informações valiosas sobre os pratos para a transformação digital do setor de restaurantes...
9 meses atrás
02.9K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行

Sana: geração rápida de imagens de alta resolução, modelo de tamanho ultrapequeno de 0,6 B, operação de GPU de laptop de baixo perfil

Introdução geral O Sana é uma estrutura eficiente de geração de imagens de alta resolução desenvolvida pelo NVIDIA Labs, capaz de gerar imagens com resolução de até 4096 × 4096 em questão de segundos. O Sana emprega um transformador de difusão linear e uma tecnologia de autocodificador de compactação profunda para...
9 meses atrás
03.2K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer: ferramenta profissional de criação de ilustrações de mangá em quatro painéis, gerando imagens e editando páginas de mangá

Introdução geral O SP-MangaEditer é uma plataforma independente de edição de mangás projetada para criadores de mangás. A plataforma suporta geração de imagens, edição de camadas, ajuste de imagens, aplicação de filtros e muitas outras funções para ajudar os usuários a criar facilmente ilustrações de mangá de alta qualidade. Os usuários podem operar com uma simples...
7 meses atrás
03.1K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: permite que os usuários consultem bancos de dados SQLite e arquivos CSV/JSON para obter dados de consulta

Introdução geral O SQLite-Utils-Ask é uma ferramenta avançada criada para ajudar os usuários a realizar consultas de dados com perguntas e respostas em bancos de dados SQLite e arquivos CSV/JSON com o auxílio do LLM (Large Language Model). A ferramenta é capaz de gerar automaticamente perguntas para o usuário com base em...
9 meses atrás
02.9K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo: ferramenta de leitura de código-fonte que usa o LLM para analisar o código, fornece explicações detalhadas do código e oferece suporte a várias linguagens de programação

Introdução geral O askrepo é uma ferramenta de leitura de código-fonte baseada no LLM (Large Language Model). Ela pode ler o conteúdo de um arquivo de texto gerenciado pelo Git em um diretório específico e enviá-lo para a API do Google Gemini para fornecer respostas a perguntas com base em prompts especificados...
9 meses atrás
03.1K
PDFMathTranslate:保留PDF完整排版的AI翻译工具

PDFMathTranslate: ferramenta de tradução de IA que preserva a tipografia completa dos PDFs

Introdução abrangente O PDFMathTranslate é uma ferramenta de código aberto voltada para a tradução de artigos científicos. Os documentos PDF podem ser traduzidos na íntegra e gerar uma versão bilíngue. Ele usa tecnologia de IA para manter o layout completo do documento original, incluindo fórmulas, diagramas, índices e notas, suporte ...
2 meses atrás
04.8K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: ferramenta de tradução de vídeo multifuncional de código aberto, transcrição e tradução de voz em vários idiomas, instalação com um clique no Windows

Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra o Whisper, o Faster-Wh...
9 meses atrás
03.4K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing: ferramenta inteligente de dublagem/tradução de vídeo multilíngue com IA

Introdução abrangente O Linly-Dubbing é uma ferramenta inteligente de tradução e dublagem multilíngue de IA projetada para oferecer aos usuários serviços de tradução de legendas e dublagem de vídeo multilíngue de alta qualidade por meio da integração de tecnologia avançada de IA. A ferramenta é especialmente adequada para educação internacional, localização de conteúdo global e outros cenários, ajudando...
7 meses atrás
03.3K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: converte desenhos estáticos em animações de esboço guiadas por texto, simplificando o processo de animação.

Introdução geral O FlipSketch é um projeto de código aberto criado para converter desenhos estáticos em animações guiadas por texto. Hospedado no GitHub, o projeto oferece uma ferramenta inovadora que permite aos usuários gerar efeitos de animação a partir de descrições de texto.
9 meses atrás
02.4K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: base de conhecimento conversacional baseada em GraphRAG/ferramenta de pesquisa profunda na Web com diálogos que podem ser integrados a outros sites

Introdução geral O AutoFlow é uma ferramenta de código aberto desenvolvida pela PingCAP para criar bases de conhecimento baseadas em gráficos com armazenamento vetorial sem servidor TiDB. Ele integra as estruturas LlamaIndex e DSPy para oferecer suporte à pesquisa de diálogos complexos e ao gráfico de conhecimento...
7 meses atrás
02.8K
Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格

Maxun: uma plataforma de código aberto, sem código, que rastreia automaticamente os dados da Web e os converte em APIs ou planilhas

Introdução abrangente O Maxun é uma plataforma de extração de dados da Web de código aberto e sem código que permite aos usuários treinar robôs em minutos para rastrear automaticamente dados da Web e convertê-los em APIs ou planilhas. A plataforma oferece suporte a paginação e rolagem, adapta-se a alterações no layout do site, fornece rastreamento avançado de dados...
7 meses atrás
03.7K
OpenPromptStudio:可视化编辑、管理图像提示词,同步自己的Notion提示词表

OpenPromptStudio: edite e gerencie visualmente prompts de imagem, sincronize suas próprias listas de prompts do Notion!

Introdução geral O OpenPromptStudio (OPS) é um editor visual de código aberto para palavras de alerta do AIGC, desenvolvido pela equipe Moonvy. Ele foi projetado para simplificar o processo de criação e gerenciamento de palavras de alerta, oferecendo suporte a modelos de IA, como o Midjourney.O OPS oferece suporte a modelos de IA por meio do No...
9 meses atrás
02.6K
Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务

UI da Web de geração de texto: interface de bate-papo de modelo de linguagem grande baseada em Gradio com suporte para vários serviços de back-end

Introdução geral A UI da Web de geração de texto é uma UI da Web baseada em Gradio projetada para o Modelo de linguagem grande (LLM). Ela oferece suporte a uma variedade de back-ends de geração de texto, incluindo Transformers, llama.cp...
9 meses atrás
04.1K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码

Morphic: mecanismo de pesquisa de código aberto com tecnologia de IA oferece perguntas e respostas inteligentes, pesquisa de vídeo e geração de código de interface do usuário

Introdução geral O Morphic é um mecanismo de busca baseado na tecnologia de IA com uma interface de usuário generativa projetada para fornecer perguntas e respostas inteligentes e uma experiência de busca eficiente. Os usuários podem realizar uma variedade de pesquisas com o Morphic, incluindo texto, vídeo etc., e podem salvar o histórico de pesquisa e compartilhar os resultados da pesquisa.
9 meses atrás
03K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Swarm: um projeto pedagógico experimental para aprender sistemas corporais leves e multiinteligentes (exemplo da OpenAI)

Introdução geral Swarm é uma estrutura educacional experimental desenvolvida pela OpenAI para explorar interfaces leves, controladas e fáceis de testar para sistemas multiagentes. A estrutura é usada principalmente para demonstrar transferências e padrões de rotina entre agentes, ajudando os desenvolvedores a entender e implementar a coordenação e a execução de sistemas multiagentes...
7 meses atrás
03K
EchoMimic:音频驱动人像照片生成说话视频(EchoMimicV2加速版安装包)

EchoMimic: retratos orientados por áudio para gerar vídeos falados (instalador acelerado do EchoMimicV2)

Introdução geral O EchoMimic é um projeto de código-fonte aberto criado para gerar animações de retratos realistas acionadas por áudio. Desenvolvido pela divisão Terminal Technologies do Ant Group, o projeto utiliza condições de pontos de marcação editáveis para gerar vídeos de retratos dinâmicos usando uma combinação de áudio e pontos de marcação facial.
7 meses atrás
03.3K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具

Danswer: um assistente de IA para gerenciamento de conhecimento empresarial e pesquisa de documentos, integrando várias ferramentas de trabalho

Introdução geral O Danswer é um assistente de IA de recuperação de documentos corporativos de código aberto projetado para se conectar a documentos, aplicativos e pessoas da equipe para fornecer pesquisa unificada e respostas a consultas em linguagem natural por meio de uma interface de bate-papo inteligente e recursos de pesquisa unificada. Garantindo que os dados do usuário e os bate-papos sejam totalmente controlados...
5 meses atrás
03.5K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: Assistente de bate-papo de documentos, obtenha respostas confiáveis de documentos únicos, fontes da Web, suporte à implantação local

Introdução geral O DocsGPT é um assistente de documentação de código aberto projetado para simplificar o processo de consulta à documentação do projeto. Ao integrar um modelo avançado de GPT, os desenvolvedores podem facilmente fazer perguntas sobre o projeto e obter respostas precisas. O DocsGPT é compatível com a implantação local para garantir a privacidade dos dados...
9 meses atrás
03.3K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat: um robô de diálogo inteligente construído em um modelo grande, compatível com o WeChat e outras plataformas de acesso a múltiplos diálogos

Introdução abrangente O projeto ChatGPT-on-WeChat é um grande robô de diálogo inteligente baseado em modelos, que oferece suporte ao acesso multiplataforma ao WeChat pessoal, ao número público do WeChat, ao aplicativo WeChat empresarial, ao Flybook, ao Nail e assim por diante. Os usuários podem escolher entre GPT3.5, GPT-4, Claude, Man...
8 meses atrás
03.5K
Atomic Agents:构建轻量级模块化AI智能体框架

Agentes atômicos: uma estrutura para criar inteligências de IA modulares e leves

Introdução geral O Atomic Agents é uma estrutura extremamente leve e modular projetada com base no conceito de atomicidade para a criação de pipelines e aplicativos de IA de agentes. A estrutura oferece um conjunto de ferramentas e agentes que podem ser combinados para criar aplicativos avançados. Ela se baseia no Instruc...
8 meses atrás
02.8K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本

Fragmentos: versões de código aberto de aplicativos como o Claude Artifacts da Anthropic, o Vercel v0 ou o GPT Engineer.

Introdução geral O Fragments by E2B é um projeto de código aberto que fornece um modelo baseado no Next.js para a criação de aplicativos gerados inteiramente por IA. O projeto foi desenvolvido pela E2B para simplificar e acelerar o processo de desenvolvimento de aplicativos de IA. Ele integra uma variedade de aplicativos atuais...
9 meses atrás
02.8K
E2B:安全云沙箱中的AI代码运行平台

E2B: plataforma de execução de código de IA em uma sandbox segura na nuvem

Introdução geral A E2B é uma plataforma de código aberto projetada para executar códigos gerados por IA em uma sandbox segura na nuvem. Ela oferece suporte a uma ampla variedade de linguagens e estruturas de programação e fornece um ambiente virtual isolado para garantir a segurança e a confiabilidade da execução do código. A E2B é adequada para uma variedade de cenários de aplicativos de IA, incluindo particionamento de dados...
7 meses atrás
03.1K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: uma biblioteca experimental para otimizar palavras de prompt de modelos grandes, otimizando automaticamente o Prompt

Introdução geral O Promptimizer é uma biblioteca experimental de otimização de palavras de alerta projetada para ajudar os usuários a melhorar sistematicamente as palavras de alerta de seus sistemas de IA. Ao automatizar o processo de otimização, o Promptimizer pode melhorar o desempenho das palavras de alerta em tarefas específicas. Os usuários só precisam fornecer...
9 meses atrás
03.2K
Paper Reviewer:自动生成arXiv论文的综合评审并转化为博客文章

Paper Reviewer: gera automaticamente análises abrangentes de artigos do arXiv e as converte em postagens de blog

Introdução geral O Paper Reviewer é um projeto de código aberto desenvolvido para gerar revisões abrangentes de artigos do arXiv e transformá-las em publicações de blog. O projeto alimenta o site Hugging Face's Daily Papers, que automaticamente...
9 meses atrás
03.2K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: uma interface de bate-papo limpa para interagir com modelos nativos do Ollama

Introdução geral O HiOllama é uma interface amigável criada em Python e Gradio, projetada para interagir com os modelos do Ollama. Ela oferece uma interface da Web simples e intuitiva que suporta geração de texto em tempo real e recursos de gerenciamento de modelos. Os usuários podem ajustar parâmetros como temperatura e a maioria...
9 meses atrás
03.1K
InstantIR:受损图像修复与图像高清放大开源项目,最低16G显存

InstantIR: projeto de código aberto de reparo de imagens danificadas e zoom de alta definição de imagens, memória de vídeo mínima de 16G

Descrição geral O InstantIR é um modelo inovador de restauração de imagem única desenvolvido pela equipe do InstantX, projetado para ressuscitar suas imagens danificadas com detalhes extremamente realistas e de alta qualidade, capaz de realizar a restauração de alta qualidade de imagens danificadas. A ferramenta não apenas restaura os detalhes da imagem...
9 meses atrás
03.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

Introdução geral O OmniParse é uma poderosa plataforma de análise e otimização de dados projetada para transformar quaisquer dados não estruturados em dados estruturados e acionáveis otimizados para a estrutura GenAI (Generative Artificial Intelligence). Não importa se você está trabalhando com documentos, tabelas, imagens, vídeos, arquivos de áudio ou...
9 meses atrás
02.9K
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw: ferramenta de quadro branco virtual com estilo de desenho à mão | fluxograma de geração de texto orientado por IA | tutoriais do Excalidraw

Excalidraw Descrição geral O Excalidraw é uma ferramenta de desenho de quadro branco virtual de código aberto que permite desenhar facilmente diagramas com estilo de desenho à mão. Você pode usar o Excalidraw para criar belas ilustrações desenhadas à mão, diagramas de estrutura de arame ou qualquer um de seus...
9 meses atrás
03.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图

tldraw: SDK de quadro branco de tela ilimitada de código aberto, IA para gerar wireframes minimalistas e diagramas UML

Descrição geral O tldraw é uma ferramenta de desenho colaborativo gratuita e instantânea que oferece uma tela ilimitada onde os usuários podem desenhar gráficos, escrever textos e colaborar instantaneamente. Com uma interface intuitiva e excelente desempenho, ele é adequado para colaboração em equipe e trabalho remoto. Com suporte da comunidade de código aberto, o tldr...
9 meses atrás
02.9K
PandasAI:数据分析对话平台,用自然语言完成数据查询与图表生成

PandasAI: uma plataforma de diálogo de análise de dados para consultas de dados e geração de gráficos em linguagem natural

Introdução geral O PandasAI é uma plataforma de código aberto baseada em Python projetada para simplificar o processo de análise de dados por meio de técnicas de processamento de linguagem natural. Permite que os usuários trabalhem em um diálogo com bancos de dados (por exemplo, SQL, CSV, pandas, polars, mongodb, n...
9 meses atrás
02.9K
Reactive Resume:支持多语言、多模板的开源免费简历生成器

Reactive Resume: criador de currículos gratuito e de código aberto com suporte a vários idiomas e modelos

Descrição geral O Reactive Resume é um criador de currículos gratuito e de código aberto projetado para simplificar o processo de criação, atualização e compartilhamento de currículos. A plataforma se concentra na privacidade do usuário, sem rastreamento ou publicidade. Os usuários podem auto-hospedar o aplicativo em menos de 30 segundos, assumindo o controle total de suas...
8 meses atrás
02.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: sistema de Q&A e processamento de documentos PDF baseado em FastAPI

Introdução geral O FastAPI DocGPT é um sistema de teste de documentos baseado em FastAPI que permite que os usuários carreguem arquivos PDF e façam testes com base no conteúdo do documento. O sistema usa a tecnologia de incorporação da OpenAI para incorporar o conteúdo do documento em um banco de dados vetorial...
9 meses atrás
02.9K
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent: uma ferramenta automatizada de P&D orientada por dados que facilita os processos de P&D orientados por dados por meio da tecnologia de IA

Introdução geral O RD-Agent é uma ferramenta de código aberto da Microsoft criada para automatizar e otimizar o processo de pesquisa e desenvolvimento (P&D). A ferramenta se concentra em cenários orientados por dados para melhorar a eficiência do desenvolvimento de modelos e dados por meio de técnicas de inteligência artificial.
5 meses atrás
04.1K
TableGPT2:表格数据集成的多模态模型

TableGPT2: um modelo multimodal para integração de dados tabulares

Introdução abrangente O TableGPT2 é um modelo multimodal desenvolvido por uma equipe da Universidade de Zhejiang, com foco na integração e no processamento de dados tabulares. O modelo é pré-treinado e ajustado para ter um bom desempenho em tarefas relacionadas a dados de tabela, mantendo, ao mesmo tempo, fortes recursos de linguagem e codificação de uso geral.
9 meses atrás
03.9K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案

VideoChat: pessoa digital interativa por voz em tempo real com clonagem personalizada de imagens e tons, com suporte a soluções de voz de ponta a ponta e soluções em cascata

Introdução geral O VideoChat é um projeto de interação de voz em tempo real para pessoas digitais baseado em tecnologia de código aberto, com suporte a esquemas de voz de ponta a ponta (GLM-4-Voice - THG) e esquemas em cascata (ASR-LLM-TTS-THG). O projeto permite que os usuários personalizem a pessoa digital ...
9 meses atrás
02.9K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri

Ichigo (llama3-s): assistente de IA de voz local em tempo real, versão de código aberto da Siri

Introdução geral O Ichigo é um projeto de código aberto de IA de fala em tempo real que visa ampliar os modelos de linguagem baseados em texto com recursos nativos de "escuta". O projeto usa técnicas de fusão iniciais inspiradas no documento Chameleon da Meta. O objetivo do Ichigo é se tornar...
7 meses atrás
03K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成

SFT-data-builder: gere dados de treinamento de IA usando a API de modelo grande gratuita, geração de dados de treinamento de modelo grande de custo 0

Introdução abrangente O SFT-data-builder é um projeto de código aberto desenvolvido para gerar dados de treinamento SFT de alta qualidade usando a API Big Model gratuita combinada com os dados de domínio privado dos usuários. A ferramenta é compatível com vários formatos de modelos de IA e oferece geração com um clique, geração em lote, edição flexível e...
9 meses atrás
02.6K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)

Agregador: plataforma completa de rastreamento e agregação de agentes, pool de agentes gratuitos (use-o de forma compatível)

Introdução abrangente O Aggregator é um projeto de código aberto que visa criar um pool de proxy gratuito que pode rastrear uma variedade de nós de proxy disponíveis. A plataforma tem um sistema de plug-in flexível, os usuários podem, de acordo com as necessidades especiais do site de destino, usar plug-ins para obter funções específicas. O projeto é usado principalmente para aprender a rastrear ...
9 meses atrás
02.9K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作

OpenHands: assistente de agente multiinteligente orientado por IA para desenvolvimento de software, abrangendo todos os tipos de operações de desenvolvedor

Introdução geral O OpenHands é um projeto de código aberto desenvolvido pela equipe da All-Hands-AI para simplificar o processo de desenvolvimento de software por meio da tecnologia de IA. Anteriormente conhecida como OpenDevin e agora renomeada como OpenHands, a plataforma oferece...
7 meses atrás
05.1K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

Perplexica: um mecanismo de pesquisa de IA de código aberto que replica os recursos e a interface do Perplexity AI na proporção de 1 para 1

Introdução geral O Perplexica é um mecanismo de pesquisa de código aberto orientado por IA, projetado para fornecer respostas que se aprofundam na Internet. Ele usa algoritmos avançados de aprendizado de máquina, como pesquisa de similaridade e técnicas de incorporação, para otimizar os resultados da pesquisa e fornecer respostas claras com fontes citadas.
9 meses atrás
03.3K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: operação automatizada de smartphones usando inteligências multimodais

Introdução abrangente O AppAgent é uma estrutura de agente multimodal baseada no Large Language Model (LLM), projetada para manipular aplicativos de smartphones. A estrutura imita as interações humanas, como toques e deslizes, por meio de um espaço de manipulação simplificado, eliminando, assim, a necessidade de acesso ao back-end do sistema, ampliando seu alcance em diferentes aplicativos...
8 meses atrás
03.3K
AI Podcast Generator:自动抓取新闻生成音频播客

AI Podcast Generator: Capture automaticamente notícias para gerar podcasts de áudio

Introdução geral O AI Podcast Generator é uma ferramenta inteligente de geração de podcast que usa tecnologia avançada de IA para criar automaticamente conteúdo de áudio envolvente a partir de fontes da Web. O sistema gera narrativas de fluxo natural capturando conteúdo de notícias e convertendo-o em podcasts de áudio. O projeto é baseado no Next...
9 meses atrás
03.3K
WhoDB:支持自然语言交互的轻量数据库可视化管理软件

WhoDB: Software leve de gerenciamento de visualização de banco de dados com suporte para interação com linguagem natural

Introdução geral O WhoDB é uma ferramenta de gerenciamento de banco de dados leve (~20 MB), poderosa e fácil de usar, projetada para simplificar as tarefas de administração de banco de dados. Ele combina a simplicidade do Adminer com a experiência do usuário e os aprimoramentos de desempenho.
9 meses atrás
02.5K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB: plataforma de análise de dados financeiros de código aberto que integra conjuntos de dados privados e IA para aprimorar a tomada de decisões de investimento

Introdução geral O OpenBB é uma plataforma de análise de dados financeiros gratuita e totalmente de código aberto, projetada para fornecer acesso fácil a dados financeiros e ferramentas de análise para todos. A plataforma integra mais de 100 fontes de dados diferentes que abrangem ações, opções, criptomoedas, forex, indicadores macroeconômicos, índices...
7 meses atrás
04.4K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: modelo experimental de conversão de texto em fala, TTS implementado usando uma abordagem de modelagem de linguagem pura

Introdução abrangente OuteTTS é um modelo experimental de conversão de texto em fala (TTS) que usa uma abordagem de modelagem de linguagem pura para gerar fala de alta qualidade. Ao contrário dos sistemas TTS tradicionais, o OuteTTS não requer adaptadores externos ou arquiteturas complexas. O modelo é baseado na arquitetura LLaMa...
6 meses atrás
03.2K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor: Base de conhecimento + Mentor de revisão de código inteligente orientado por LLM para GitHub

Introdução abrangente O CR-Mentor é uma ferramenta inteligente de revisão de código que combina uma base de conhecimento profissional com o poder da Modelagem de Linguagem Grande (LLM). Ele não só oferece suporte à revisão de código para todas as linguagens de programação, mas também personaliza critérios de revisão exclusivos e áreas de foco para equipes com base nas práticas recomendadas acumuladas na base de conhecimento. Por meio de...
9 meses atrás
03.1K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent: uma nova estrutura de orquestração de agentes com base em LLM e EKG (conhecimento do setor)

Introdução geral O muAgent é uma estrutura inovadora de inteligência múltipla desenvolvida pelo Ant Group. A estrutura ajuda os usuários a executar vários procedimentos operacionais padrão (SOPs) complexos sob orientação humana por meio de arrastar e soltar telas e escrever textos simples, em colaboração com multiinteligência, chamadas de função, intérpretes de código e outras tecnologias...
9 meses atrás
02.8K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端

Cherry Studio: cliente de desktop para assistentes de IA com modelos integrados de API/Web/local

Introdução geral O Cherry Studio é um cliente de desktop que oferece suporte a uma ampla variedade de serviços do Large Language Model (LLM) e é compatível com os sistemas Windows, Mac e Linux. Ele oferece uma grande variedade de opções de personalização e recursos de ponta projetados para ajudar os usuários em uma grande variedade de locais...
6 meses atrás
07K
99AI:集成多模态AI服务的商业化Web应用(免费开源)

99AI: um aplicativo comercial da Web que integra serviços de IA multimodal (código aberto gratuito)

Introdução abrangente O 99AI é um projeto de aplicativo da Web de IA de código aberto que tem como objetivo fornecer uma plataforma de serviço de IA integrada de baixo limiar e fácil de implantar. O projeto oferece suporte a diálogos inteligentes, modelos multimodais, praças de aplicativos, pesquisas em rede e integra pintura, música e vídeo de IA...
9 meses atrás
03.3K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具

API de extração de texto (text-extract-api): extração visual de informações de texto, ferramenta de extração de PDF anônimo

Introdução abrangente A API de extração de texto (text-extract-api) é uma ferramenta avançada projetada para extrair e analisar o conteúdo de vários formatos de documentos (por exemplo, PDF, Word, PPTX etc.). A API utiliza tecnologia de ponta de reconhecimento óptico de caracteres (OCR) e Ol...
7 meses atrás
03.3K
OmniGen:统一图像生成模型,多模态输入生成人物一致性图像

OmniGen: um modelo unificado de geração de imagens com entradas multimodais para gerar imagens consistentes com caracteres

Introdução geral O OmniGen é um modelo "universal" de geração de imagens desenvolvido pela VectorSpaceLab que permite aos usuários criar efeitos visuais diversificados e contextualmente ricos com comandos de texto simples ou entradas multimodais. Ele é particularmente adequado para aplicativos que precisam reconhecer...
9 meses atrás
03.7K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix (EMAGE): estrutura de geração de gestos de corpo inteiro, estrutura de animação 3D para gerar gestos de corpo inteiro a partir de áudio

Introdução abrangente O PantoMatrix é uma estrutura avançada de geração de gestos de corpo inteiro capaz de gerar movimentos humanos completos a partir de gestos parciais e de áudio, incluindo movimentos de rosto, corpo parcial, mão e corpo inteiro. A estrutura utiliza os mais recentes conjuntos de dados multimodais e técnicas de aprendizagem profunda para fornecer...
9 meses atrás
03.2K
Continue:与VS Code集成并自定义模型和embedding的开源AI代码助手

Continue: um assistente de código de IA de código aberto que se integra ao VS Code e personaliza modelos e incorporação

Introdução geral O Continue é um assistente de código de IA de código aberto projetado para melhorar a eficiência dos desenvolvedores de software. Seus principais recursos incluem autocompletar código, otimização de código e sugestões inteligentes de código para os IDEs VS Code e JetBrains.O Continue faz...
6 meses atrás
04.5K
Zed:Rust开发的高性能多人协作代码编辑器

Zed: um editor de código colaborativo multijogador de alto desempenho desenvolvido pela Rust

Introdução geral O Zed é um editor de código colaborativo multiusuário de alto desempenho, desenvolvido pelos criadores do Atom e do Tree-sitter. Escrito na linguagem Rust, o Zed foi projetado para proporcionar uma experiência de codificação rápida e fluida. Seus principais recursos incluem suporte para multijogadores...
8 meses atrás
02.8K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: API de modelo grande e leve convertida para a interface OpenAI, arquivo YAML para configurar o canal da API

Introdução abrangente Sem front-end, canal de API de configuração de arquivo de configuração pura. Basta escrever um arquivo para executar uma estação de API própria. O documento tem um guia de configuração detalhado, de fácil compreensão. O uni-api é um gerenciamento unificado de um projeto de API de modelo grande, que permite uma configuração unificada...
9 meses atrás
03.1K
IC-Light(V2):图像照明控制神器,控制图像光影和背景

IC-Light (V2): mágica de controle de iluminação de imagem, controla a luz, a sombra e o plano de fundo da imagem

Introdução abrangente O IC-Light é um projeto de controle de iluminação de imagens que visa a manipular os efeitos de iluminação das imagens por meio de modelos avançados de IA. Desenvolvido por Lvmin Zhang et al, o projeto oferece dois modelos principais: um modelo de reiluminação condicional ao texto e um modelo condicional ao plano de fundo. Os usuários podem passar...
8 meses atrás
03.4K
Screenshot to Code:将截图转换为干净前端代码的AI工具

Screenshot to Code: ferramenta de IA para converter capturas de tela em código de front-end limpo

Introdução geral O Screenshot-to-Code é uma ferramenta de código aberto que usa inteligência artificial para converter capturas de tela, rascunhos de design e designs do Figma em código limpo e funcional. A ferramenta é compatível com várias pilhas de tecnologia de front-end, incluindo HTML, Tailwind CS...
10 meses atrás
04.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin: uma GUI da Web para interagir com todos os modelos e APIs do OpenAI

Introdução geral O Ortlin é uma interface gráfica de usuário baseada na Web, projetada para ajudar qualquer pessoa, tanto usuários técnicos quanto não técnicos, a interagir facilmente com as APIs e os modelos subjacentes da OpenAI. Ele é totalmente gratuito e de código aberto, permitindo que os usuários aproveitem o OpenAI de forma descomplicada...
10 meses atrás
03.3K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站

AigoTools: inclusão automática de sites e suporte para o site de navegação multilíngue de ferramentas de IA de código aberto

Introdução geral O AigoTools é um software de código aberto de navegação de sites da Web com IA, projetado para ajudar os usuários a criar e gerenciar rapidamente sites de navegação. Ele tem gerenciamento de site integrado e recursos de inclusão automática baseados em IA, suporte para vários idiomas, alternância de tema claro/escuro e otimização de SEO.
10 meses atrás
02.9K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: modelo de clonagem de texto para fala com amostragem zero (pacote de implantação local com um clique)

Introdução abrangente O MaskGCT (Masked Generative Codec Transformer) é um modelo de conversão de texto em fala (TTS) totalmente não autorregressivo introduzido em conjunto pela Funky Maru Technology e pela Universidade Chinesa de Hong Kong. O modelo não requer conversão explícita de texto em fala ...
9 meses atrás
04K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)

Quanta Quest: grandes modelos finais e plataforma de pesquisa de IA localizada para dados pessoais (visualização)

Introdução O Quanta Quest é o primeiro produto do mundo com "modelo grande do lado final + localização de dados do lado C" como a direção principal da evolução. Ele ajuda os usuários a armazenar todos os dados do Gmail, Notion, Dropbox etc. localmente e processá-los por meio de um banco de dados vetorial para garantir...
10 meses atrás
03K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: permite que a IA controle seu computador diretamente, uma implementação de código aberto do computador de controle do Claude

Descrição geral O Agent.exe é um aplicativo Electron de código aberto que utiliza a API Sonnet Claude 3.5 da Anthropic para permitir que os usuários controlem seus computadores locais diretamente por meio de IA. O projeto foi desenvolvido por K...
8 meses atrás
03.2K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!

MindSearch: estrutura de mecanismo de pesquisa de IA de código aberto para implementar seu próprio mecanismo de pesquisa Perplexity!

Introdução abrangente O MindSearch é uma estrutura de mecanismo de busca de IA de código aberto lançada pelo Laboratório de Inteligência Artificial de Xangai (SAL), cujo objetivo é simular o processo de pensamento humano para coleta e integração de informações complexas. A ferramenta combina as tecnologias avançadas de modelagem de linguagem em larga escala (LLM) e mecanismos de busca por meio de inteligência múltipla...
8 meses atrás
02.8K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签

CosyVoice: projeto de código aberto de clonagem de voz de 3 segundos lançado por Ali com suporte para tags controladas emocionalmente

Introdução abrangente O CosyVoice é um modelo multilíngue de geração de fala em larga escala que oferece recursos de pilha completa, desde a inferência, o treinamento até a implantação. Desenvolvido pela equipe do FunAudioLLM, ele tem como objetivo obter uma fala de alta qualidade por meio de transformadores autorregressivos avançados e modelos de difusão baseados em ODE...
6 meses atrás
06.3K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

Fabric: uma estrutura de fluxo de trabalho de código aberto de IA que integra muitas palavras-chave para lidar eficientemente com uma variedade de transações

Introdução geral O Fabric é uma estrutura de IA de código aberto desenvolvida por Daniel Miessler para simplificar e automatizar as tarefas diárias do computador e tornar a inteligência artificial mais fácil de usar. Ele ajuda os usuários de forma eficiente por meio de um design modular e de palavras de alerta predefinidas (Patterns)...
10 meses atrás
03.2K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案

NocoDB: criação de tabelas inteligentes em vários bancos de dados, alternativa de código aberto ao Airtable

Introdução geral O NocoDB é uma alternativa de código aberto ao Airtable projetada para fornecer uma ferramenta de gerenciamento de banco de dados on-line avançada e fácil de usar. Com o NocoDB, os usuários podem facilmente criar, ler, atualizar e excluir dados de bancos de dados sem escrever código. A plataforma é compatível com ...
10 meses atrás
03.4K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

Corrige cadeias de caracteres JSON inválidas e resolve possíveis erros de formatação em dados JSON gerados por LLMs.

Descrição geral Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo corrige erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e valores-chave incompletos...
10 meses atrás
02.9K
Pyramid Flow:快手推出的开源版

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução abrangente O Pyramid Flow é um método eficiente de geração de vídeo autorregressivo baseado na técnica de correspondência de fluxo. O método alcança maior eficiência computacional na geração e descompressão de conteúdo de vídeo por meio da interpolação entre diferentes resoluções e níveis de ruído...
9 meses atrás
02.9K
Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署

Dify: plataforma de desenvolvimento de aplicativos de IA generativa, orquestração visual, suporte à implantação privada

Introdução abrangente A Dify é uma plataforma de desenvolvimento de aplicativos de IA generativa de código aberto projetada para ajudar os desenvolvedores a criar e operar rapidamente aplicativos de IA nativos com base em LLMs (Large Language Models). A plataforma oferece tudo, desde a criação de agentes até a orquestração do fluxo de trabalho de IA, recuperação de RAG...
7 meses atrás
04.3K