Projeto de código aberto de IA

Total de 1020 artigos
Ollama OCR:使用Ollama中视觉模型提取图像中的文本

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama

Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece um software Strea...
7 meses atrás
04.4K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT: uma ferramenta de ajuste virtual de IA de alta fidelidade para aprimorar a autenticidade dos detalhes das roupas

Introdução abrangente O FitDiT é um sistema de ajuste virtual de alta fidelidade baseado em transformadores de difusão (Diffusion Transformers). Desenvolvido pelo Tencent AI Lab, o projeto tem como objetivo abordar as limitações dos sistemas de ajuste virtual tradicionais na exibição de detalhes do vestuário.
7 meses atrás
02.6K
Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频

Thin-Plate-Spline-Motion-Model: Vídeo de referência de mapa de retrato estático Vídeo de geração de movimento de retrato

Introdução geral Thin-Plate-Spline-Motion-Model é um projeto inovador de geração de animação de imagens apresentado na CVPR 2022. O projeto baseia-se na teoria das transformadas de spline de placa fina e é capaz de obter movimento de alta qualidade a partir de imagens estáticas com base na condução de vídeo...
7 meses atrás
02.7K
DUIX:实时互动的智能数字人,支持多平台一键部署

DUIX: pessoas digitais inteligentes para interação em tempo real, com suporte à implantação multiplataforma com um clique

Introdução geral O DUIX (Dialogue User Interface System) é uma plataforma de interação humana digital alimentada por IA criada pela Silicon Intelligence. Com recursos de interação humana digital de código aberto, os desenvolvedores podem integrar facilmente modelos de grande escala, reconhecimento automático de fala (ASR...
7 meses atrás
03.6K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fay Digital Human Framework: integração de modelos de linguagem e caracteres digitais 3D para dar suporte a vários cenários de aplicativos

Introdução abrangente O Fay é uma estrutura humana digital virtual 3D de código aberto que integra modelos de linguagem e caracteres digitais para uma variedade de cenários de aplicativos, como guias de compras virtuais, âncoras virtuais, assistentes, garçons, professores e assistentes móveis baseados em voz ou texto.
7 meses atrás
03.1K
MOFA Video:运动场适配技术将静态图像转换为视频

Vídeo MOFA: a tecnologia de adaptação de campo de movimento converte imagens estáticas em vídeo

Introdução geral O MOFA-Video é uma ferramenta de geração de animação de imagem de última geração que utiliza técnicas generativas de adaptação de campo de movimento para converter imagens estáticas em vídeos dinâmicos. Ele foi desenvolvido em colaboração com a Universidade de Tóquio e o Tencent AI Lab e será apresentado na Conferência Europeia de Visão Computacional de 2024 (E...
7 meses atrás
02.6K
Amurex:开源AI会议记录助手,自动记录会议内容生成总结

Amurex: assistente de gravação de reuniões com IA de código aberto, gravação automática do conteúdo da reunião para gerar resumos

Introdução geral O Amurex é um assistente de reunião de IA de código aberto desenvolvido pela The Personal AI Company, projetado para melhorar a eficiência da reunião por meio de recursos inteligentes. O Amurex é capaz de fornecer aconselhamento em tempo real, gerar resumos inteligentes, registrar o conteúdo da reunião e enviar automaticamente...
7 meses atrás
03.3K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

Agent Laboratory: código automatizado e assistente de redação de estudos para pesquisadores

Introdução abrangente O Agent Laboratory é um fluxo de trabalho de pesquisa autônomo de ponta a ponta projetado para ajudar os pesquisadores a concretizar suas ideias de pesquisa. O sistema consiste em agentes dedicados, orientados por modelos de linguagem em grande escala, que dão suporte a todo o fluxo de trabalho de pesquisa, desde a realização de revisões de literatura e desenvolvimento de planos até a execução...
4 meses atrás
02.8K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点

CoolCline: outra versão aprimorada do assistente de codificação inteligente do Cline, combinando os benefícios do ClineRoo Cline e do Bao Cline.

Descrição geral O CoolCline é um poderoso assistente de codificação que combina os melhores recursos do Cline, Roo Cline e Bao Cline. Ele funciona perfeitamente com a interface de linha de comando (CLI) e o editor para oferecer a você o mais avançado...
7 meses atrás
02.8K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.: assistente de código inteligente com reconhecimento de contexto, geração e modificação de código, suporte a vários IDEs

Introdução geral O J.A.R.V.I.S. (Just A Rather Very Intelligent System) é um assistente de código inteligente projetado para ajudar os desenvolvedores na geração de código, modificação e discussões técnicas usando vários modelos de linguagem de última geração...
7 meses atrás
03.4K
AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据

Sistema de investimento em IA: sistema automatizado de tomada de decisões de investimento em ações da categoria A, usando um sistema de inteligência múltipla para analisar dados de mercado

Introdução abrangente O A_Share_investment_Agent é um auxiliar de decisão de investimento em ações da categoria A baseado em um sistema de inteligência múltipla. O sistema foi projetado para analisar dados de mercado, calcular o valor intrínseco das ações, analisar o sentimento do mercado e dados fundamentais por meio de várias inteligências colaborativas para...
7 meses atrás
02.6K
Company Researcher:公司研究工具,输入公司网址以获取详细研究信息

Pesquisador de empresas: uma ferramenta de pesquisa de empresas, insira o endereço da Web de uma empresa para obter informações de pesquisa detalhadas.

Descrição geral O Company Researcher (Pesquisador de empresas) é uma ferramenta gratuita e de código aberto criada para ajudar os usuários a obter uma visão geral rápida e abrangente de qualquer empresa. Basta inserir o URL da empresa e a ferramenta coletará informações abrangentes da Web, apresentando informações sobre a organização, seus produtos...
4 meses atrás
02.2K
GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新

GitPodcast: Transforme seus repositórios do GitHub em podcasts e ouça as atualizações de código a qualquer hora, em qualquer lugar!

Introdução geral O GitPodcast é uma ferramenta inovadora projetada para transformar os repositórios do GitHub em podcasts, permitindo que os desenvolvedores ouçam as atualizações de código a qualquer momento e em qualquer lugar. Usando o OpenAI e o Azure Speech SDK, o GitPodca...
7 meses atrás
02.3K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统

Paperless-AI: análise e marcação automática de documentos usando IA para o sistema de gerenciamento de documentos paperless-ngx

Introdução geral O Paperless-AI é uma ferramenta inovadora de análise de automação de documentos projetada especificamente para o sistema de gerenciamento de documentos Paperless-ngx. Ela combina de forma inteligente a API OpenAI com uma variedade de modelos avançados de IA, como o Ollama...
7 meses atrás
04.9K
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, uma plataforma para criar modelos de base de IA do mundo físico

Introdução abrangente O NVIDIA Cosmos é uma plataforma de modelagem baseada no mundo para desenvolvedores, projetada especificamente para ajudar os desenvolvedores de IA de física a criar seus sistemas de IA de física de forma melhor e mais rápida. A plataforma oferece uma variedade de modelos pré-treinados, incluindo modelos de difusão e autorregressivos baseados no mundo...
7 meses atrás
02.6K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: criando mini-inteligências LLM com "estrutura de gráfico direcionado" em 100 linhas de código

Introdução geral O miniLLMFlow é uma estrutura de desenvolvimento minimalista do Large Language Model (LLM) que contém apenas 100 linhas de código principal, demonstrando a filosofia de design de "manter a simplicidade". A estrutura foi projetada especificamente para permitir que os assistentes de IA (por exemplo, ChatGPT, Claude etc.)...
7 meses atrás
02.8K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: crie seu companheiro de bate-papo com IA, diálogo de voz fácil e interação inteligente

Introdução abrangente O Xiaozhi AI Chatbot é um projeto de código aberto baseado na placa de desenvolvimento ESP32, projetado para ajudar os usuários a criar seu próprio companheiro de bate-papo de IA. O projeto foi desenvolvido pela Shrimp e é usado principalmente para fins didáticos para ajudar mais pessoas a começar a trabalhar com o desenvolvimento de hardware de IA e entender como aplicar modelos de linguagem grandes a...
5 meses atrás
03.7K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: um modelo Next.js para criar aplicativos de IA de diálogo de voz em tempo real

Introdução abrangente O OpenAI Realtime API Next.js é um projeto de código aberto baseado na estrutura Next.js, projetado para ajudar os desenvolvedores a criar rapidamente aplicativos de IA de voz em tempo real. O projeto integra a API em tempo real da OpenAI e a tecnologia WebRTC...
7 meses atrás
02.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件

Auto-Coder.Chat: assistente de programação assistida por IA baseado em linha de comando de terminal com plug-in VSCode

Introdução geral O Auto-Coder.Chat é uma ferramenta de programação assistida por IA baseada em terminal, projetada para melhorar a eficiência da programação dos desenvolvedores por meios inteligentes. A ferramenta pode ser usada com qualquer IDE para permitir a programação assistida por IA em ferramentas de desenvolvimento.
4 meses atrás
02.7K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: assistente de IA de análise de dados de conversação com acesso direto a respostas, consultas SQL e relatórios de análise

Introdução geral O WrenAI é um assistente de IA SQL de código aberto projetado especificamente para ajudar equipes de dados, equipes de produtos e equipes de negócios a obter insights de dados por meio de conversas em linguagem natural. Ele é capaz de converter a linguagem natural em consultas SQL, gerar gráficos, planilhas e relatórios, oferecer suporte a...
7 meses atrás
03.4K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品

Activepieces: automação de fluxo de trabalho com IA, ferramenta de agendamento de tarefas para usuários não técnicos, substituto de código aberto do Zapier

Introdução geral O Activepieces é uma plataforma de fluxo de trabalho de automação de código aberto, tudo em um, focada em fornecer soluções de automação intuitivas e avançadas para empresas e usuários individuais. Desenvolvida em TypeScript, a plataforma é extremamente dimensionável e oferece suporte a mais de 200 serviços integrados...
7 meses atrás
02.7K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: modelo hierárquico autossupervisionado de transferência de maquiagem, maquiagem virtual, migração de maquiagem para novos retratos

Introdução abrangente O SHMT (Self-supervised Hierarchical Makeup Transfer) é um projeto de migração de maquiagem hierárquica autossupervisionada baseado em um modelo de difusão latente, com o objetivo de obter efeitos de maquiagem de alta qualidade por meio de métodos de aprendizagem não supervisionados...
7 meses atrás
02.9K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: Modelos de linguagem multimodal de grande porte de código aberto para interação visual e de fala em tempo real

Introdução geral O VITA é um projeto líder de modelagem de linguagem grande multimodal interativa de código aberto, pioneiro na capacidade de obter uma verdadeira interação multimodal completa. O projeto lançou o VITA-1.0 em agosto de 2024, sendo pioneiro no primeiro modelo de linguagem grande totalmente modal e interativo de código aberto.2024...
7 meses atrás
03.1K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策

Trend Finder: rastreamento de tendências de mídia social, tópicos de tendências e novos artigos em tempo real para decisões de marketing.

Introdução geral O Trend Finder é uma ferramenta avançada criada para ajudar os usuários a rastrear os tópicos e as tendências nas mídias sociais em tempo real. Ao coletar e analisar as publicações dos principais influenciadores, o Trend Finder consegue detectar novas tendências ou lançamentos de produtos a tempo de enviar...
7 meses atrás
02.9K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...
7 meses atrás
02.5K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: uma ferramenta de conversão de áudio em tempo real para tradução de chinês para inglês com base no modelo multimodal Gemini

O TransRouter é uma ferramenta de tradução de voz em tempo real baseada no modelo Gemini do Google, projetada especificamente para tradução de voz em tempo real entre inglês e chinês. A ferramenta se integra perfeitamente ao software de videoconferência, como o Zoom, oferecendo uma ferramenta avançada para tradução entre idiomas...
7 meses atrás
03.1K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O Open Source NotebookLM é um projeto inovador de inteligência artificial que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. O projeto foi desenvolvido pela Build Fast com...
7 meses atrás
02.6K
Open Deep Research:生成基于网络搜索内容的AI研究报告

Open Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na Web

Introdução geral O Open Deep Research é uma ferramenta de geração de relatórios de pesquisa orientada por IA de código aberto como uma alternativa de código aberto aos recursos de pesquisa profunda do Google Gemini. O projeto é desenvolvido em TypeScript e baseado no Next.js 1...
4 meses atrás
02.8K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Visão é tudo o que você precisa: Criação de um sistema inteligente de recuperação de documentos usando modelos de linguagem visual (Vision RAG)

Introdução abrangente O Vision-is-all-you-need é um projeto inovador de demonstração do sistema visual RAG (Retrieval Augmented Generation) que abre novos caminhos na aplicação da Modelagem de Linguagem Visual (VLM) ao domínio do processamento de documentos. Ao contrário dos métodos tradicionais de fragmentação de texto, o sistema permite diretamente...
7 meses atrás
03.1K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Introdução geral O MiniPerplx (renomeado como Scira) é um mecanismo de busca orientado por IA com design minimalista que integra uma variedade de recursos úteis para fornecer aos usuários uma gama completa de serviços de recuperação de informações. O projeto usa uma pilha de tecnologia moderna, incluindo Next.js, Tailwi...
7 meses atrás
03.2K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução abrangente O Diffbot LLM Reasoning Server é um sistema inovador de modelagem de linguagem em larga escala com otimizações e aprimoramentos especiais baseados na arquitetura do modelo LLama. O recurso mais importante do projeto é a integração do Knowledge Graph em tempo real com a geração aprimorada por recuperação...
7 meses atrás
02.9K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: adicionando iluminação a imagens com ferramentas de pintura inteligentes

Introdução geral O LuminaBrush é uma ferramenta inovadora e interativa de edição de imagens para efeitos de iluminação, com tecnologia de inteligência artificial. O projeto usa uma estrutura de dois estágios para processar imagens: o primeiro estágio transforma a imagem de entrada em uma aparência "uniformemente iluminada", enquanto o segundo estágio gera...
7 meses atrás
03.5K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程

MetaGPT: uma estrutura de colaboração com várias inteligências para criar equipes de desenvolvimento de software de IA para programação de linguagem natural

Introdução abrangente O MetaGPT é uma estrutura inovadora de corpo de inteligência múltipla projetada para simular a operação de uma empresa de software de IA completa. Criado por geekan (Alexander Wu), o objetivo do projeto é combinar modelos GPT com diferentes funções em uma entidade colaborativa...
5 meses atrás
03.4K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Gerador de llms.txt: capture rapidamente o conteúdo do site e gere conjuntos de dados de texto de treinamento LLM.

Introdução abrangente O llmstxt-generator é uma ferramenta profissional de extração e integração de conteúdo da Web dedicada à preparação de conjuntos de dados textuais de alta qualidade para treinamento e inferência em modelagem de linguagem ampla (LLM). A ferramenta foi desenvolvida pela Mendable AI usando o @firec...
7 meses atrás
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Acesso gratuito a GPT-4, Llama-3 e muitos outros modelos de IA via Raycast!

Introdução geral O Raycast-G4F (GPT4Free) é uma poderosa extensão do Raycast que oferece aos usuários acesso gratuito a uma ampla variedade de modelos avançados de IA, incluindo GPT-4 e Llama-3. A extensão não só oferece transmissão de diálogo em tempo real...
7 meses atrás
03.1K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: aprimoramento da experiência de desenvolvimento do Cursor IDE, tornando o Cursor/Windsurf um assistente de programação inteligente semelhante ao Devin

Introdução geral O Devin.cursorrules é um projeto inovador de código aberto criado para converter o Cursor ou o Windsurf IDE (~US$ 20) em um poderoso assistente de programação com IA, como o Devin. O projeto fornece um conjunto de ...
7 meses atrás
03.3K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Introdução abrangente Fish Speech Derivative Project O Fish Agent é um sistema revolucionário de clonagem de fala de IA de ponta a ponta desenvolvido com base na arquitetura do modelo V0.1 3B. Como um sistema de processamento de clonagem de fala de ponta a ponta, seu recurso mais importante é o uso de...
7 meses atrás
03.2K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...
7 meses atrás
03.7K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力

Dify-WebUI: um cliente de diálogo inteligente para desktop baseado na API Dify, que oferece recursos de diálogo de IA de nível empresarial

Introdução abrangente O Dify-WebUI é um aplicativo moderno de diálogo inteligente para desktop baseado na API do Dify, projetado para fornecer às empresas recursos avançados de diálogo com IA. O aplicativo oferece suporte a uma variedade de cores de temas predefinidos para atender às necessidades individuais das empresas e tem uma função de gerenciamento de base de conhecimento para...
7 meses atrás
03.4K
小红书AI运营助手:自动生成和发布小红书文章

Assistente de operação de IA do Xiaohongshu: gera e publica automaticamente artigos do Xiaohongshu

Introdução abrangente O Xiaohongshu AI Operation Assistant (xhsaipublisher) é uma ferramenta de automação projetada para publicar artigos na plataforma Xiaohongshu. O projeto combina uma interface gráfica de usuário com scripts de automação para gerar conteúdo usando a tecnologia de modelo grande e fazer login e publicar automaticamente pelo navegador...
7 meses atrás
03.8K
微信Markdown编辑器:简洁高效的微信图文排版工具,一键粘贴文章到微信公众号

Editor WeChat Markdown: ferramentas simples e eficientes de layout gráfico do WeChat, uma chave para colar o artigo no número público do WeChat

Introdução abrangente O WeChat Markdown Editor (WeChat Markdown Editor) é uma ferramenta de layout gráfico do WeChat altamente concisa, projetada para ajudar os usuários a criar facilmente belas postagens no WeChat. O editor é compatível com todos os recursos básicos do Markdown ...
7 meses atrás
02.7K
Orquestra: Criando equipes de IA inteligentes para um desenvolvimento colaborativo multiinteligência mais fácil e eficiente

Orquestra: Criando equipes de IA inteligentes para um desenvolvimento colaborativo multiinteligência mais fácil e eficiente

O Orchestra é uma estrutura Python leve e inovadora que se concentra na criação de sistemas colaborativos de várias inteligências com base no Large Language Model (LLM). Ele emprega um método exclusivo de organização de inteligências para que várias inteligências de IA possam trabalhar em harmonia como uma orquestra sinfônica. Ao modelar ...
7 meses atrás
02.1K
GraphAgent:构建知识图谱,自动化任务规划与执行

GraphAgent: criação de gráficos de conhecimento para automatizar o planejamento e a execução de tarefas

Introdução abrangente O GraphAgent é um sistema de corpo inteligente automatizado que integra geração de gráficos, planejamento de tarefas e execução de tarefas. Ele é capaz de processar dados estruturados e não estruturados, criar gráficos de dependência semântica complexos e executar com eficiência as tarefas do usuário por meio de autoplanejamento e correspondência de ferramentas.
7 meses atrás
02.3K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: um conjunto de ferramentas em contêineres para implantar ambientes locais de desenvolvimento do LLM com um clique e gerenciar e executar facilmente os serviços de IA

Introdução geral O Harbor é um conjunto revolucionário de ferramentas LLM em contêineres, focado na simplificação da implantação e do gerenciamento de ambientes locais de desenvolvimento de IA. Ele permite que os desenvolvedores tenham uma interface de linha de comando (CLI) limpa e um aplicativo complementar para iniciar e gerenciar com um único clique, incluindo back-ends de LLM, interfaces de API, front-end...
7 meses atrás
02.7K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: extração e categorização de documentos em dados estruturados para otimizar o processo de manuseio de documentos

Introdução abrangente O ExtractThinker é uma ferramenta flexível de inteligência de documentos que extrai e classifica dados estruturados de documentos usando Modelos de Linguagem Grandes (LLMs), fornecendo um fluxo de trabalho de processamento de documentos semelhante ao ORM. Ele é compatível com vários carregadores de documentos, incluindo o Tess...
7 meses atrás
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: Projeto de código aberto que permite que a IA assuma a operação remota de computadores e os controle usando linguagem natural

Introdução geral O NeoAI é uma ferramenta inovadora de assistente de IA de código aberto que permite aos usuários controlar e gerenciar facilmente seus computadores por meio de diálogo em linguagem natural. Sem escrever nenhum código, os usuários podem encontrar arquivos, automatizar tarefas, gerenciar dispositivos e muito mais com apenas um diálogo diário.
7 meses atrás
04.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: ferramenta de IA para extrair roupas de uma pessoa como uma imagem de exibição de roupas em mosaico

Introdução abrangente O TryOffAnyone é uma ferramenta inovadora de processamento de imagens de IA projetada para resolver os desafios da exibição de roupas no setor de comércio eletrônico. Ele é capaz de converter de forma inteligente fotos de pessoas reais vestindo roupas em imagens com efeito de exibição plana, essa tecnologia é baseada na mais recente tecnologia de...
7 meses atrás
02.6K
Agentarium: gerenciamento e coordenação de interações entre várias inteligências de IA

Agentarium: gerenciamento e coordenação de interações entre várias inteligências de IA

Introdução geral O Agentarium é uma poderosa estrutura Python dedicada ao gerenciamento e à orquestração de agentes inteligentes de IA (agentes). A estrutura oferece uma maneira flexível e intuitiva de criar, gerenciar e orquestrar interações entre vários agentes de IA. Ele usa o A...
7 meses atrás
03K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型

LTX Video (LTXV): um modelo de código aberto de geração de vídeo em tempo real para gerar vídeo de alta qualidade

Introdução geral O LTX-Video é o primeiro modelo de geração de vídeo em tempo real baseado em DiT (Diffusion Transformer) desenvolvido pela Lightricks. O modelo é capaz de gerar alta qualidade com resolução de 768x512 a 24 quadros por segundo...
7 meses atrás
04.1K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI: Uma palavra pronta para rastreamento da Web, sem necessidade de escrever regras Ferramenta inteligente de extração de conteúdo da Web

Introdução abrangente O ScrapeGraphAI é uma biblioteca inovadora de raspagem da Web em Python que combina de forma inteligente a Modelagem de Linguagem Grande (LLM) e a Lógica Gráfica Direta para criar pipelines de raspagem para sites e documentos locais. O que torna essa ferramenta única é seu nível perfeito de simplicidade e potência...
7 meses atrás
02.2K
AnkiAIUtils: Conjunto de ferramentas de IA para aprendizado de cartões de memória Anki, um assistente inteligente que otimiza automaticamente os cartões de memória

AnkiAIUtils: Conjunto de ferramentas de IA para aprendizado de cartões de memória Anki, um assistente inteligente que otimiza automaticamente os cartões de memória

Descrição geral O AnkiAIUtils é um conjunto de ferramentas aprimoradas por IA projetado para o sistema de aprendizado de flashcards Anki. Desenvolvida por um estudante de medicina, a ferramenta foi projetada para melhorar automaticamente os cartões com os quais os usuários estão tendo dificuldades durante o processo de aprendizagem por meio da tecnologia de IA. Ela fornece aos usuários, de forma inteligente,...
7 meses atrás
02.9K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter: gerar ilustrações gráficas contínuas e consistentes com base em uma longa história.

Introdução geral O Story-Adapter é uma estrutura inovadora de visualização de histórias que converte histórias textuais em sequências de imagens coerentes. Desenvolvido por pesquisadores, esse projeto emprega uma abordagem iterativa que não requer treinamento para gerar ilustrações de histórias de alta qualidade. A estrutura é caracterizada por sua capacidade de lidar com longas...
7 meses atrás
02.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图

GitDiagram: visualize a estrutura da sua base de código do GitHub e transforme seu repositório de código em um diagrama interativo da arquitetura do sistema.

Introdução geral O GitDiagram é uma ferramenta inovadora de visualização da base de código do GitHub que transforma rapidamente qualquer repositório do GitHub em um diagrama interativo da arquitetura do sistema. Ele usa tecnologia avançada de IA (Claude 3.5 Sonnet) para fornecer aos desenvolvedores...
7 meses atrás
04.4K
ElizaOS:构建自主执行的多智能体,功能完备的开源AI智能体开发框架

ElizaOS: criação de multiinteligentes de execução autônoma, uma estrutura de desenvolvimento de corpo inteligente de IA de código aberto totalmente funcional

Introdução abrangente O Eliza é uma estrutura avançada de desenvolvimento de corpos inteligentes múltiplos (Multi-Agent), comprometida em simplificar a construção e a implementação do processo de corpos inteligentes autônomos (Autonomous Agent). Ele oferece suporte à implementação de vários corpos inteligentes com diferentes configurações de função, podendo ...
7 meses atrás
04.1K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: converta ebooks em audiolivros, ferramenta de código aberto com suporte multilíngue e clonagem de voz

Introdução geral O ebook2audiobook é uma poderosa ferramenta de código aberto de ebook para audiolivro. Ela é capaz de converter livros eletrônicos em vários formatos em audiolivros com marcadores de capítulos e metadados completos. A ferramenta usa o Calibre para a conversão do formato do livro eletrônico usando o Co...
7 meses atrás
03.7K
Memary:利用知识图谱增强Agent长期记忆的开源项目

Memary: um projeto de código aberto para aprimorar a memória de longo prazo do agente usando gráficos de conhecimento

Introdução geral O Memary é um projeto inovador de código aberto voltado para o fornecimento de soluções de gerenciamento de memória de longo prazo para inteligências autônomas. O projeto ajuda as inteligências a romper as limitações das janelas de contexto tradicionais para obter experiências de interação mais inteligentes por meio de gráficos de conhecimento e módulos de memória especializados.
7 meses atrás
04.2K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结

IA lê livros: a IA lê livros em PDF página por página, extrai automaticamente os principais pontos de conhecimento e gera resumos.

Introdução abrangente O AI-reads-books-page-by-page é um desenvolvimento baseado em Python de uma ferramenta inteligente de análise de livros em PDF, que pode automatizar a análise página a página de livros em PDF, extrair os principais pontos de conhecimento e, após o intervalo de página especificado, gerar o estágio...
7 meses atrás
03.5K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交

Melty: experimente um editor de código com tecnologia de IA, transforme cada conversa em um commit do Git!

Introdução geral O Melty é um editor de código de IA revolucionário que combina conversas de bate-papo com o controle de versão do Git. Desenvolvida por Charlie e Jackson da Replicate, essa ferramenta tem como objetivo resolver os pontos problemáticos das ferramentas tradicionais de codificação de IA. Seu maior ...
7 meses atrás
02.6K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码

Aide: extensão auxiliar de IA que aprimora a experiência de desenvolvimento do VSCode, anotação com um clique, conversão e geração de código na interface do usuário

Introdução geral O AIDE (AI-assisted Development Extension) é uma poderosa extensão de desenvolvimento assistido por IA para o VSCode, com foco no fornecimento de assistência de programação de IA exclusiva e útil. Ela é diferente do GitHu...
7 meses atrás
03K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText: gere e edite texto de imagem em vários idiomas, altamente controlável para gerar várias linhas de chinês na imagem

Introdução abrangente O AnyText é uma ferramenta revolucionária de geração e edição de texto visual multilíngue desenvolvida com base no modelo de difusão. Ele gera texto multilíngue natural e de alta qualidade em imagens e oferece suporte a recursos flexíveis de edição de texto. Ele foi desenvolvido por uma equipe de pesquisadores e apresentado no ICLR 2024...
7 meses atrás
03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端

AIGCPanel: clone de código aberto do sistema de integração digital man, implantação com um clique do cliente digital man gratuito

Introdução abrangente O AigcPanel é um sistema completo de produção humana digital de IA para todos os usuários, desenvolvido com a pilha de tecnologia electron+vue3+typescript, com suporte à implementação com um clique no Windows. O sistema foi projetado para ser fácil de usar como o núcleo, mesmo...
7 meses atrás
03.3K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

Galeria de desenvolvimento de IA: Conjunto de ferramentas de desenvolvimento de modelos de IA nativos do Windows, integração de modelos do lado final em aplicativos do Windows

Introdução geral O AI Dev Gallery é um aplicativo de ferramentas de desenvolvimento de IA da Microsoft (atualmente em visualização pública) projetado para desenvolvedores do Windows. Ele fornece uma plataforma abrangente para ajudar os desenvolvedores a integrar facilmente os recursos de IA em seus...
7 meses atrás
02.8K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

Edge TTS Worker: implantação de APIs de síntese de fala da Microsoft usando Cloudflare, formato compatível com OpenAI e interface da Web empacotada

Introdução geral O Edge TTS Worker (que depende do edge-tts) é um serviço de proxy implantado no Cloudflare Worker que encapsula o serviço Microsoft Edge TTS em um formato compatível com o OpenAI ...
8 meses atrás
04K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...
8 meses atrás
03K
Copilot后端代理服务:用其他模型接管GitHub Copilot插件服务端

Serviço de proxy de back-end do Copilot: assumir o servidor de plug-in do GitHub Copilot com outros modelos

Introdução geral O Copilot Backend Agent Service é um projeto de código aberto desenvolvido para gerenciar o servidor de plug-in do Copilot do GitHub, aproveitando outros modelos de FIM, como o DeepSeek, e oferecendo suporte a várias pessoas que compartilham contas oficiais. O serviço oferece suporte a uma variedade de IDEs, incluindo o V...
8 meses atrás
02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: a API do modelo Gemini é compatível com o formato OpenAI, desbloqueando restrições de região e oferecendo suporte à pesquisa de chaves de várias APIs.

Introdução abrangente O Gemini Balance é um serviço proxy de API OpenAI desenvolvido com base na estrutura FastAPI, com o objetivo de fornecer recursos eficientes de otimização e gerenciamento de chaves de várias APIs. O projeto é compatível com as chamadas do modelo Gemini, e os principais recursos incluem...
4 meses atrás
02.9K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词

DeepSeek Engineer: um assistente de codificação experimental baseado na API do DeepSeek, com palavras-chave

Descrição geral O DeepSeek Engineer é uma poderosa ferramenta de assistente de programação baseada na API do DeepSeek, capaz de interagir com o usuário por meio de uma interface de linha de comando intuitiva para auxiliar em uma variedade de tarefas de desenvolvimento de software. A ferramenta combina o poder da modelagem de linguagem em larga escala com...
6 meses atrás
03K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat: interface simples de bate-papo na Web com modelos de IA multiplataforma integrados (sem implantação)

Introdução geral O OrionChat é uma interface de bate-papo de IA baseada na Web que oferece aos usuários uma plataforma unificada para interagir com vários modelos de IA convencionais. O projeto oferece suporte a uma ampla gama de modelos de IA, incluindo Ollama (executado localmente), OpenAI GPT, Google Gemi...
8 meses atrás
02.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具

X-Kit: rastreamento e análise de dados do Twitter para dados e tweets de usuários X

Introdução geral O X-Kit é uma ferramenta de código aberto criada para rastrear e analisar dados e tweets de usuários do X (antigo Twitter). Desenvolvida pelo usuário do GitHub xiaoxiunique, a ferramenta foi projetada para ajudar os usuários a automatizar o processo de obtenção de informações básicas e tweets sobre um determinado usuário do X e...
8 meses atrás
02.9K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结

AI2SRT: Crie vídeos curtos narrados ou resumos de vídeo para vídeos longos com um clique usando o modelo Gemini

Introdução abrangente O AI2SRT é um projeto de código aberto que usa o modelo GeminiAI big para gerar vídeos curtos narrados e resumos de vídeo para vídeos longos com um clique, além de oferecer suporte a legendas de transcrição de áudio e vídeo. O projeto tem como objetivo simplificar o processo de criação de conteúdo de vídeo e fornecer funções eficientes de geração e tradução de legendas. Os usuários podem passar...
8 meses atrás
03K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: modelo de linguagem visual inteligente de código aberto da Smart Spectrum para automação de interfaces gráficas

Introdução abrangente O CogAgent é um modelo de linguagem visual de código aberto desenvolvido pelo Grupo de Pesquisa de Mineração de Dados da Universidade de Tsinghua (THUDM), com o objetivo de automatizar a operação da Interface Gráfica do Usuário (GUI) em várias plataformas. O modelo é baseado no CogVLM (GLM-4V-9B) e oferece suporte a idiomas bilíngues chinês e inglês...
8 meses atrás
02.9K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

DisPose: geração de vídeos com controle preciso da postura humana, criando damas dançantes

Introdução geral O DisPose é um projeto inovador de inteligência artificial de código aberto voltado para a geração controlada de animação de imagens de personagens. Desenvolvido por uma equipe de pesquisadores e com código aberto no GitHub, o projeto usa técnicas avançadas de aprendizagem profunda para obter um controle preciso da animação de personagens decompondo as informações de pose do esqueleto.
8 meses atrás
02.5K
Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências

Smolagents: projeto de código aberto para desenvolvimento rápido de inteligências de IA e construção leve de inteligências

Introdução abrangente Smolagents é uma biblioteca de agente inteligente leve desenvolvida pela HuggingFace que se concentra em simplificar o processo de desenvolvimento de sistemas de agente de IA. O projeto é conhecido por sua simplicidade na filosofia de design, com apenas cerca de 1.000 linhas de código principal, mas oferece recursos avançados de integração de recursos. Ele é mais ...
7 meses atrás
04.2K
Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Vision Parse: conversão inteligente de documentos PDF para o formato Markdown usando modelos de linguagem visual

Introdução abrangente O Vision Parse é uma ferramenta revolucionária de processamento de documentos, que combina de forma inteligente a mais avançada tecnologia de modelos de linguagem visual (Vision Language Models), a capacidade de converter documentos PDF de forma inteligente em um formato Markdown de alta qualidade...
8 meses atrás
02.7K
InvSR:开源图像超分辨率项目,提升图像分辨率质量

InvSR: Projeto de super-resolução de imagem de código aberto para melhorar a qualidade da resolução da imagem

Introdução geral O InvSR é um projeto inovador de super-resolução de imagens de código aberto baseado em técnicas de inversão de difusão capazes de converter imagens de baixa resolução em imagens de alta resolução e alta qualidade. O projeto explora o rico conhecimento prévio da imagem incorporado em modelos de difusão em larga escala pré-treinados e, por meio de um mecanismo de amostragem flexível, oferece suporte...
8 meses atrás
03.5K
Infinity:生成高分辨率图像的比特自回归建模,实现无限制高分辨率图像生成

Infinity: modelagem autorregressiva bit a bit da geração de imagens de alta resolução para geração ilimitada de imagens de alta resolução

Introdução geral O Infinity é uma estrutura inovadora de geração de imagens de alta resolução desenvolvida pela equipe da FoundationVision. O projeto rompe as limitações dos modelos tradicionais de geração de imagens por meio de uma abordagem inovadora de modelagem autorregressiva visual em nível de bits...
8 meses atrás
03.5K
GPTme:在命令行终端中运行的智能编程助手,ChatGPT代码解释器的本地化替代方案

GPTme: assistente de programação inteligente executado em um terminal de linha de comando, alternativa localizada para o interpretador de código ChatGPT

Introdução abrangente O GPTMe é uma ferramenta revolucionária de assistente de IA de terminal projetada para aumentar a eficiência do trabalho dos desenvolvedores. Ele combina perfeitamente recursos avançados de IA com o ambiente do terminal, oferecendo suporte a diversas funções, como execução de código, edição de arquivos, navegação na Web e reconhecimento visual. Como solução de código do ChatGPT...
8 meses atrás
02.8K
ChatGPT 服务降级监测工具:检测 ChatGPT 服务降智情况

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Introdução abrangente A ferramenta de monitoramento de degradação do serviço ChatGPT é um projeto de código aberto criado para ajudar os usuários a detectar se o serviço ChatGPT foi degradado devido a IPs de alto risco. A ferramenta analisa os valores de dificuldade do Proof of Work (PoW) para determinar se os usuários...
8 meses atrás
02.8K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo

LogoCreator: gerador de logotipos de código aberto, que usa inteligência artificial para gerar logotipos de marcas profissionais

Introdução geral O LogoCreator é um gerador de logotipos de código aberto baseado no modelo Together AI e Flux, com foco no fornecimento de serviços rápidos e profissionais de design de logotipos para empresas e indivíduos. O projeto foi desenvolvido e tem código aberto pelo desenvolvedor Nutlope no Git...
8 meses atrás
03.3K
KAG:知识图谱与向量混合检索的专业知识库问答框架

KAG: uma estrutura de perguntas e respostas de base de conhecimento profissional para recuperação híbrida de gráficos de conhecimento e vetores

Introdução abrangente O KAG (Knowledge Augmented Generation) é uma estrutura de raciocínio e recuperação orientada por forma lógica baseada no mecanismo OpenSPG e em modelos de linguagem ampla (LLMs). A estrutura foi projetada especificamente para criar bases de conhecimento de domínio profissional...
8 meses atrás
04.3K
VideoSeal:先进的开源视频隐藏水印嵌入与提取工具,保护视频版权

VideoSeal: Ferramenta avançada de incorporação e extração de marca d'água oculta em vídeo de código aberto para proteger os direitos autorais de vídeo

Introdução geral O VideoSeal é uma ferramenta de marca d'água de vídeo de código aberto desenvolvida pela Facebook Research, projetada para fornecer incorporação e extração eficientes de marcas d'água de vídeo. A ferramenta é compatível com os modelos de código aberto mais recentes e contém modelos pré-treinados, código de treinamento, código de inferência e ferramentas de avaliação...
8 meses atrás
02.8K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库

Languine: tradução de aplicativos usando IA, compatível com todas as principais bibliotecas de i18n

Introdução geral O Languine é uma poderosa ferramenta de tradução desenvolvida pelo Midday para ajudar os desenvolvedores a simplificar o processo de localização de seus aplicativos. Com o Languine, os desenvolvedores podem aproveitar a tecnologia de IA para gerar rapidamente traduções precisas e contextualizadas, com suporte a mais de...
8 meses atrás
02.9K