Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 958 artigos

Tags: ai projetos de código aberto Página 29

Ollama OCR:使用Ollama中视觉模型提取图像中的文本-首席AI分享圈

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama

Introdução abrangente O Ollama OCR é um poderoso kit de ferramentas de reconhecimento óptico de caracteres (OCR) que usa o modelo de linguagem visual de última geração fornecido pela plataforma Ollama para extrair texto de imagens. O projeto está disponível como um pacote Python e fornece uma interface de aplicativo da Web Streamlit fácil de usar. Ele oferece suporte a vários ...

FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性-首席AI分享圈

FitDiT: uma ferramenta de ajuste virtual de IA de alta fidelidade para aprimorar a autenticidade dos detalhes das roupas

Introdução abrangente O FitDiT é um sistema de ajuste virtual de alta fidelidade baseado em transformadores de difusão (Diffusion Transformers). Desenvolvido pelo Tencent AI Lab, o projeto tem como objetivo abordar as limitações dos sistemas de ajuste virtual tradicionais na exibição de detalhes do vestuário.

Thin-Plate-Spline-Motion-Model:静态人像图参考视频人像动作生成视频-首席AI分享圈

Thin-Plate-Spline-Motion-Model: Vídeo de referência de mapa de retrato estático Vídeo de geração de movimento de retrato

Introdução geral O Thin-Plate-Spline-Motion-Model é um projeto inovador de geração de animação de imagens apresentado na CVPR 2022. O projeto baseia-se na teoria das transformações de spline de placa fina e é capaz de obter animação de alta qualidade de imagens estáticas com base em vídeo de unidade. O projeto usa uma estrutura de aprendizado não supervisionado de ponta a ponta ...

DUIX:实时互动的智能数字人,支持多平台一键部署-首席AI分享圈

DUIX: pessoas digitais inteligentes para interação em tempo real, com suporte à implantação multiplataforma com um clique

Introdução geral O DUIX (Dialogue User Interface System) é uma plataforma de interação humana digital orientada por IA criada pela Silicon Intelligence. Com recursos de interação humana digital de código aberto, os desenvolvedores podem integrar facilmente a modelagem em larga escala, o reconhecimento automático de fala (ASR) e os recursos de conversão de texto em fala (TTS) para obter interação com...

Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景-首席AI分享圈

Fay Digital Human Framework: integração de modelos de linguagem e caracteres digitais 3D para dar suporte a vários cenários de aplicativos

Introdução abrangente O Fay é uma estrutura humana digital virtual 3D de código aberto que integra modelos de linguagem e caracteres digitais para uma variedade de cenários de aplicativos, como guias de compras virtuais, âncoras virtuais, assistentes, garçons, professores e assistentes móveis baseados em voz ou texto.

MOFA Video:运动场适配技术将静态图像转换为视频-首席AI分享圈

Vídeo MOFA: a tecnologia de adaptação de campo de movimento converte imagens estáticas em vídeo

Introdução geral O MOFA-Video é uma ferramenta avançada de geração de animação de imagens que usa técnicas generativas de adaptação de campo de movimento para converter imagens estáticas em vídeos dinâmicos. Ela foi desenvolvida em colaboração com a Universidade de Tóquio e o Tencent AI Lab e será apresentada na Conferência Europeia sobre Visão Computacional (ECCV) 2024.

Amurex:开源AI会议记录助手,自动记录会议内容生成总结-首席AI分享圈

Amurex: assistente de gravação de reuniões com IA de código aberto, gravação automática do conteúdo da reunião para gerar resumos

Introdução geral O Amurex é um assistente de reunião de IA de código aberto desenvolvido pela The Personal AI Company que visa melhorar a eficiência da reunião por meio de recursos inteligentes. O Amurex é capaz de fornecer conselhos em tempo real, gerar resumos inteligentes, registrar o conteúdo da reunião e enviar automaticamente e-mails de acompanhamento. Seu design se concentra na transparência, segurança e...

E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统-首席AI分享圈

E2B Open Computer Use: Executando um sistema operacional de IA com segurança na área restrita da E2B

Introdução geral O E2B Open Computer Use é um projeto de código aberto que tem como objetivo fornecer uma experiência segura de uso de computador Linux baseado em nuvem por meio do E2B Desktop Sandbox. O E2B Sandbox fornece um ambiente gráfico de desktop que os usuários podem conectar a qualquer Modelo de Linguagem Grande (LLM) para controlar computadores, suportando...

Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手-首席AI分享圈

Agent Laboratory: código automatizado e assistente de redação de estudos para pesquisadores

Introdução abrangente O Agent Laboratory é um fluxo de trabalho de pesquisa autônomo de ponta a ponta projetado para ajudar os pesquisadores a concretizar suas ideias de pesquisa. O sistema consiste em agentes dedicados, orientados por modelos de linguagem em grande escala, que dão suporte a todo o fluxo de trabalho de pesquisa, desde a realização de revisões da literatura e o desenvolvimento de planos até a execução de experimentos e a elaboração de sínteses...

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)-首席AI分享圈

API Kokoro TTS: wrapper FastAPI do Docker para conversão rápida de texto em fala (modelo Kokoro-82M)

Introdução abrangente O Kokoro-FastAPI é um pacote FastAPI baseado no Docker projetado para oferecer suporte ao modelo de conversão de texto em fala Kokoro-82M. O projeto é compatível com a aceleração da GPU NVIDIA e fornece processamento de filas e emenda automática para tornar a saída de fala do texto adulto bruto mais eficiente e coerente. O projeto ...

CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点-首席AI分享圈

CoolCline: outra versão aprimorada do assistente de codificação inteligente do Cline, combinando os benefícios do ClineRoo Cline e do Bao Cline.

Descrição geral O CoolCline é um poderoso assistente de codificação que combina os melhores recursos do Cline, Roo Cline e Bao Cline. Ele funciona perfeitamente com a interface de linha de comando (CLI) e com o editor para proporcionar a mais avançada experiência de desenvolvimento de IA.O CoolCline é um projeto de código aberto...

J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持-首席AI分享圈

J.A.R.V.I.S.: assistente de código inteligente com reconhecimento de contexto, geração e modificação de código, suporte a vários IDEs

Introdução geral O J.A.R.V.I.S. (Just A Rather Very Intelligent System) é um assistente de código inteligente projetado para ajudar os desenvolvedores na geração de código, modificação e discussões técnicas usando vários modelos de linguagem de última geração. O projeto foi criado por Danilo Falcao e está hospedado no GitHub.J....

AI投资系统:自动化A股投资决策系统,利用多智能体系统分析市场数据-首席AI分享圈

Sistema de investimento em IA: sistema automatizado de tomada de decisões de investimento em ações da categoria A, usando um sistema de inteligência múltipla para analisar dados de mercado

Descrição geral O A_Share_investment_Agent é um auxiliar de decisão de investimento em ações da categoria A baseado em um sistema de inteligência múltipla. O sistema foi projetado para gerar sinais de negociação usando várias inteligências colaboradoras para analisar dados de mercado, calcular o valor intrínseco de uma ação, analisar o sentimento do mercado e dados fundamentais. Essa abordagem pode...

Company Researcher:公司研究工具,输入公司网址以获取详细研究信息-首席AI分享圈

Pesquisador de empresas: uma ferramenta de pesquisa de empresas, insira o endereço da Web de uma empresa para obter informações de pesquisa detalhadas.

Descrição geral O Company Researcher (Pesquisador de empresas) é uma ferramenta gratuita e de código aberto criada para ajudar os usuários a obter uma visão geral rápida e abrangente de qualquer empresa. Basta inserir o URL da empresa e a ferramenta reunirá informações abrangentes da Web, apresentando informações sobre a organização, seus produtos, financiamentos, presença social...

GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新-首席AI分享圈

GitPodcast: Transforme seus repositórios do GitHub em podcasts e ouça as atualizações de código a qualquer hora, em qualquer lugar!

Introdução geral O GitPodcast é uma ferramenta inovadora projetada para transformar os repositórios do GitHub em podcasts, permitindo que os desenvolvedores ouçam as atualizações de código a qualquer momento e em qualquer lugar. Usando o OpenAI e o Azure Speech SDK, o GitPodcast é capaz de transformar os repositórios do GitHub em podcasts de registros de confirmação, solicitações de puxar e milhagem...

Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统-首席AI分享圈

Paperless-AI: análise e marcação automática de documentos usando IA para o sistema de gerenciamento de documentos paperless-ngx

Introdução geral O Paperless-AI é uma ferramenta inovadora de análise de automação de documentos projetada especificamente para o sistema de gerenciamento de documentos Paperless-ngx. Ela combina de forma inteligente a API OpenAI com uma variedade de modelos avançados de IA, como Ollama (incluindo Mistral, LLaMA, PHI-3 e Gemma 2),...

Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台-首席AI分享圈

Cosmos: World Base Model, uma plataforma para criar modelos de base de IA do mundo físico

Introdução abrangente O NVIDIA Cosmos é uma plataforma de modelo de base mundial para desenvolvedores projetada especificamente para ajudar os desenvolvedores de IA de física a criar seus sistemas de IA de física de forma melhor e mais rápida. A plataforma oferece uma variedade de modelos pré-treinados, incluindo modelos de base mundial baseados em difusão e autorregressão para...

Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体-首席AI分享圈

Mini LLM Flow: criando mini-inteligências LLM com "estrutura de gráfico direcionado" em 100 linhas de código

Introdução geral O miniLLMFlow é uma estrutura de desenvolvimento minimalista do Large Language Model (LLM) que contém apenas 100 linhas de código principal, destacando a filosofia de design de "o caminho é simples". A estrutura foi projetada especificamente para permitir que os assistentes de IA (por exemplo, ChatGPT, Claude etc.) sejam programados de forma autônoma, com suporte para inteligência múltipla, decomposição de tarefas e...

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动-首席AI分享圈

Xiaozhi AI Chatbot: crie seu companheiro de bate-papo com IA, diálogo de voz fácil e interação inteligente

Introdução abrangente O Xiaozhi AI Chatbot é um projeto de código aberto baseado na placa de desenvolvimento ESP32, projetado para ajudar os usuários a criar seu próprio companheiro de bate-papo com IA. O projeto foi desenvolvido pela Shrimp e é usado principalmente para fins didáticos para ajudar mais pessoas a começar a desenvolver hardware de IA e entender como aplicar o modelo de linguagem grande a dispositivos de hardware reais...

pt_BRPortuguês do Brasil