Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 966 artigos

Tags: ai projetos de código aberto Página 3

RolmOCR:识别手写和倾斜字符的文档OCR模型-首席AI分享圈

RolmOCR: modelo de OCR de documentos para reconhecimento de caracteres manuscritos e inclinados

Introdução abrangente O RolmOCR é uma ferramenta de reconhecimento óptico de caracteres (OCR) de código aberto desenvolvida pela equipe da Reducto AI, com base no modelo de linguagem visual Qwen2.5-VL-7B. Ela pode extrair texto de imagens e arquivos PDF mais rapidamente do que ferramentas semelhantes, como o olmOCR, com menor consumo de memória.

KrillinAI:一键翻译和配音的视频多语言全球化工具-首席AI分享圈

KrillinAI: ferramenta de globalização multilíngue para vídeo com tradução e dublagem em um clique

Introdução abrangente O KrillinAI é uma ferramenta de processamento de vídeo de código aberto que se concentra no uso da inteligência artificial para ajudar os usuários a traduzir vídeos e dublá-los automaticamente. Ela pode começar desde o download do vídeo até a geração do produto final adaptado a diferentes plataformas, e todo o processo é feito com apenas alguns cliques. Os desenvolvedores fornecem código gratuito no GitHub, e os usuários podem...

AiryLark:支持多格式文档智能翻译的开源工具-首席AI分享圈

AiryLark: ferramenta de código aberto para tradução inteligente de documentos em vários formatos

Introdução abrangente O AiryLark é uma ferramenta de processamento e tradução de documentos de código aberto, hospedada no GitHub, criada pelo desenvolvedor wizd com base na estrutura Next.js. Ele é compatível com vários formatos de arquivo (como PDF, Word, TXT, Markdown) para entrada e processamento, além de oferecer recursos de tradução inteligente. Os usuários podem ...

Zola:支持文档上传与多模型的开源AI聊天Web应用-首席AI分享圈

Zola: aplicativo da Web de bate-papo de IA de código aberto com upload de documentos e suporte a vários modelos

Introdução geral O Zola é um aplicativo de bate-papo com IA gratuito e de código aberto desenvolvido pelo desenvolvedor Julien Thibeaut (nome de usuário ibelick do GitHub) e hospedado no GitHub. Seu melhor recurso é que ele suporta vários modelos de IA, como OpenAI e Mistral, dando aos usuários a liberdade de escolher entre diferentes modelos...

DeepResearcher:基于强化学习驱动AI研究复杂问题-首席AI分享圈

DeepResearcher: IA de condução baseada em aprendizado por reforço para estudar problemas complexos

Introdução abrangente O DeepResearcher é um projeto de código aberto desenvolvido pela equipe GAIR-NLP da Shanghai Jiao Tong University. É uma ferramenta de pesquisa inteligente baseada em modelos de linguagem grande (LLMs) com treinamento de ponta a ponta em ambientes de rede reais por meio da aprendizagem por reforço (RL). O projeto tem como objetivo ajudar os usuários a concluir com eficiência pesquisas complexas ...

AnimeGamer:用语言指令生成动漫视频和角色互动的开源工具-首席AI分享圈

AnimeGamer: uma ferramenta de código aberto para gerar vídeos de anime e interações de personagens com comandos linguísticos

O AnimeGamer é uma ferramenta de código aberto do ARC Lab da Tencent. Os usuários podem gerar vídeos de anime com comandos verbais simples, como "Sousuke dirige em um carro roxo", e também permitir que diferentes personagens de anime interajam, como Kiki, de Magical Girl's House, e Pazuzu, de Castle in the Sky Meeting. Ele...

Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型-首席AI分享圈

Lumina-mGPT-2.0: um modelo autorregressivo de geração de imagens para lidar com várias tarefas de geração de imagens

Introdução geral O Lumina-mGPT-2.0 é um projeto de código aberto desenvolvido em conjunto pelo Laboratório de IA de Xangai (Shanghai AI Laboratory), pela Universidade Chinesa de Hong Kong (CUHK) e por outras organizações, hospedado no GitHub e mantido pela equipe do Alpha-VLLM. É um modelo autorregressivo autônomo do zero...

Agent S:像人类一样操作电脑的开源智能体框架-首席AI分享圈

Agente S: uma estrutura de código aberto para que corpos inteligentes operem computadores como seres humanos

Introdução geral O Agent S é uma estrutura de código aberto desenvolvida pela Simular AI que permite que as inteligências operem computadores como seres humanos por meio de uma interface gráfica do usuário (GUI). Ele usa um modelo de macrolinguagem multimodal e técnicas de aprendizado empírico para executar tarefas como navegar na Web, editar documentos e usar software. O projeto está no GitHub...

Text2Voice:基于硅基流动API的文本转语音图形界面-首席AI分享圈

Text2Voice: uma interface gráfica de conversão de texto em fala baseada em APIs de fluxo baseadas em silício

Introdução geral O Text2Voice é uma ferramenta de código aberto que fornece funcionalidade de conversão de texto em fala com base em uma API de mobilidade baseada em silício, com uma interface gráfica do usuário (GUI) limpa como seu melhor recurso. Ele foi criado pelo desenvolvedor Sheldon Lee no GitHub para permitir que os usuários transformem facilmente texto em fala por meio de uma interface. O item...

FreeAI:基于Pollinations封装的的免费AI工具-首席AI分享圈

FreeAI: uma ferramenta de IA gratuita baseada no pacote Pollinations.

Introdução geral O FreeAI é uma plataforma de aplicativos de IA de código aberto baseada na API Pollinations.AI, que fornece assistentes de bate-papo de IA gratuitos e ilimitados, geração de imagens e serviços de síntese de fala. Criado pelo desenvolvedor Azad-sl no GitHub, o recurso principal do projeto é o uso de arquivos HTML puros para desenvolver...

优化代码生成和展示的Open WebUI-首席AI分享圈

WebUI aberta para geração e apresentação otimizadas de código

Introdução geral O Open WebUI Artifacts Overhaul é um projeto de bifurcação baseado no Open WebUI, desenvolvido pelo desenvolvedor Nick Tonjum. É uma ferramenta de código aberto voltada para o aprimoramento da funcionalidade da IA para geração e apresentação de código. Ela permite que os usuários façam com que a IA gere código e interface diretamente...

OpenAvatarChat:模块化设计的数字人对话工具-首席AI分享圈

OpenAvatarChat: uma ferramenta de diálogo humano digital projetada de forma modular

Introdução geral O OpenAvatarChat é um projeto de código aberto desenvolvido pela equipe HumanAIGC-Engineering e hospedado no GitHub. É uma ferramenta modular de diálogo humano digital que permite aos usuários executar todas as funcionalidades em um único PC. O projeto combina vídeo em tempo real, reconhecimento de fala e tecnologia humana digital...

uniOCR:跨平台开源的文字识别工具-首席AI分享圈

uniOCR: ferramenta de reconhecimento de texto de código aberto multiplataforma

Introdução geral O uniOCR é uma ferramenta de reconhecimento de texto de código aberto desenvolvida pela equipe mediar-ai. Ela é baseada na linguagem Rust e é compatível com os sistemas macOS, Windows e Linux. Ele é compatível com os sistemas macOS, Windows e Linux. Os usuários podem usá-lo para extrair texto de imagens, a operação é simples e gratuita. O principal recurso do uniOCR é o suporte a várias plataformas...

Serena:语义检索和编辑代码的免费MCP工具-首席AI分享圈

Serena: uma ferramenta MCP gratuita para recuperação semântica e edição de código

Introdução geral O Serena é uma ferramenta de programação gratuita e de código aberto desenvolvida pela equipe Oraios AI e hospedada no GitHub. É um assistente de código avançado que funciona diretamente em sua base de código para ajudar os desenvolvedores a analisar, editar e executar o código. O Serena é implementado por meio do Language Server Protocol (LSP)...

EasyControl:将人像转为吉卜力风格图像的免费工具-首席AI分享圈

EasyControl: uma ferramenta gratuita para transformar retratos em imagens no estilo Ghibli

Introdução geral O EasyControl é um projeto de código aberto que oferece controle de geração de imagens eficiente e flexível com base na arquitetura Diffusion Transformer (DiT). Entre eles, o Ghibli Control LoRA é um de seus recursos especiais, usando apenas 100 rostos asiáticos e suas imagens no estilo Ghibli geradas pelo GPT-4o...

YOLOE:实时视频检测和分割物体的开源工具-首席AI分享圈

YOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetos

O YOLOE é um projeto de código-fonte aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch e é uma extensão da série YOLO, que pode detectar e segmentar qualquer objeto em tempo real. O projeto está hospedado no GitHub, ...

集成多种先进语音合成服务的开源运营项目-首席AI分享圈

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala

Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...

pt_BRPortuguês do Brasil