Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 970 artigos

Tags: ai projetos de código aberto Página 22

Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验-首席AI分享圈

Linly-Talker: sistema de diálogo inteligente para pessoas digitais, combinando grandes modelos de linguagem e modelos visuais para novas experiências interativas

Introdução geral O Linly-Talker é um sistema inovador de diálogo humano digital que combina modelos de linguagem grandes (LLMs) com modelos visuais para criar uma nova abordagem para a interação humano-computador. O sistema integra várias tecnologias, como Whisper, Linly, Microsoft Speech Services e SadTalker ...

ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用-首席AI分享圈

ai-gradio: Integre facilmente vários modelos de IA e crie aplicativos multimodais com base no Gradio

Introdução geral O ai-gradio é um kit de ferramentas Python de código aberto projetado para ajudar os desenvolvedores a integrar e usar facilmente vários modelos de IA. Criado com base no Gradio, o projeto oferece uma interface unificada que suporta uma ampla gama de modelos e serviços de IA. Quer se trate de processamento de texto, fala ou vídeo, o ai-gradio fornece...

OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告-首席AI分享圈

OpenDeepResearcher: ferramenta automatizada de pesquisa aprofundada para escrever relatórios de pesquisa completos

Introdução geral O OpenDeepResearcher é uma ferramenta de pesquisa profunda automatizada de código aberto projetada para melhorar a eficiência da pesquisa por meio de técnicas de inteligência artificial. O projeto foi desenvolvido por mshumer e hospedado no GitHub. O OpenDeepResearcher utiliza uma variedade de serviços e tecnologias, incluindo SERPAPI, Jina e O...

ColiVara:基于视觉嵌入的文档存储与检索服务-首席AI分享圈

ColiVara: serviço de armazenamento e recuperação de documentos baseado em incorporação visual

Introdução geral O ColiVara é um serviço de armazenamento e recuperação de documentos baseado na tecnologia de incorporação visual. Ele elimina a necessidade de reconhecimento óptico de caracteres (OCR) ou extração de texto e evita o problema de formulários quebrados ou imagens perdidas. O ColiVara é compatível com mais de 100 formatos de arquivo, incluindo PDF, DOCX, PPTX, etc., e é capaz de...

Cursor Reset: um script para redefinir o identificador do dispositivo para as versões 0.45.x e posteriores do Cursor.

Descrição geral O Cursor Reset é uma ferramenta de script do PowerShell para redefinir o identificador de dispositivo do Cursor IDE, com suporte à versão 0.45.x do Cursor. A ferramenta foi criada para ajudar os usuários a redefinir o identificador de dispositivo no Cursor IDE para fazer login com uma nova conta. O projeto é usado principalmente para aprender e estudar o Cursor ...

n8n自托管AI入门套件:快速搭建本地AI环境的开源模板-首席AI分享圈

n8n Self-hosted AI Starter Kit: um modelo de código aberto para criar rapidamente um ambiente local de IA

Introdução abrangente O n8n Self-Hosted AI Starter Kit é um modelo de código aberto do Docker Compose projetado para inicializar rapidamente um ambiente local abrangente de desenvolvimento de IA e de baixo código. Criado pela equipe da n8n, o pacote combina a plataforma n8n auto-hospedada com uma variedade de produtos e componentes de IA compatíveis para ajudar os usuários a construir rapidamente...

Gemini Teacher:英语口语发音纠正助手-首席AI分享圈

Gemini Teacher: Assistente de correção de pronúncia em inglês

Introdução geral O Gemini Teacher é um assistente de prática de conversação em inglês baseado na IA do Google Gemini. Ele reconhece a pronúncia em inglês do usuário em tempo real e fornece feedback instantâneo e sugestões de correção. A ferramenta foi projetada para ajudar os usuários a melhorar suas habilidades de conversação em inglês por meio de avaliação de pronúncia e correção gramatical orientadas por IA...

bilive:B站无人监守直播录制与自动切片、上传工具-首席AI分享圈

bilive: gravação ao vivo sem supervisão e corte automático, ferramenta de upload para a estação B

Introdução abrangente O bilive é uma ferramenta projetada para gravação ao vivo de estações B, oferecendo gravação ao vivo extremamente rápida, corte automático, renderização de pop-ups e geração de legendas. A ferramenta é compatível com máquinas de configuração ultrabaixa, suporta gravação autônoma de 7x24 horas, identifica e renderiza automaticamente pop-ups e legendas, corta e carrega automaticamente para a estação B...

R1-V:低成本强化学习实现视觉语言模型泛化能力-首席AI分享圈

R1-V: Aprendizado de reforço de baixo custo para a capacidade de generalização de modelos de linguagem visual

Introdução abrangente O R1-V é um projeto de código aberto que visa a obter avanços na modelagem de linguagem visual (VLM) por meio da aprendizagem por reforço (RL) de baixo custo. O projeto utiliza mecanismos de recompensa verificáveis para motivar os VLMs a aprender habilidades genéricas de contagem. Surpreendentemente, o modelo 2B do R1-V foi capaz de aprender a habilidade de contagem em apenas 100 etapas de treinamento...

PPTX2MD:将PPTX文件转换为Markdown的专用工具-首席AI分享圈

PPTX2MD: ferramenta especial para converter arquivos PPTX em Markdown

Introdução geral O PPTX2MD é uma ferramenta de código aberto criada para converter arquivos PPTX do PowerPoint para o formato Markdown. Desenvolvida pelo usuário do GitHub ssine, a ferramenta suporta a retenção de cabeçalhos, listas, formatação de texto (como negrito, itálico, cores e hiperlinks), imagens e tabelas em vários formatos.PPTX2MD...

DSPy Examples:展示DSPy功能的实用示例-首席AI分享圈

Exemplos de DSPy: Exemplos práticos que demonstram a funcionalidade do DSPy

Introdução geral A base de código de exemplo DSPy é uma base de código do GitHub mantida pela equipe de IA da Langtrace que apresenta uma variedade de exemplos de programas de IA criados usando DSPy. A base de código foi projetada para ajudar os desenvolvedores a entender melhor e aplicar o DSPy para o desenvolvimento de programas de IA, demonstrando os vários recursos do DSPy por meio de exemplos do mundo real. Código ...

CoT-Lab:探索人机协作迭代思考的实验性对话工具-首席AI分享圈

CoT-Lab: uma ferramenta de diálogo experimental para explorar o pensamento iterativo sobre a colaboração entre humanos e computadores

O CoT-Lab é uma interface experimental para explorar novos paradigmas na colaboração entre humanos e computadores. Com base na Teoria da Carga Cognitiva e nos Princípios de Aprendizagem Ativa, o CoT-Lab facilita o alinhamento cognitivo profundo entre humanos e a Inteligência Artificial (IA) por meio da criação de "parceiros pensantes". O objetivo do projeto é produzir lentamente...

让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展-首席AI分享圈

Extensão do navegador para permitir que a interface de bate-papo oficial do DeepSeek ofereça suporte a gráficos de renderização em linha

Descrição geral A DeepSeek Diagrams Extension é uma extensão do Chrome projetada para ajudar os usuários a renderizar diagramas em linha no site da DeepSeek. A extensão é baseada na biblioteca Mermaid.js e é capaz de converter gráficos com descrições de texto diretamente em gráficos visuais, aprimorando o uso de diagramas...

Orate:集成知名语音生成、语音转录与变声模型的统一API-首席AI分享圈

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Descrição geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar uma fala realista e semelhante à humana e transcrever áudio em texto.

Reflex LLM Examples:展示大语言模型实际应用的AI应用集合-首席AI分享圈

Exemplos do Reflex LLM: uma coleção de aplicativos de IA que demonstram a aplicação prática de grandes modelos de linguagem

Introdução abrangente O Reflex LLM Examples é um projeto de código aberto criado pela equipe de desenvolvimento do Reflex para demonstrar aplicações reais do Large Language Model (LLM). O projeto reúne vários aplicativos de IA criados no Reflex, apresentando modelos de linguagem grande de fornecedores como Google, Anthropic, OpenAI...

DeepClaude:融合DeepSeek R1链式推理与Claude创造力的聊天界面-首席AI分享圈

DeepClaude: uma interface de bate-papo que funde o raciocínio de cadeia R1 do DeepSeek com a criatividade do Claude

Introdução abrangente O DeepClaude é uma API de inferência de modelo de linguagem grande (LLM) de alto desempenho e uma interface de bate-papo que integra os recursos de raciocínio encadeado (CoT) do DeepSeek R1 com os recursos de criatividade e geração de código do modelo Anthropic Claude. Esse projeto supera significativamente o desempenho do OpenAI o1, do DeepSeek R1 ...

BEN2:从图像、视频中快速移除背景的深度学习模型-首席AI分享圈

BEN2: Modelo de aprendizagem profunda para remoção rápida de fundo de imagens e vídeos

Introdução abrangente O BEN2 (Background Erase Network 2) é um modelo de aprendizagem profunda desenvolvido pela Prama LLC, projetado especificamente para remover automaticamente o plano de fundo de uma imagem e gerar uma imagem em primeiro plano. O modelo emprega um pipeline inovador de Confidence Guided Matting (CGM) por meio de um processo refinado...

pt_BRPortuguês do Brasil