Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 970 artigos

Tags: ai projetos de código aberto Página 27

MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块-首席AI分享圈

MiniRAG: estrutura de geração aprimorada de recuperação simplificada, índice de gráfico de entidades, recordação de blocos de texto relevantes

Introdução abrangente O MiniRAG é uma estrutura extremamente simples do Retrieval Augmented Generation (RAG) que visa permitir um bom desempenho do RAG mesmo para modelos pequenos por meio de indexação de gráficos heterogêneos e recuperação leve com aprimoramento de topologia. Ele foi desenvolvido pelo Laboratório de Ciência de Dados da Universidade de Hong Kong (HKUDS) e se concentra na solução do Modelo de Linguagem Pequena (SLM)...

Omni-RGPT:图像和视频区域级理解多模态大模型,提升视觉内容分析能力-首席AI分享圈

Omni-RGPT: um grande modelo multimodal para compreensão em nível de região de imagens e vídeos para aprimorar a análise de conteúdo visual

Introdução abrangente O Omni-RGPT é um modelo multimodal de linguagem ampla projetado para permitir a compreensão de imagens e vídeos em nível de região. Ao introduzir a técnica Token Mark, o Omni-RGPT é capaz de destacar regiões-alvo no espaço de recursos visuais e incorporar esses tokens diretamente por meio de dicas de região (por exemplo, caixas ou máscaras), ao mesmo tempo em que...

百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流-首席AI分享圈

Bailing: um assistente de diálogo de voz de código aberto de baixa latência para conversação e comunicação naturais

Introdução abrangente O Bailing (Bailing) é um assistente de diálogo de voz de código aberto projetado para se envolver em conversas naturais com os usuários por meio da fala. O projeto combina tecnologias de reconhecimento de fala (ASR), detecção de atividade de voz (VAD), modelagem de linguagem ampla (LLM) e síntese de fala (TTS) para obter uma fala semelhante à do GPT-4o...

元界AI:开源版AI数字人克隆与短视频生成工具-首席AI分享圈

Metaverse AI: versão de código aberto da ferramenta de geração de vídeos curtos e clonagem digital de humanos por IA

Introdução abrangente O Metaverse AI (versão de código aberto) é um projeto hospedado no GitHub, desenvolvido pela equipe da libn-net. Ele pode clonar imagens e vozes humanas digitais por meio da tecnologia de IA para gerar vídeos curtos e também suporta dublagem e legendagem. A ferramenta está disponível para Windows, Web, H5 e pequenas...

WikiChat:使用维基百科数据检索知识的聊天工具-首席AI分享圈

WikiChat: uma ferramenta de bate-papo para recuperar conhecimento usando dados da Wikipédia

Introdução geral O WikiChat é um chatbot experimental desenvolvido na Universidade de Stanford com o objetivo de aprimorar a factualidade de modelos de linguagem grandes, recuperando dados da Wikipédia. Grandes modelos de linguagem (como o ChatGPT e o GPT-4) tendem a cometer erros ao lidar com informações atualizadas ou tópicos menos populares.

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式-首席AI分享圈

OpenAI Edge TTS: API gratuita de conversão de texto em fala usando o Edge TTS, compatível com os formatos OpenAI

Introdução geral O OpenAI Edge TTS é um projeto de código aberto que fornece uma API de conversão de texto em fala (TTS) nativa compatível com o OpenAI. O projeto usa o serviço de conversão de texto em fala on-line do Microsoft Edge para permitir que os usuários gerem uma saída de fala de alta qualidade.

AIEvo:创建多智能体协作应用的高效框架-首席AI分享圈

AIEvo: uma estrutura eficiente para a criação de aplicativos colaborativos multiinteligentes

Introdução geral AIEvo é a estrutura multiagente de código aberto do Ant Group, projetada para criar aplicativos multiagentes com eficiência. A estrutura segue rigorosamente o gráfico de tarefas SOP para melhorar a taxa de sucesso da execução de tarefas complexas e, por meio de mecanismos de feedback e monitoramento, garante alta flexibilidade e escalabilidade.

PPTAgent:自动生成和评估PPT演示文稿,文档转PPT-首席AI分享圈

PPTAgent: geração e avaliação automáticas de apresentações PPT, documentos para PPTs

Introdução geral O PPTAgent é um sistema inovador projetado para gerar automaticamente apresentações a partir de documentos. O sistema se baseia na abordagem humana para criar apresentações, usando um processo de duas etapas para garantir a qualidade do conteúdo e o impacto visual. Além disso, o PPTAgent apresenta o PPTEval, uma estrutura de avaliação abrangente para gerar apresentações a partir de documentos...

FlowiseAI:构建自定义LLM应用的节点拖放界面-首席AI分享圈

FlowiseAI: criação de uma interface de arrastar e soltar nós para aplicativos LLM personalizados

Introdução geral O FlowiseAI é uma ferramenta de código aberto e de baixo código projetada para ajudar os desenvolvedores a criar aplicativos LLM (Large Language Model) personalizados e agentes de IA. Com uma interface simples de arrastar e soltar, os usuários podem criar e iterar rapidamente aplicativos LLM, tornando mais eficiente o processo desde o teste até a produção.O FlowiseAI fornece...

RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别-首席AI分享圈

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente, de baixa latência e em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão rápida e precisa de fala para texto. Quer você seja um assistente de voz ou precise encontrar...

SemHash: implementação rápida de desduplicação de texto semântico para melhorar a eficiência da limpeza de dados

Introdução geral O SemHash é uma ferramenta leve e flexível para desduplicação de conjuntos de dados por similaridade semântica. Ele combina a rápida geração de incorporação do Model2Vec com a eficiente pesquisa de similaridade ANN (Approximate Nearest Neighbour) do Vicinity.O SemHash é compatível com a desduplicação de um único conjunto de dados (por exemplo, limpeza de...

Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略-首席AI分享圈

Cognita: uma estrutura de código aberto para criar aplicativos RAG modulares e testar rapidamente diversas estratégias RAG

Introdução abrangente A Cognita é uma estrutura de código aberto desenvolvida pela TrueFoundry para simplificar o desenvolvimento de aplicativos baseados em RAG (Retrieval-Augmented Generation). A estrutura oferece uma solução estruturada e modular que facilita a transferência da tecnologia RAG do estágio de protótipo para a produção...

BotSharp:基于.NET的多智能体AI应开发与管理平台-首席AI分享圈

BotSharp: uma plataforma de desenvolvimento e gerenciamento de inteligência múltipla de IA baseada em .NET

Introdução abrangente O BotSharp é um projeto de código aberto baseado no .NET Core dedicado a fornecer uma ferramenta abrangente de criação de plataforma de chatbot de IA. Ele usa a programação C#, oferece suporte à operação entre plataformas e tem como objetivo simplificar a aplicação de algoritmos de aprendizado de máquina, permitindo que os desenvolvedores de nível empresarial integrem com eficiência a IA aos sistemas de negócios...

Weebo: um chatbot de voz em tempo real que oferece uma experiência de diálogo em linguagem natural

Introdução geral O Weebo é um chatbot de voz em tempo real de código aberto que utiliza o Whisper Small para reconhecimento de fala, o Llama 3.2 para geração de linguagem natural e o Kokoro-82M para síntese de fala. Desenvolvido por Amanvir Parhar, o projeto tem como objetivo fornecer um dispositivo nativo capaz de...

OmAgent:构建多模态智能设备的智能体框架-首席AI分享圈

OmAgent: uma estrutura de corpo inteligente para a criação de dispositivos inteligentes multimodais

Introdução abrangente O OmAgent é uma estrutura de corpo inteligente multimodal desenvolvida pelo Om AI Lab, com o objetivo de fornecer recursos avançados baseados em IA para dispositivos inteligentes. O projeto permite que os desenvolvedores criem experiências interativas eficientes e em tempo real em uma ampla gama de dispositivos inteligentes, integrando modelos de base multimodais de última geração e algoritmos de corpo inteligente...

RAIN:实时捕捉真人表情生成动漫形象视频流-首席AI分享圈

RAIN: Captura em tempo real de expressões humanas reais para gerar fluxos de vídeo de imagens de anime

Introdução geral O RAIN (Real-time Animation Of Infinite Video Stream) é um projeto de código aberto que visa à geração de efeitos de animação em tempo real para fluxos de vídeo infinitos. Desenvolvido por Pscgylotti, o projeto oferece uma solução para a geração de vídeo em dispositivos de usuários comuns. Com o uso das mais recentes ...

Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集-首席AI分享圈

Agent Service Toolkit: um conjunto completo de ferramentas para a criação de inteligências de IA com base no LangGraph

Introdução abrangente O AI Agent Service Toolkit é um conjunto de ferramentas completo baseado em LangGraph, FastAPI e Streamlit, projetado para ajudar os desenvolvedores a criar e executar rapidamente serviços de agentes de IA. O kit de ferramentas oferece uma estrutura flexível que suporta recursos e interações de agentes definidos pelo usuário,...

Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息-首席AI分享圈

Memora: criação de módulos de memória de IA humanizados para salvar e atualizar informações sobre interações com humanos

Introdução geral O Memora é um agente projetado para replicar memórias humanas para cada IA personalizada. Ele ajuda as IAs a se lembrarem de detalhes de interações passadas, emoções e experiências compartilhadas, assim como os humanos fazem, por meio de recursos como memórias com registro de data e hora, marcadores de emoção e memórias multimodais.

Stagehand:自然语言实现浏览器自动化操作框架-首席AI分享圈

Stagehand: uma estrutura para implementação de linguagem natural de operações de automação do navegador

Introdução geral O Stagehand é uma estrutura de navegação na Web de IA focada na simplicidade e na extensibilidade. É totalmente compatível com o Playwright, fornecendo três APIs de IA simples (act, extract e observe) que são construídas sobre as classes de página do Playwright subjacentes para a Web por meio de linguagem natural...

pt_BRPortuguês do Brasil