Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1
Total de 928 artigos

Tags: ai projetos de código aberto Página 12

AI-Infra-Guard:检测AI系统潜在安全风险的开源工具-首席AI分享圈

AI-Infra-Guard: uma ferramenta de código aberto para detectar possíveis riscos de segurança em sistemas de IA

Introdução abrangente O AI-Infra-Guard é uma ferramenta de avaliação de segurança de infraestrutura de IA de código aberto desenvolvida pela equipe de segurança híbrida da Tencent, a Zhuqiao Labs, que foi projetada para ajudar os usuários a descobrir e detectar rapidamente possíveis riscos de segurança em sistemas de IA. A ferramenta é compatível com a impressão digital de mais de 30 estruturas e componentes de IA, com mais de 200...

WhisperChain:实时语音转文字并优化口语化词语-首席AI分享圈

WhisperChain: conversão de voz em texto em tempo real e otimização de palavras faladas

Introdução geral O WhisperChain é um projeto de código aberto baseado em IA hospedado no GitHub e liderado pelo desenvolvedor Chris Choy. Ele é usado principalmente para converter a fala em texto e otimizar automaticamente a expressão por meio da tecnologia de IA, removendo palavras coloquiais redundantes (por exemplo, palavras de preenchimento como "ah", "hmm" etc.)...

VideoGrain:文本提示对视频进行局部编辑的开源项目-首席AI分享圈

VideoGrain: prompts de texto para edição local de projeto de código aberto de vídeo

Introdução geral O VideoGrain é um projeto de código-fonte aberto voltado para a edição de vídeo com vários grãos, desenvolvido pela equipe da xAI e hospedado no GitHub. Esse projeto é baseado no artigo "VideoGrain: Modulating Space-Time Attention for Multi-Grained Video Editing" (VideoGrain: modulando a atenção espaço-temporal para edição de vídeo com vários grãos), que foi selecionado ...

Mobius Diffusion:文本提示生成无缝循环视频-首席AI分享圈

Mobius Diffusion: instruções de texto geram um vídeo em loop contínuo

Introdução geral O Mobius Diffusion é uma ferramenta on-line inovadora voltada para a geração de conteúdo de vídeo em loop contínuo a partir de entrada de texto. Ela se baseia em modelos de difusão de vídeo pré-treinados e não requer treinamento do usuário ou dados de anotação para começar a usar rapidamente. A tecnologia principal do site é construir loops de espaço latente por meio de...

RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架-首席AI分享圈

RuoYi AI: estrutura de back-end baseada em SpringBoot para bate-papo e desenho com IA

Introdução abrangente O RuoYi AI é um projeto de back-end baseado na estrutura ruoyi-plus, com foco na integração de recursos de bate-papo e pintura de IA. Ele é totalmente gratuito e de código aberto, usando a pilha de tecnologia Java17 e SpringBoot 3.X. A interface de gerenciamento de back-end é construída usando elementUI, simples e fácil de usar. O projeto é compatível com ...

Vision Agent:解决多种视觉目标检测任务的视觉智能体-首席AI分享圈

Vision Agent: uma inteligência visual para resolver várias tarefas de detecção visual de alvos

Introdução geral O Vision Agent é um projeto de código aberto desenvolvido pela LandingAI (equipe de Enda Wu) e hospedado no GitHub para ajudar os usuários a gerar código rapidamente para resolver tarefas de visão computacional. Ele usa uma estrutura de agente avançada e um modelo multimodal para gerar eficiência por meio de solicitações simples...

MyCoder:自动修复代码、生成测试用例的命令行AI工具-首席AI分享圈

MyCoder: ferramenta de IA de linha de comando para corrigir automaticamente o código e gerar casos de teste

Introdução geral O MyCoder é um projeto de código aberto desenvolvido pela equipe do drivecore e hospedado no GitHub, com o objetivo de fornecer aos desenvolvedores assistência inteligente à programação por meio de uma interface de linha de comando. Ele se baseia na API Claude da Anthropic e integra recursos avançados de IA para corrigir rapidamente erros de código...

Baichuan-Audio:支持实时语音交互的端到端音频模型-首席AI分享圈

Baichuan-Audio: um modelo de áudio de ponta a ponta que oferece suporte à interação de voz em tempo real

Introdução abrangente O Baichuan-Audio é um projeto de código aberto desenvolvido pela Baichuan Intelligence (baichuan-inc), hospedado no GitHub, com foco na tecnologia de interação de voz de ponta a ponta. O projeto fornece uma estrutura completa de processamento de áudio que pode converter a entrada de voz em tokens de áudio discretos e, em seguida, por meio de um grande ...

R1-Onevision:支持多模态推理的开源视觉语言模型-首席AI分享圈

R1-Onevision: um modelo de linguagem visual de código aberto que oferece suporte ao raciocínio multimodal

Introdução abrangente O R1-Onevision é um modelo de linguagem grande multimodal de código aberto desenvolvido pela equipe do Fancy-MLLM, que se concentra na combinação profunda de visão e linguagem, capaz de processar entradas multimodais, como imagens e texto, e de se destacar nas áreas de raciocínio visual, compreensão de imagens e solução de problemas matemáticos. Baseado no Qwen2.5-VL...

TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号-首席AI分享圈

TrendPublish: rastreie e resuma notícias de IA em tempo real e publique-as automaticamente no WeChat

Introdução geral ai-trend-publish é um projeto de código-fonte aberto hospedado no GitHub, desenvolvido pela equipe do OpenAISpace, focado no rastreamento e na publicação das últimas tendências no campo da Inteligência Artificial em tempo real. Essa ferramenta foi projetada para ajudar desenvolvedores, entusiastas de tecnologia e pesquisadores a acessar rapidamente informações dinâmicas no campo da IA...

TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频-首席AI分享圈

TheoremExplainAgent: Gere vídeos animados explicativos de matemática de mais de 5 minutos com o Manim

Introdução geral O TheoremExplainAgent é um projeto inovador desenvolvido pelo TIGER AI Lab para transformar teoremas matemáticos e científicos complexos em animações de vídeo fáceis de entender usando técnicas de inteligência artificial. A ferramenta baseia-se nos recursos de raciocínio do Large Language Model (LLM), combinados com a geração de animação e síntese de fala...

3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)-首席AI分享圈

3FS: um sistema de arquivos paralelo para melhorar a eficiência do acesso aos dados (DeepSeek Open Source Week Day 5)

Introdução geral O 3FS (Fire-Flyer File System) é um sistema de arquivos paralelos de código aberto desenvolvido pela equipe do DeepSeek, projetado para SSDs modernos e redes RDMA, com o objetivo de melhorar drasticamente a eficiência do acesso aos dados. Ele atinge uma taxa de transferência de leitura agregada de 6,6 TiB/s e 3,66 TiB/min em um cluster de 180 nós...

DeepChat:支持与多个聊天并发会话的AI对话客户端-首席AI分享圈

DeepChat: cliente de diálogo de IA que suporta sessões simultâneas com vários bate-papos

Introdução geral O DeepChat é um projeto de assistente inteligente de código aberto desenvolvido pela equipe ThinkInAIXYZ no GitHub. Seu objetivo é conectar os usuários ao mundo digital por meio de uma poderosa tecnologia de IA, proporcionando uma experiência de bate-papo eficiente e natural. É compatível com Windows, macOS, Linux e outras plataformas múltiplas, com...

Dify Connect MCP: integração perfeita do MCP (Model Context Protocol) para fluxos de trabalho da Dify

Introdução geral O Dify Connect MCP é um projeto de código aberto, hospedado no GitHub, projetado para fornecer aos usuários da plataforma Dify uma ferramenta conveniente para se conectar perfeitamente aos fluxos de trabalho da Dify por meio do protocolo de contexto de modelo (MCP). O projeto foi desenvolvido pela difybas...

DualPipe: um algoritmo paralelo bidirecional em pipeline para melhorar a eficiência do treinamento de modelos de IA em grande escala (DeepSeek Open Source Week Day 4)

Introdução geral O DualPipe é uma tecnologia de código aberto desenvolvida pela equipe do DeepSeek-AI com o objetivo de melhorar a eficiência do treinamento de modelos de IA em grande escala. É um inovador algoritmo paralelo bidirecional em pipeline usado principalmente para obter uma sobreposição completa de computação e comunicação no treinamento de modelos DeepSeek-V3 e R1, com...

AutoDev:支持多语言的自动代码生成与调试工具-首席AI分享圈

AutoDev: ferramenta automatizada de geração de código e depuração com suporte a vários idiomas

Introdução geral O AutoDev é um projeto de código aberto desenvolvido pela equipe do Unit Mesh e hospedado no GitHub, com o objetivo de melhorar a eficiência de programação dos desenvolvedores por meio da tecnologia de inteligência artificial. É um assistente de codificação avançado que oferece suporte a várias linguagens de programação, incluindo Java, Kotlin, Python etc., fornecendo...

LLPlayer:生成实时字幕并双语翻译的视频播放器-首席AI分享圈

LLPlayer: reprodutor de vídeo que gera legendas em tempo real com tradução bilíngue

Introdução geral O LLPlayer é um reprodutor de mídia de código aberto projetado para alunos de idiomas, hospedado no GitHub e criado pelo desenvolvedor umlx5h. Ele integra uma variedade de recursos úteis, como exibição de legendas bilíngues, legendas geradas automaticamente por IA, tradução em tempo real e pesquisa de palavras etc. Ele foi projetado para ajudar os usuários a assistir a vídeos...

pt_BRPortuguês do Brasil