Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1
Total de 958 artigos

Tags: ai projetos de código aberto Página 25

CHRONOS:新闻时间线总结工具,提升新闻检索和时间线生成效率-首席AI分享圈

CHRONOS: Ferramenta de resumo da linha do tempo de notícias para melhorar a eficiência da recuperação de notícias e da geração de linhas do tempo

Introdução geral O CHRONOS é uma ferramenta de resumo da linha do tempo de notícias desenvolvida pela equipe de NLP da Alibaba. A ferramenta gera resumos de linhas do tempo de eventos noticiosos por meio de autoquestionamento iterativo. O CHRONOS não só é capaz de lidar com tarefas de resumo de linhas do tempo de domínio aberto, mas também melhora significativamente a eficiência e a escalabilidade...

Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体-首席AI分享圈

Go-with-the-Flow: controla o movimento dos objetos no vídeo, adicionando ou subtraindo qualquer objeto em movimento no vídeo.

Introdução geral O Go-with-the-Flow é um projeto de código aberto desenvolvido pela equipe de pesquisa da Netflix Eyeline Studios para controlar os padrões de movimento dos modelos de difusão de vídeo distorcendo o ruído. O projeto permite que os usuários determinem como as câmeras e os objetos em uma cena se movem, e pode até mesmo mover um vídeo...

X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞-首席AI分享圈

X-Dyna: Vídeo de referência de retrato estático Vídeo de geração de pose para fazer as fotos de Missy dançarem

Introdução geral O X-Dyna é um projeto de código aberto desenvolvido pela ByteDance para gerar animações dinâmicas de retratos por meio de técnicas de difusão de amostra zero. O projeto usa expressões faciais e movimentos corporais no vídeo da unidade para animar imagens de retratos individuais, gerando efeitos de movimento realistas e sensíveis ao contexto.

腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流-首席AI分享圈

Tencent Hybrid 3D (Hunyuan3D): geração de ativos 3D de alta resolução, vários fluxos de trabalho de geração de material 3D

Introdução abrangente O Tencent Hunyuan3D (Hunyuan3D 2.0) é um sistema avançado de síntese 3D em grande escala da Tencent, projetado para gerar ativos 3D texturizados de alta resolução. O sistema inclui dois componentes principais: Hunyuan3D-DiT, um modelo de geração de formas em larga escala, e Hunyuan3D-Paint, um modelo de síntese de textura em larga escala.

RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库-首席AI分享圈

RAG Web UI: Criando um sistema inteligente de perguntas e respostas sobre documentos e simplesmente criando uma base de conhecimento privada na Web

Introdução abrangente O RAG Web UI é um sistema de diálogo inteligente baseado na tecnologia RAG (Retrieval Augmented Generation). Ele ajuda empresas e indivíduos a criar sistemas inteligentes de perguntas e respostas com base em sua própria base de conhecimento. Combinando a recuperação de documentos e grandes modelos de linguagem, o RAG Web UI oferece serviços precisos e confiáveis de perguntas e respostas sobre conhecimento. O sistema é compatível com...

UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用-首席AI分享圈

UI-TARS Desktop: aplicativo da Intelligentsia para controle de computadores usando linguagem natural

Introdução geral O UI-TARS Desktop é um aplicativo de agente de interface gráfica baseado no UI-TARS (Visual Language Model) desenvolvido pela ByteDance. O aplicativo permite que os usuários controlem computadores por meio de linguagem natural para uma interação homem-computador mais intuitiva e eficiente.

Regras do Cursor do Devin: Criando o Cursor e o Windsurf Aprimorados para o Devin

Introdução geral O Devin Cursor Rules é um projeto de código-fonte aberto que visa aprimorar os ambientes de desenvolvimento integrado (IDEs) Cursor e Windsurf com arquivos de configuração e ferramentas para fornecer a eles recursos avançados de IA semelhantes aos do Devin. O projeto oferece planejamento de processos, autoevolução, uso estendido de ferramentas (por exemplo, navegação na Web...

Repomix:打包代码库为一个文本文件以便大模型检索-首席AI分享圈

Repomix: empacotamento da base de código em um arquivo de texto para recuperação de modelos grandes

Introdução geral O Repomix (anteriormente conhecido como Repopack) é uma ferramenta de código aberto projetada para empacotar toda uma base de código em um único arquivo compatível com IA. Essa ferramenta permite que os desenvolvedores disponibilizem facilmente sua base de código para grandes modelos de linguagem (como Claude, ChatGPT e Gemini) para análise e processamento...

Yek:读取git仓库文本文件并快速分块,以供大模型使用-首席AI分享圈

Yek: leitura de arquivos de texto do repositório git e sua rápida divisão em pedaços para modelos grandes

Introdução geral O Yek é uma ferramenta rápida baseada em Rust para ler arquivos de texto de repositórios ou diretórios, dividi-los em pedaços e serializá-los para uso em modelos de linguagem grande (LLMs). A ferramenta usa a regra .gitignore por padrão para ignorar arquivos desnecessários e usa o histórico do Git para inferir arquivos importantes...

Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果-首席AI分享圈

Kheish: inteligências multifuncionais que revisam, validam e formatam os resultados para produzir resultados de alta qualidade

Introdução abrangente O Kheish é um agente de código aberto de múltiplas funções projetado para tarefas de modelagem de grandes linguagens (LLM) que exigem colaboração estruturada e passo a passo. O Kheish é mais do que um simples coordenador, ele é um agente inteligente por si só, solicitando módulos sob demanda, integrando o feedback do usuário em diferentes...

AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具-首席AI分享圈

AI ContentCraft: uma ferramenta versátil de criação de conteúdo de IA para gerar histórias curtas, roteiros de diálogos, narrações e gráficos

Descrição geral O AI ContentCraft é uma ferramenta versátil de criação de conteúdo que integra geração de texto, síntese de fala, geração de imagens e muito mais. Ela ajuda os criadores a gerar rapidamente histórias, roteiros de podcast e o conteúdo de áudio e vídeo que os acompanha. A ferramenta oferece suporte a conversões de vários idiomas, pode processar conteúdo em lote e é extremamente...

Unigraph:构建本地运行的知识图谱和个人搜索引擎-首席AI分享圈

Unigraph: criação de gráficos de conhecimento e mecanismos de pesquisa pessoal executados localmente

Introdução geral O Unigraph é um mecanismo de pesquisa pessoal e gráfico de conhecimento de propósito geral e local, projetado para fornecer aos usuários um espaço de trabalho integrado para ajudar a gerenciar e pesquisar uma ampla variedade de dados em suas vidas pessoais. Com o Unigraph, os usuários podem integrar dados de diferentes fontes em um gráfico de conhecimento unificado...

Shortest:AI自动化测试工具,使用自然语言进行端到端测试-首席AI分享圈

Shortest: uma ferramenta de teste automatizado de IA que usa linguagem natural para testes de ponta a ponta

Introdução geral O Shortest é uma estrutura de teste de ponta a ponta em linguagem natural alimentada por IA, desenvolvida pela equipe do Anti-Work. Ele foi desenvolvido com base no Playwright e oferece suporte à integração com o GitHub e à autenticação de dois fatores (2FA). O principal recurso do Shortest é escrever casos de teste por meio de linguagem natural e utilizar o Anthropic Cl...

Midscene.js:用AI驱动浏览器自动化测试的开源插件-首席AI分享圈

Midscene.js: um plug-in de código aberto que impulsiona os testes de automação do navegador com IA

Introdução geral O Midscene.js é uma ferramenta de automação de navegador com tecnologia de IA capaz de controlar páginas da Web, executar asserções e extrair dados por meio de comandos de linguagem natural. Ele é compatível com extensões do Chrome, SDKs JavaScript e scripts YAML, simplificando o processo de criação e manutenção de testes de interface do usuário. Aproveitando a grande variedade multimodal ...

视频分析工具(Video Analyzer):分析视频内容并生成详细描述-首席AI分享圈

Video Analyzer: analisa o conteúdo do vídeo e gera descrições detalhadas

O Comprehensive Introduction Video Analyzer é uma ferramenta abrangente de análise de vídeo que combina visão computacional, transcrição de áudio e técnicas de processamento de linguagem natural para gerar descrições detalhadas do conteúdo do vídeo. A ferramenta faz isso extraindo quadros-chave do vídeo, transcrevendo o conteúdo de áudio e gerando descrições de linguagem natural...

Unsloth:高效微调和训练大语言模型的开源工具-首席AI分享圈

Unsloth: uma ferramenta de código aberto para ajuste fino e treinamento eficientes de modelos de linguagem grandes

Introdução abrangente O Unsloth é um projeto de código aberto criado para fornecer ferramentas eficientes para o ajuste fino e o treinamento de grandes modelos de linguagem (LLMs). O projeto oferece suporte a uma ampla variedade de modelos conhecidos, incluindo Llama, Mistral, Phi e Gemma, etc. Os principais recursos do Unsloth são a capacidade de reduzir significativamente o uso da memória e acelerar o treinamento...

MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库-首席AI分享圈

MaxKB: sistema de perguntas e respostas com base de conhecimento de IA pronto para uso para atendimento inteligente ao cliente e base de conhecimento interna

Introdução abrangente O MaxKB (Max Knowledge Base) é um sistema de Q&A de base de conhecimento de código aberto baseado em grandes modelos de linguagem e RAG (Retrieval Augmented Generation). O sistema é amplamente utilizado no atendimento inteligente ao cliente, na base de conhecimento interna da empresa, na pesquisa e educação acadêmicas e em outros cenários.

OmniThink:生成高质量长文的写作框架,搜索外部知识后反思并逐步构建知识树-首席AI分享圈

OmniThink: uma estrutura de redação para gerar ensaios longos de alta qualidade, buscando conhecimento externo e, em seguida, refletindo sobre ele e criando uma árvore de conhecimento passo a passo

Introdução abrangente O OmniThink é uma estrutura inovadora de escrita automática projetada para gerar artigos longos e de alta qualidade, imitando a expansão iterativa e a reflexão dos processos cognitivos humanos. A estrutura se concentra em ampliar os limites do conhecimento e gerar informações ricas e profundas. O OmniThink gera artigos criando esboços e...

pt_BRPortuguês do Brasil