Aprendizagem pessoal com IA
e orientação prática
讯飞绘镜
Total de 967 artigos

Tags: ai projetos de código aberto Página 15

DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)-首席AI分享圈

DeepGEMM: uma biblioteca de código aberto com suporte eficiente para operações de matriz FP8 (DeepSeek Open Source Week Day 3)

Introdução geral DeepGEMM é uma biblioteca FP8 GEMM (Generalised Matrix Multiplication) de código aberto desenvolvida pela equipe DeepSeek, focada em fornecer suporte eficiente para operações de matriz. Ela foi projetada especificamente para o Tensor Core da arquitetura NVIDIA Hopper e oferece suporte a operações de matriz comuns e modelos especializados mistos (MoE)...

olmOCR:PDF文档转换为文本,支持表格、公式和手写内容的识别-首席AI分享圈

olmOCR: conversão de documentos PDF em texto, suporte a tabelas, fórmulas e reconhecimento de conteúdo manuscrito

Introdução abrangente O olmOCR é uma ferramenta de código aberto desenvolvida pela equipe do AllenNLP no Allen Institute for Artificial Intelligence (AI2) que se concentra na conversão de arquivos PDF em texto linearizado e é especialmente adequada para a preparação de conjuntos de dados e treinamento de modelos de linguagem em larga escala (LLMs). Ele ...

Coding-Tutor:提供个性化编程指导的智能教学助手-首席AI分享圈

Coding-Tutor: um assistente de ensino inteligente que fornece orientação de programação personalizada

Introdução geral O Coding-Tutor é um projeto de código aberto hospedado no GitHub e criado pelo desenvolvedor iwangjian para oferecer aos alunos uma experiência de ensino de programação personalizada. Ele usa a tecnologia de IA conversacional para ajustar dinamicamente o conteúdo de ensino com base no histórico de conhecimento do usuário e no progresso do aprendizado para ajudar...

par_scrape:智能提取网页数据的爬虫工具-首席AI分享圈

par_scrape: uma ferramenta de rastreamento para extração inteligente de dados da Web

Introdução geral O par_scrape é uma ferramenta de rastreamento da Web de código aberto baseada em Python, lançada no GitHub pelo desenvolvedor Paul Robello, criada para ajudar os usuários a extrair dados de páginas da Web de forma inteligente. Ele integra duas poderosas tecnologias de automação de navegador, Selenium e Playwright, e combina...

Flock:低代码工作流编排快速构建聊天机器人-首席AI分享圈

Flock: orquestração de fluxo de trabalho com pouco código para criar chatbots rapidamente

Introdução geral O Flock é uma plataforma de código aberto e de baixo código para fluxo de trabalho, hospedada no GitHub e desenvolvida pela equipe da Onelevenvy. Ela se baseia nas tecnologias LangChain e LangGraph e se concentra em ajudar os usuários a criar rapidamente chatbots, aplicativos de geração aumentada de recuperação (RAG) e orquestrar grupos de vários agentes...

TableGPT Agent:专为分析复杂表格数据设计的智能工具-首席AI分享圈

TableGPT Agent: ferramenta inteligente projetada para analisar dados tabulares complexos

Introdução geral O TableGPT Agent é uma ferramenta inteligente baseada no projeto de código aberto do GitHub projetado para processar e analisar dados tabulares. Ele se baseia no TableGPT2 Big Language Model, que usa interações de linguagem natural para facilitar aos usuários a consulta, a manipulação e a compreensão do conteúdo de tabelas complexas. Seja de ...

TRV:将幻灯片/PPT和讲解备注快速生成演讲视频-首席AI分享圈

TRV: Geração rápida de vídeos de apresentação a partir de slides/PPTs e notas explicativas

Introdução geral O TRV é uma ferramenta de código aberto, hospedada no GitHub, criada para ajudar os usuários a converter rapidamente slides e notas de aula em vídeos com narração. Ele gera automaticamente conteúdo de áudio e vídeo a partir de arquivos de apresentação recebidos por meio de operações simples de linha de comando, adequadas para quem precisa criar rapidamente vídeos de apresentação para ensino...

gibberlink:两个AI智能体间高效音频通信的演示项目-首席AI分享圈

gibberlink: um projeto de demonstração para comunicação de áudio eficiente entre duas inteligências de IA

Introdução geral O gibberlink é um projeto de código aberto no GitHub do desenvolvedor PennyroyalTea que se concentra em permitir a otimização da comunicação entre duas inteligências de IA de conversação. Quando duas inteligências de IA conversam ao telefone e reconhecem uma à outra como IA, elas cortam a linguagem humana (inglês)...

LazyLLM:商汤开源构建多智能体应用的低代码开发工具-首席AI分享圈

LazyLLM: a ferramenta de desenvolvimento de código reduzido de código aberto da Shangtang para a criação de aplicativos corporais multiinteligentes

Introdução abrangente O LazyLLM é uma ferramenta de código aberto desenvolvida pela equipe do LazyAGI, com foco na simplificação do processo de desenvolvimento de aplicativos de modelos grandes de inteligência múltipla. Ela ajuda os desenvolvedores a criar rapidamente aplicativos complexos de IA e a economizar tempo em configurações de engenharia tediosas por meio da implantação com um clique e de mecanismos de gateway leves. Não importa se você é um iniciante...

DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人-首席AI分享圈

DeepSeek-RAG-Chatbot: um chatbot do DeepSeek RAG em execução local

Introdução geral O DeepSeek-RAG-Chatbot é um projeto de chatbot de código aberto baseado no modelo DeepSeek R1, hospedado no GitHub e criado pelo desenvolvedor SaiAkhil066. Ele combina a tecnologia Retrieval Augmented Generation (RAG) com suporte para que os usuários façam upload de documentos (por exemplo, PDF, DOCX ou TXT ...

MagicArticulate:将静态3D模型生成骨骼结构动画资产-首席AI分享圈

MagicArticulate: geração de ativos de animação de estrutura esquelética a partir de modelos 3D estáticos

Introdução abrangente O MagicArticulate é uma estrutura de IA desenvolvida pela ByteDance em colaboração com a Nanyang Technological University (NTU), com foco na transformação rápida de modelos 3D estáticos em ativos digitais habilitados para animação. Ele gera automaticamente estruturas esqueléticas e direitos de skinning para modelos por meio de um transformador autorregressivo avançado e modelos de difusão funcional...

AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)-首席AI分享圈

AingDesk: instalação com um clique de modelos de IA e interfaces de bate-papo em computadores pessoais (com DeepSeek)

Introdução geral O AingDesk é um software gratuito e de código aberto projetado para ajudar os usuários a implementar e executar facilmente vários modelos de IA em seus computadores locais. Sejam modelos DeepSeek ou Llama, o AingDesk permite a implementação com um clique e etapas simples. O software é compatível com Windows, Linux...

CapsWriter-Offline:PC端的语音输入和字幕转录工具-首席AI分享圈

CapsWriter-Offline: ferramenta de entrada de fala e transcrição de legendas para PC

Introdução geral O CapsWriter-Offline é uma ferramenta de transcrição de legendas e entrada de voz para PC, hospedada no GitHub e criada pelo desenvolvedor HaujetZhao. Ele é executado totalmente off-line e não requer conexão com a Internet para converter fala em texto e arquivos de áudio/vídeo em legendas, além de oferecer suporte à gravação ilimitada...

PDF-Extract-Kit:提取复杂结构PDF内容的开源工具-首席AI分享圈

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

Introdução abrangente O PDF-Extract-Kit é um projeto de código aberto desenvolvido pela equipe do OpenDataLab, com foco na extração eficiente de conteúdo de alta qualidade de documentos PDF complexos e diversos. Ele integra tecnologia avançada de análise de documentos, suporte para detecção de layout, reconhecimento de fórmulas, extração de tabelas e OCR e outras funções para ...

FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)-首席AI分享圈

FlashMLA: Otimizando kernels de decodificação MLA para GPUs Hopper (DeepSeek Open Source Week Day 1)

Introdução geral O FlashMLA é um kernel de decodificação MLA (Multi-head Latent Attention) eficiente desenvolvido pela DeepSeek AI, otimizado para GPUs NVIDIA Hopper Architecture e projetado para melhorar o desempenho do processamento de sequências de comprimento variável. O projeto é de código aberto no GitHub, fornecendo aos desenvolvedores uma...

TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架-首席AI分享圈

TPO-LLM-WebUI: uma estrutura de IA em que você pode inserir perguntas para treinar um modelo em tempo real e gerar os resultados.

Introdução abrangente O TPO-LLM-WebUI é um projeto inovador de código aberto da Airmomo no GitHub que permite a otimização em tempo real de LLMs (Large Language Models) por meio de uma interface da Web intuitiva. Ele usa a estrutura TPO (Test-Time Prompt Optimisation) para dizer adeus completamente ao tedioso processo de ajuste fino tradicional...

Neural4D:生成高分辨率3D建模数字资产的AI平台-首席AI分享圈

Neural4D: uma plataforma de IA para gerar ativos digitais modelados em 3D de alta resolução

Introdução abrangente O Neural4D é uma plataforma inovadora baseada em IA que se concentra em ajudar os usuários a gerar rapidamente modelos e animações 3D de alta qualidade com uma simples entrada de texto ou imagem. Desenvolvida pela DreamTech, ela se baseia na geração 3D de ponta a ponta líder mundial de modelos grandes, em que o usuário simplesmente fornece uma descrição...

InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型-首席AI分享圈

InternLM-XComposer: um macromodelo multimodal para a produção de textos muito longos e compreensão de imagens e vídeos

Introdução abrangente O InternLM-XComposer é um projeto de grande modelo gráfico multimodal de código aberto desenvolvido pela equipe do InternLM, hospedado no GitHub. Ele se baseia no modelo de linguagem InternLM, capaz de lidar com texto, imagens, vídeo e outros dados multimodais, amplamente utilizado na criação de gráficos, compreensão de imagens e sub...

MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率-首席AI分享圈

MakeSense: uma ferramenta de anotação de imagens de uso gratuito para aumentar a eficiência do projeto de visão computacional

Introdução geral O Make Sense é uma ferramenta gratuita de anotação de imagens on-line criada para ajudar os usuários a preparar rapidamente conjuntos de dados para projetos de visão computacional. Ela não requer instalação complicada, basta abrir um acesso ao navegador para usá-la, é compatível com vários sistemas operacionais e é ideal para pequenos projetos de aprendizagem profunda. Os usuários podem usá-la para...

pt_BRPortuguês do Brasil