Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1
Total de 861 artigos

Tags: ai projetos de código aberto Página 2

StarVector:从图像和文字生成SVG矢量图的基础模型-首席AI分享圈

StarVector: um modelo básico para gerar gráficos vetoriais SVG a partir de imagens e texto

Introdução geral O StarVector é um projeto de código aberto criado por desenvolvedores como Juan A. Rodriguez para converter imagens e textos em SVG (Scalable Vector Graphics, gráficos vetoriais escaláveis). Essa ferramenta usa um modelo de linguagem visual que entende o conteúdo da imagem e as instruções de texto para gerar um código SVG de alta qualidade ...

CortexON:开源多代理AI工具,支持复杂任务自动化-首席AI分享圈

CortexON: ferramenta de IA multiagente de código aberto para dar suporte à automação de tarefas complexas

Introdução geral O CortexON é um sistema de IA multiagente de código aberto hospedado no GitHub em https://github.com/TheAgenticAI/CortexOn. Ele foi desenvolvido pela equipe TheAgenticAI, inspirada no Manus e no OpenAI DeepResearch. O objetivo é fazer com que o sistema funcione por meio de vários...

MarkPDFDown:基于多模态模型将PDF转为Markdown文件-首席AI分享圈

MarkPDFDown: converte PDF em Markdown com base em um modelo multimodal

Introdução geral O MarkPDFDown é uma ferramenta de código aberto. Ela aproveita o modelo multimodal de big language para converter arquivos PDF em formato Markdown. O desenvolvedor é o usuário do GitHub jorben. O objetivo dessa ferramenta é simples: tornar os documentos PDF mais fáceis de editar e compartilhar. Ela reconhece títulos,...

Easy Dataset:创建大模型微调数据集的简易工具-首席AI分享圈

Easy Dataset: uma ferramenta fácil para criar grandes conjuntos de dados com ajuste fino de modelos

Introdução abrangente O Easy Dataset é uma ferramenta de código aberto projetada especificamente para o ajuste fino de modelos grandes (LLMs), hospedada no GitHub. Ela oferece uma interface fácil de usar que permite aos usuários fazer upload de arquivos, dividir automaticamente o conteúdo, gerar perguntas e respostas e, por fim, gerar conjuntos de dados estruturados adequados para o ajuste fino. Abrir ...

Skywork-R1V:昆仑万文开源的图文混合多模态推理模型-首席AI分享圈

Skywork-R1V: um modelo de raciocínio multimodal híbrido gráfico de código aberto por Kunlun Wanwen

Introdução geral O Skywork-R1V é um modelo de raciocínio multimodal de código aberto desenvolvido pela equipe do SkyworkAI (Kunlun Wanwei) e publicado no GitHub. Ele é capaz de processar imagens e textos simultaneamente, executar raciocínio lógico em várias etapas e é particularmente bom na análise de problemas complexos de imagens. O modelo foi lançado oficialmente em 18 de março de 2025...

AI Logo:AI快速生成定制化品牌Logo-首席AI分享圈

Logotipo da IA: a IA gera rapidamente logotipos de marca personalizados

Introdução geral O AI Logo é um projeto de aplicativo de IA de código aberto com o objetivo de ajudar os usuários a gerar rapidamente logotipos de marca personalizados por meio de inteligência artificial. Ele combina técnicas avançadas de IA, como Stable Diffusion e DeepAI, para permitir que os usuários insiram informações simples sobre a marca e obtenham designs de logotipo de alta qualidade. Esse...

Docs:开源的协作笔记和文档管理工具-首席AI分享圈

Docs: notas colaborativas de código aberto e ferramentas de gerenciamento de documentos

Introdução geral O Docs é uma plataforma colaborativa de código aberto para anotações e gerenciamento de documentos desenvolvida pela equipe do suitenumerique. Ela foi criada usando as tecnologias Django e React com o objetivo de fornecer uma ferramenta fácil de usar para ajudar os usuários a fazer anotações, gerenciar documentos e compartilhar conhecimento. Essa plataforma é compatível com...

SmartRead:自动标注技术PDF文档并提供相关引用源-首席AI分享圈

SmartRead: Anote automaticamente documentos técnicos em PDF e forneça citações relevantes

Introdução abrangente O SmartRead é uma ferramenta de código aberto baseada em IA projetada para documentos técnicos. Ele analisa automaticamente arquivos PDF e anota o conteúdo principal, como termos importantes, títulos ou ideias centrais, para ajudar os usuários a entender rapidamente documentos complexos. Ao mesmo tempo, ele também pode fornecer artigos e vídeos relacionados ao tópico do documento...

Hunyuan3D-2:腾讯开源的高分辨率3D模型生成工具-首席AI分享圈

Hunyuan3D-2: ferramenta de geração de modelos 3D de alta resolução de código aberto da Tencent

Introdução geral O Hunyuan3D-2 é um projeto de código aberto desenvolvido pela Tencent, com o objetivo de gerar modelos 3D de alta resolução a partir de texto ou imagens. Ele consiste em dois componentes principais: modelo de geração de forma (Hunyuan3D-DiT) e modelo de geração de textura (Hunyuan3D-Paint). Os usuários podem inserir descrições de texto ou...

LangManus:支持多智能体协作的开源AI自动化框架-首席AI分享圈

LangManus: uma estrutura de automação de IA de código aberto que oferece suporte à colaboração com várias inteligências

Introdução geral O LangManus é uma estrutura de automação de IA de código aberto hospedada no GitHub. Desenvolvido por um grupo de ex-colegas em seu tempo livre, é um projeto acadêmico com o objetivo de combinar modelos de linguagem e ferramentas especializadas para realizar tarefas como pesquisa na Web, rastreamento de dados e execução de código. A estrutura usa modelos multiagentes...

使用Cursor读取并修改Figma设计稿的MCP服务-首席AI分享圈

Serviço MCP para leitura e modificação de projetos Figma usando o Cursor.

Introdução geral O Cursor Talk to Figma MCP é um projeto de código aberto que conecta a ferramenta de programação de IA Cursor ao software de design Figma por meio do protocolo Model Context Protocol (MCP). Ele foi criado pelo desenvolvedor Sonny Lazuardi, está hospedado no GitHub e tem data de lançamento em 3 de março de 2025. ...

闲鱼卖家全天自动值守的AI客服机器人-首席AI分享圈

Bots de atendimento ao cliente com IA que são automaticamente operados por vendedores da Idle Fish 24 horas por dia

Introdução abrangente O XianyuAutoAgent é um sistema robótico inteligente de atendimento ao cliente projetado especificamente para a plataforma Idlefish, com código aberto pelo desenvolvedor shaxiu no GitHub. Ele realiza tarefas automatizadas de 7×24 horas por meio da tecnologia de IA para ajudar os vendedores de peixes ociosos a responder a mensagens, lidar com barganhas e obter orientação técnica. As principais funções incluem ...

Seed-VC:支持少样本实时转换语音和歌声-首席AI分享圈

Seed-VC: suporta a conversão em tempo real de fala e música com menos amostras

Introdução geral O Seed-VC é um projeto de código aberto no GitHub, desenvolvido pela Plachtaa. Ele pode usar um trecho de áudio de referência de 1 a 30 segundos para realizar rapidamente a conversão de voz ou música, sem treinamento adicional. O projeto oferece suporte à conversão de voz em tempo real, com latência tão baixa quanto 400 milissegundos ou mais, adequado para reuniões on-line...

PilottAI:构建企业级多智能体应用的开源项目-首席AI分享圈

PilottAI: um projeto de código aberto para criar aplicativos de inteligência múltipla de nível empresarial

Introdução geral O PilottAI é uma estrutura Python de código aberto hospedada no GitHub e criada pelo desenvolvedor anuj0456. Ele se concentra em ajudar os usuários a criar um sistema corporal multiinteligente de classe empresarial, com suporte para integração de modelo de linguagem grande (LLM), fornecendo agendamento de tarefas, expansão dinâmica, mecanismo tolerante a falhas e outros recursos.

HumanOmni:分析人类视频情感和动作的多模态大模型-首席AI分享圈

HumanOmni: um macromodelo multimodal para análise de emoções e ações em vídeos humanos

Introdução geral O HumanOmni é um grande modelo multimodal de código aberto desenvolvido pela equipe HumanMLLM e hospedado no GitHub. Ele se concentra na análise de vídeos humanos e pode processar imagens e sons para ajudar a entender o conteúdo de emoções, ações e diálogos. O projeto usou 2,4 milhões de videoclipes centrados em humanos e...

TxAgent:帮医生分析药物作用和治疗方案的AI工具-首席AI分享圈

TxAgent: uma ferramenta de IA para ajudar os médicos a analisar os efeitos dos medicamentos e as opções de tratamento

Introdução abrangente O TxAgent é uma ferramenta de IA de código aberto desenvolvida pela Equipe de Inteligência Artificial Médica e Científica (MIMS) da Universidade de Harvard para ajudar os médicos a analisar interações medicamentosas e desenvolver planos de tratamento personalizados. Ele faz isso por meio do raciocínio em várias etapas e da recuperação em tempo real do conhecimento biomédico, incorporando informações específicas do paciente (por exemplo, idade,...

OpenSearch-SQL:将自然语言转为SQL查询的开源工具-首席AI分享圈

OpenSearch-SQL: uma ferramenta de código aberto para transformar linguagem natural em consultas SQL

Introdução abrangente O OpenSearch-SQL é um projeto de código aberto, uma poderosa ferramenta Text-to-SQL que pode transformar a descrição da linguagem natural do usuário em instruções de consulta SQL, para ajudar as pessoas que não estão familiarizadas com o banco de dados a acessar facilmente os dados. Esse projeto foi desenvolvido pela equipe do OpenSearch-AI, com base no Apach...

SmolDocling:小体积高效处理文档的视觉语言模型-首席AI分享圈

SmolDocling: um modelo de linguagem visual para o processamento eficiente de documentos em um pequeno volume

O SmolDocling é um modelo de linguagem visual (VLM) desenvolvido pela equipe do ds4sd em colaboração com a IBM, com base no SmolVLM-256M, hospedado na plataforma Hugging Face. O SmolDocling é um modelo de linguagem visual (VLM) baseado no SmolVLM-256M, hospedado na plataforma Hugging Face. É o menor VLM do mundo, com apenas 256 milhões de parâmetros, e sua principal função é...

pt_BRPortuguês do Brasil