Círculo de compartilhamento de IA

Compartilhamento diário dos mais recentes produtos de IA, projetos, estruturas, interpretações de artigos, etc.~
GLM-4.1V-Thinking - 智谱AI推出的开源视觉语言模型系列

GLM-4.1V-Thinking - uma família de modelos de linguagem visual de código aberto da Smart Spectrum AI

O GLM-4.1V-Thinking é um modelo de linguagem visual de código aberto introduzido pela Smart Spectrum AI, projetado para tarefas cognitivas complexas. O GLM-4.1V-Thinking é compatível com entradas multimodais, abrangendo imagens, vídeos e documentos. Com base na arquitetura GLM-4V, o modelo introduz uma cadeia de pensamento...
1 mês atrás
02.1K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - Modelagem de geração de áudio de Ali Tongyi

O ThinkSound é o primeiro modelo de geração de áudio CoT (Chain Thinking) introduzido pela equipe de fala de Ali Tongyi. O modelo pode gerar efeitos sonoros com correspondência precisa para imagens de vídeo, com base na introdução do raciocínio CoT, para resolver o problema da tecnologia tradicional, que é difícil de capturar os detalhes dinâmicos da tela e as relações espaciais.
1 mês atrás
01.7K
Qwen-TTS - 阿里通义千问推出的语音合成模型

Qwen-TTS - Modelo de síntese de fala de Ali Tongyi Qianqian

O Qwen-TTS é um modelo avançado de síntese de fala apresentado por Ali Tongyi. O modelo pode converter texto em fala natural e suave com eficiência, oferecendo suporte a vários idiomas e dialetos, como mandarim, inglês, dialeto de Pequim etc., para atender às necessidades de diferentes regiões e cenários. Com base no treinamento maciço de corpus, a saída de fala do modelo é de alta qualidade, rimando...
1 mês atrás
02.1K
MultiAgentPPT - 开源的AI演示文稿生成系统

MultiAgentPPT - Sistema de geração de apresentações de IA de código aberto

O MultiAgentPPT é um sistema de geração de apresentações de IA multiinteligente e de código aberto. Os usuários só precisam inserir o assunto, o sistema é baseado em colaboração multiinteligente, conclui automaticamente a geração do esboço, a divisão do assunto, a pesquisa paralela e o resumo do conteúdo e outras etapas para gerar rapidamente PPT.... de alta qualidade.
1 mês atrás
02.4K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1 - um modelo de IA unificado multimodal lançado pela Ali

Ovis-U1 é um modelo unificado multimodal introduzido pela equipe Ovis do Alibaba Group com uma escala de parâmetros de 3 bilhões. O modelo tem três recursos principais de compreensão multimodal, geração de texto para imagem e edição de imagem e, com um projeto arquitetônico avançado e métodos de treinamento unificado colaborativo, ele oferece suporte à realização de imagens de alta fidelidade...
1 mês atrás
02K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - aplicativo de ajuste virtual de IA do Google

O Doppl é um aplicativo de ajuste virtual de IA do Google. Depois que o usuário carrega uma foto de corpo inteiro, o aplicativo suporta a imagem ou captura de tela da roupa "vestida" na versão digital de seu próprio corpo e pode ser convertida de imagens estáticas em vídeo gerado por IA, para que os usuários possam sentir mais verdadeiramente o efeito da roupa no corpo.
2 meses atrás
01.7K
迅雷MCP - 迅雷推出的AI自动下载服务

Xunlei MCP - Serviço de download automático de IA lançado pela Xunlei

O Xunlei MCP é lançado pela Xunlei, um serviço de download automático baseado na tecnologia de IA. Os usuários do aplicativo de IA compatível com o serviço, com demanda de download por voz ou texto, a IA pode procurar automaticamente recursos de rede e iniciar o download. O Xunlei MCP é compatível com a versão para PC do Xunlei e do NAS Xunlei, quebrando o modo de download tradicional e permitindo...
2 meses atrás
01.6K
咔皮记账 - 商汤科技推出的智能AI记账应用

Kapi Bookkeeping - Aplicativo de contabilidade com IA inteligente da ShangTech

O Kapi Bookkeeping é um aplicativo inteligente de contabilidade com IA lançado pela Shangtang Technology. O aplicativo tem a contabilidade automática como sua função principal, identifica automaticamente valores e categorias e suporta entrada de voz, tornando a contabilidade fácil e conveniente. O Kapi Bookkeeping pode analisar de forma inteligente os dados de faturamento e enviar regularmente resumos de consumo personalizados e conselhos financeiros para ajudar os usuários a...
2 meses atrás
02K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Agente de programação de código aberto do Google

A Gemini CLI é a ferramenta de programação de IA de código aberto do Google, baseada na incorporação do Gemini Big Model no endpoint do desenvolvedor para fornecer aos desenvolvedores recursos avançados de IA. A ferramenta entende o código, manipula arquivos, executa comandos e soluciona problemas de forma dinâmica para ajudar os desenvolvedores a escrever eficientemente a geração...
2 meses atrás
01.5K
AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Um modelo quadrático de geração de imagens da Toast AI e outros

O AnimaTensor é um modelo quadrático de geração de imagens da equipe do CagliostroLab em colaboração com a TensorArt, com base em uma técnica inovadora de V-Prediction que otimiza o agendamento de ruídos ao prever a "velocidade" do processo de geração de imagens...
2 meses atrás
01.5K