GLM-4.1V-Thinking - uma família de modelos de linguagem visual de código aberto da Smart Spectrum AI
O GLM-4.1V-Thinking é um modelo de linguagem visual de código aberto introduzido pela Smart Spectrum AI, projetado para tarefas cognitivas complexas. O GLM-4.1V-Thinking é compatível com entradas multimodais, abrangendo imagens, vídeos e documentos. Com base na arquitetura GLM-4V, o modelo introduz uma cadeia de pensamento...
ThinkSound - Modelagem de geração de áudio de Ali Tongyi
O ThinkSound é o primeiro modelo de geração de áudio CoT (Chain Thinking) introduzido pela equipe de fala de Ali Tongyi. O modelo pode gerar efeitos sonoros com correspondência precisa para imagens de vídeo, com base na introdução do raciocínio CoT, para resolver o problema da tecnologia tradicional, que é difícil de capturar os detalhes dinâmicos da tela e as relações espaciais.
Qwen-TTS - Modelo de síntese de fala de Ali Tongyi Qianqian
O Qwen-TTS é um modelo avançado de síntese de fala apresentado por Ali Tongyi. O modelo pode converter texto em fala natural e suave com eficiência, oferecendo suporte a vários idiomas e dialetos, como mandarim, inglês, dialeto de Pequim etc., para atender às necessidades de diferentes regiões e cenários. Com base no treinamento maciço de corpus, a saída de fala do modelo é de alta qualidade, rimando...
MultiAgentPPT - Sistema de geração de apresentações de IA de código aberto
O MultiAgentPPT é um sistema de geração de apresentações de IA multiinteligente e de código aberto. Os usuários só precisam inserir o assunto, o sistema é baseado em colaboração multiinteligente, conclui automaticamente a geração do esboço, a divisão do assunto, a pesquisa paralela e o resumo do conteúdo e outras etapas para gerar rapidamente PPT.... de alta qualidade.
Ovis-U1 - um modelo de IA unificado multimodal lançado pela Ali
Ovis-U1 é um modelo unificado multimodal introduzido pela equipe Ovis do Alibaba Group com uma escala de parâmetros de 3 bilhões. O modelo tem três recursos principais de compreensão multimodal, geração de texto para imagem e edição de imagem e, com um projeto arquitetônico avançado e métodos de treinamento unificado colaborativo, ele oferece suporte à realização de imagens de alta fidelidade...
Doppl - aplicativo de ajuste virtual de IA do Google
O Doppl é um aplicativo de ajuste virtual de IA do Google. Depois que o usuário carrega uma foto de corpo inteiro, o aplicativo suporta a imagem ou captura de tela da roupa "vestida" na versão digital de seu próprio corpo e pode ser convertida de imagens estáticas em vídeo gerado por IA, para que os usuários possam sentir mais verdadeiramente o efeito da roupa no corpo.
Xunlei MCP - Serviço de download automático de IA lançado pela Xunlei
O Xunlei MCP é lançado pela Xunlei, um serviço de download automático baseado na tecnologia de IA. Os usuários do aplicativo de IA compatível com o serviço, com demanda de download por voz ou texto, a IA pode procurar automaticamente recursos de rede e iniciar o download. O Xunlei MCP é compatível com a versão para PC do Xunlei e do NAS Xunlei, quebrando o modo de download tradicional e permitindo...
Kapi Bookkeeping - Aplicativo de contabilidade com IA inteligente da ShangTech
O Kapi Bookkeeping é um aplicativo inteligente de contabilidade com IA lançado pela Shangtang Technology. O aplicativo tem a contabilidade automática como sua função principal, identifica automaticamente valores e categorias e suporta entrada de voz, tornando a contabilidade fácil e conveniente. O Kapi Bookkeeping pode analisar de forma inteligente os dados de faturamento e enviar regularmente resumos de consumo personalizados e conselhos financeiros para ajudar os usuários a...
Gemini CLI - Agente de programação de código aberto do Google
A Gemini CLI é a ferramenta de programação de IA de código aberto do Google, baseada na incorporação do Gemini Big Model no endpoint do desenvolvedor para fornecer aos desenvolvedores recursos avançados de IA. A ferramenta entende o código, manipula arquivos, executa comandos e soluciona problemas de forma dinâmica para ajudar os desenvolvedores a escrever eficientemente a geração...
AnimaTensor - Um modelo quadrático de geração de imagens da Toast AI e outros
O AnimaTensor é um modelo quadrático de geração de imagens da equipe do CagliostroLab em colaboração com a TensorArt, com base em uma técnica inovadora de V-Prediction que otimiza o agendamento de ruídos ao prever a "velocidade" do processo de geração de imagens...