O Qwen-Image é um modelo básico de geração de imagens de código aberto lançado pela equipe do Alibaba Tongyi Qianqian. Com 20 bilhões de parâmetros, ele adota a Multimodal Diffusion Transformer Architecture (MMDiT), que incorpora três módulos: compreensão multimodal, codificação de alta resolução e modelagem de difusão.
O RedOne é um modelo de linguagem amplo, adaptado para redes sociais, apresentado pelo Little Red Book. O modelo é treinado por meio de uma estratégia de treinamento em três estágios que incorpora conhecimento social e cultural, fortalece os recursos de multitarefa e alinha as preferências humanas. O RedOne supera significativamente o modelo básico no desempenho de tarefas sociais, na detecção de conteúdo nocivo e na navegação...
O TRAE SOLO é um assistente de desenvolvimento automatizado de IA apresentado pelo TRAE, um assistente de programação de IA lançado pela ByteDance, para simplificar o processo de desenvolvimento de software com tecnologia de IA. O TRAE SOLO entende as necessidades do usuário, suporta descrições de texto, comandos de voz e uploads de arquivos para inserir os requisitos e planeja automaticamente...
O dots.vlm1 é o primeiro grande modelo multimodal de código aberto do Little Red Book hi lab. Com base no NaViT, um codificador visual de 1,2 bilhão de parâmetros treinado do zero, e no DeepSeek V3 Large Language Model (LLM), ele tem uma poderosa percepção visual e inferência de texto...
O Genie 3 é uma nova geração de modelos de mundos universais do Google DeepMind que permite a geração de mundos virtuais altamente dinâmicos e coerentes em tempo real. O Genie 3 simula fenômenos físicos, ecossistemas naturais e oferece suporte à criação de cenários históricos e de fantasia. Com instruções de texto, os usuários podem...
O Claude Opus 4.1 é um modelo de linguagem em larga escala de última geração da Anthropic, projetado para o processamento eficiente de tarefas complexas. O modelo é excelente no domínio da programação, gerando código de alta qualidade, suportando até 32k de saída única e adaptando-se a uma ampla variedade de estilos de programação...
O gpt-oss é a família de modelos de inferência de código aberto da OpenAI que permite soluções de IA eficientes, flexíveis e fáceis de implantar para desenvolvedores. O gpt-oss vem em duas versões, o gpt-oss-120B com 117 bilhões de parâmetros e suporte para 8...
O MiDashengLM é o grande modelo de código aberto da Xiaomi para a compreensão eficiente do som, com a versão de parâmetro específico MiDashengLM-7B, com foco no processamento e na compreensão do áudio. O modelo é baseado no codificador de áudio Xiaomi Dasheng e no Qwen2.5-Omn...
O MOSS-TTSD é um modelo de diálogo falado de código aberto desenvolvido pelo Speech and Language Lab da Universidade de Tsinghua. O MOSS-TTSD pode converter scripts de diálogos de texto em diálogos naturais, suaves e expressivos, além de oferecer suporte à geração bilíngue em inglês e chinês.
O AudioGen-Omni é um modelo de geração de áudio multimodal da Racer que gera áudio, fala e músicas de alta qualidade com base em entradas como vídeo, texto etc. O AudioGen-Omni se baseia em técnicas avançadas, como o transformador de difusão multimodal e o...
LangExtract é uma biblioteca Python de código aberto do Google que usa modelos de linguagem grandes (LLMs) para extrair informações estruturadas de textos não estruturados. Com comandos definidos pelo usuário e um pequeno número de exemplos, ela pode identificar e organizar com eficiência os principais detalhes, como notas clínicas de...
O FastDeploy é uma ferramenta de raciocínio e implementação de alto desempenho da Baidu, projetada para Modelos de Linguagem Grandes (LLMs) e Modelos de Linguagem Visuais (VLMs). O FastDeploy foi desenvolvido com base na estrutura do Flying Paddle (PaddlePaddle) e oferece suporte a uma variedade de plataformas de hardware...
InteriorGS é um conjunto de dados semânticos gaussianos 3D de alta qualidade apresentado pela Qunar Technology. O conjunto de dados contém 1.000 cenas em 3D que abrangem mais de 80 ambientes internos, como residências, lojas de conveniência, salões de casamento e museus. O conjunto de dados tem mais de 554.000 instâncias de objetos em 755 categorias...
O DragonV2.1 é um modelo avançado de conversão de texto em fala (TTS) de amostra zero da Microsoft. Com base na arquitetura Transformer, o modelo oferece suporte a clonagem de fala em vários idiomas e com amostra zero e gera uma fala natural e expressiva com apenas 5 a 90 segundos de prompts de voz.
O ScreenCoder é uma ferramenta inteligente de código aberto que pode converter rapidamente capturas de tela de design de interface do usuário em código HTML/CSS de alta qualidade. Ferramentas baseadas em arquitetura modular de inteligência múltipla, combinadas com compreensão visual, planejamento de layout e técnicas de síntese de código para dar suporte à geração de front-end de alta precisão e semântica...
Gemini 2.5 O Deep Think é um modelo de raciocínio de IA do Google projetado para resolver tarefas complexas. Ele é uma variante do modelo que ganhou a medalha de ouro na Olimpíada Internacional de Matemática (IMO) de 2025 e foi projetado para resolver tarefas complexas por meio de raciocínio paralelo.
O MindLink é um grande modelo de raciocínio de código aberto lançado pela Kunlun World Wide Web. Com o mecanismo de raciocínio adaptativo, de acordo com a complexidade da tarefa, é possível alternar com flexibilidade o modo de inferência, gerar rapidamente tarefas simples, raciocinar em profundidade tarefas complexas, levando em conta a eficiência e a precisão. Paradigma de raciocínio orientado por planos para remover a tag "pensar", reduzir ...
A versão de alta velocidade do Kimi K2 (kimi-k2-turbo-preview) é um modelo de linguagem de alto desempenho introduzido pelo Kimi, o Lado Escuro da Lua. O modelo é otimizado com base no Kimi K2, e a velocidade de saída é bastante aumentada, podendo gerar 40 tokens por segundo...
O dots.ocr é um modelo de análise de documentos multilíngues de código aberto do Xiaohongshu hi lab, baseado em um modelo de linguagem visual (VLM) de 1,7 bilhão de parâmetros, que pode executar com eficiência a detecção de layout de documentos e o reconhecimento de conteúdo, mantendo uma boa ordem de leitura.
O HYPIR é um grande modelo para restauração de imagens introduzido pela equipe de Dong Chao nos Institutos de Tecnologia Avançada de Shenzhen, Academia Chinesa de Ciências. O modelo combina a prévia fracionária do modelo de difusão com uma rede geradora adversária para obter uma restauração de imagem eficiente e de alta qualidade. O HYPIR pode restaurar rapidamente fotos antigas e melhorar a resolução, mantendo o texto claro...
FLUX.1 Krea [dev] é um modelo gráfico gerado por texto da Black Forest Labs e da Krea AI. O modelo gera imagens realistas e de alta qualidade com base em descrições de texto de entrada, com um estilo estético exclusivo que evita a...
O Qwen3-Coder-Flash é um modelo de programação de alto desempenho introduzido pela equipe do Ali Tongyi Thousand Questions, com excelentes recursos de programação baseada em agentes e de chamada de ferramentas, bom para lidar com tarefas de programação complexas. O modelo suporta 256 mil tokens de compreensão de contexto longo e pode ser dimensionado para 1 milhão ...
O Wide Research é um recurso avançado da plataforma Manus projetado para lidar com tarefas complexas e de grande escala. A plataforma suporta centenas de inteligências de uso geral trabalhando simultaneamente por meio de mecanismos de processamento paralelo em nível de sistema e protocolos de colaboração de inteligência.
O Seed Diffusion é um modelo experimental de linguagem de difusão introduzido pela ByteHop que lida com tarefas de geração de código. O modelo é baseado em técnicas como treinamento de difusão em dois estágios, aprendizado sequencial restrito e decodificação paralela eficiente e aprimorada, o que melhora significativamente a velocidade de inferência para 2.146 tokens/s, que é mais rápida do que...
Xiao Xingxu é o produto de geração de histórias em quadrinhos com emoção de IA lançado pela Jingdong Health, atualmente em fase de testes. O produto tem como função principal a geração de histórias em quadrinhos com emoção, os usuários podem expressar suas emoções ou contar uma história por meio de voz ou texto, e a IA gera quadrinhos de quatro painéis correspondentes e interpretação de histórias com base na entrada.
O 1688 AI version é um aplicativo de assistente de negócios inteligente lançado pela plataforma 1688 do Alibaba, projetado para compradores e comerciantes de pequeno porte. Com base nos dados maciços da plataforma 1688, o aplicativo oferece oportunidades de negócios, recomendação de produtos, geração de ideias, consulta empresarial e outras funções para ajudar os usuários a compreender com precisão a dinâmica do mercado,...
O Steps Deep Research é uma eficiente ferramenta de pesquisa de IA lançada pela Steps Star, que pode concluir de forma autônoma pesquisas sobre questões complexas e gerar relatórios profissionais em um curto período de tempo. A ferramenta foi projetada para finanças, consultoria, saúde, direito e outros campos, e se destacou nas análises do setor com seus recursos de pesquisa aprofundada e integração de informações.
O Runway Aleph é um modelo avançado de edição de vídeo com IA lançado pela Runway, que se baseia em comandos de texto simples para adicionar e excluir rapidamente o conteúdo do vídeo, alterar o estilo, ajustar o ambiente e otimizar o movimento da câmera. Os usuários podem remover facilmente elementos redundantes, alterar cenas sem operações complexas...
O WebShaper é um sistema de síntese de dados de treinamento de IA lançado pelo Tongyi Lab da Alibaba, que se baseia em modelagem formal e mecanismo de expansão de inteligência para gerar dados de treinamento escalonáveis e de alta qualidade para ajudar as inteligências de IA a aprimorar os recursos de recuperação de informações complexas. O sistema introduz o conceito de "projeção de conhecimento"...
O Skywork UniPic é um modelo de pré-treinamento multimodal de código aberto da KunlunWanwei, com três recursos principais: compreensão de imagens, geração de texto e edição de imagens. O modelo se baseia em uma arquitetura autorregressiva, fundindo o codificador MAR e o backbone SigLIP2, com um medidor de parâmetros de 1,5B...
O ChatGPT Study é um modelo de aprendizagem inovador da OpenAI que ajuda os usuários a aprender e compreender de forma mais eficiente. O ChatGPT Study orienta os usuários a pensar ativamente e a resolver problemas passo a passo por meio de questionamentos socráticos, respostas estruturadas e...
O Tongyi Wanphase Wan2.2 é um modelo avançado de geração de vídeo com IA de código aberto da Alibaba, com um total de 27 bilhões de referências. O modelo contém três modos de vídeo gerado por texto, vídeo gerado por gráfico e geração de vídeo unificado, que podem gerar vídeos de alta qualidade com base em descrições de texto, imagens ou uma combinação de ambos.
O GLM-4.5 é um modelo SOTA de código aberto da Smart Spectrum, projetado para aplicativos de corpo inteligente, incorporando raciocínio, geração de código e recursos de corpo inteligente. O modelo é baseado na arquitetura Mixed Expert (MoE) e contém duas versões, GLM-4.5 com 355 bilhões de parâmetros e 106 bilhões...
O Coze Studio é a plataforma de desenvolvimento de corpo inteligente de IA de código aberto da ByteDance, projetada para que os desenvolvedores simplifiquem a criação, a implementação e o gerenciamento de aplicativos de IA.
O Coze Loop é a plataforma de desenvolvimento de inteligência de IA de código aberto e de gerenciamento de operação e manutenção da plataforma Coze da ByteDance. A plataforma oferece aos desenvolvedores o gerenciamento do ciclo de vida completo, desde o desenvolvimento, a depuração até a avaliação e o monitoramento, abrangendo a engenharia de palavras-chave, a avaliação do efeito do agente, o monitoramento do desempenho e o ajuste...
A Wuneng é uma plataforma de inteligência incorporada projetada para robôs e dispositivos inteligentes. Com base no modelo de mundo "Enlightened" e na tecnologia de modelo grande multimodal, a Wuneng integra entradas de vários sensores, como visão, voz, toque etc., e possui recursos avançados de percepção, tomada de decisões e ação.
O Intern-S1 é um grande modelo científico multimodal lançado pelo Shanghai Artificial Intelligence Laboratory. O modelo integra profundamente os recursos linguísticos e multimodais, com funções avançadas como análise científica multimodal, fusão linguística e visual, processamento de dados científicos, resposta a perguntas científicas, design e otimização de experimentos.
O modelo de mundo 3D Hunyuan 1.0 (Hunyuan World 1.0) é o primeiro modelo de geração de mundo imersivo, interativo e de simulação do setor de código aberto da Tencent. O modelo integra a geração visual panorâmica e a tecnologia de reconstrução hierárquica em 3D para oferecer suporte à entrada de texto ou imagem para gerar rapidamente 36...
O Day by Day V6.5 é um macromodelo de inferência multimodal avançado da ShangTech, projetado para lidar com entradas mistas de imagem e texto, oferecendo suporte à compreensão precisa do conteúdo da imagem e gerando descrições ou respondendo a perguntas em combinação com o texto.
O Opal é uma plataforma inovadora de geração de miniaplicativos de IA do Google Labs que ajuda os usuários a criar e compartilhar rapidamente aplicativos de IA sem precisar escrever código.
O Qwen-MT é um Qwen-MT de última geração - um modelo de tradução automática lançado pela equipe do Ali Tongyi Thousand Questions, com base na poderosa arquitetura Qwen3, que suporta a intertradução de 92 idiomas e abrange uma população global de mais de 95%. O modelo é baseado no leve MoE ...
O Agentar-Fin-R1 é um modelo de linguagem grande de última geração para o domínio financeiro introduzido pela Anthem. Desenvolvido com base na poderosa arquitetura Qwen3, o modelo oferece duas versões de escala de parâmetros, 8B e 32B, e pode lidar com precisão com tarefas complexas de raciocínio financeiro, incluindo análise em várias etapas, avaliação de risco e guerra...
O MonkeyCode é um assistente de programação de IA nativo de código aberto, de nível empresarial, projetado para equipes de desenvolvimento preocupadas com a privacidade e a segurança. O MonkeyCode oferece suporte à implantação privada e ao uso off-line para garantir a segurança dos dados de código ...
O Seed LiveInterpret 2.0 é um modelo de interpretação simultânea de última geração lançado pela equipe Seed da ByteDance, que oferece suporte à tradução bidirecional entre chinês e inglês. O modelo tem uma precisão de tradução quase real e latência extremamente baixa, com um atraso médio de fala para fala de apenas 2 a 3 segundos, muito menor do que o de...
O Excel MCP Server é uma ferramenta de servidor baseada no protocolo de contexto de modelo (MCP) para manipular arquivos do Excel sem a necessidade de instalar o Microsoft Excel.
O ChatFlow é uma ferramenta de automação de fluxo de trabalho de IA de código aberto que oferece suporte à transformação de requisitos complexos em fluxos de trabalho eficientes. Ferramentas baseadas na tecnologia de IA para ajudar os usuários a gerar rapidamente estruturas de código, casos de teste, podem ajudar a escrever e projetar a arquitetura de software.
O Mureka V7 é um modelo avançado de geração de música com IA lançado pela Kunlun World Wide. O modelo se baseia na tecnologia MusiCoT, que permite planejar a estrutura geral da música antes de preencher os detalhes para gerar trabalhos musicais mais coerentes e artísticos.
O Seed GR-3 é um modelo de robótica de uso geral introduzido pela ByteDance com fortes recursos de generalização para se adaptar a novos ambientes e comandos complexos. O modelo combina informações visuais, verbais e de movimento e se baseia em um método de treinamento três em um de dados do robô, dados de trajetória humana de RV e dados gráficos públicos para aprimorar a capacidade de responder a novos objetos...
O Qwen3-Coder é um modelo de geração de código de última geração introduzido pela equipe de Ali Tongyi Qianqian. O modelo tem 480 bilhões de parâmetros e 35 bilhões de parâmetros de ativação, suporta contextos nativos de 256 mil tokens e pode ser dimensionado para até 1 milhão de tokens.
O OpenReasoning-Nemotron é uma série de modelos de linguagem em larga escala de código aberto da NVIDIA para dar suporte ao processamento de tarefas de raciocínio em matemática, ciências e código. Os modelos são destilados com base no modelo DeepSeek R1 0528 com escalas de parâmetros de 1,5 bilhão...
O Seed-X é um modelo de tradução multilíngue lançado pela equipe Seed da ByteDance, com 7 bilhões de parâmetros, que oferece suporte à tradução bidirecional em 28 idiomas. O modelo combina pré-treinamento de dados multilíngues, ajuste fino de comandos e técnicas de aprendizagem por reforço para processar com eficiência padrões de idiomas complexos e melhorar a qualidade da tradução...
O JoyAgent-JDGenie é um sistema de inteligência múltipla de uso geral, leve e de código aberto, que não requer desenvolvimento secundário e pode ser usado diretamente. O JoyAgent-JDGenie pode lidar com tarefas complexas, como geração de relatórios, análise de dados etc., e suporta uma variedade de formatos de entrega, como páginas da Web, PPT ...
O Fogsight é um agente inovador de geração de animação de IA que transforma conceitos abstratos em animações vívidas com base em modelos de linguagem ampla (LLM). Os usuários inserem tópicos e o Fogsight gera animações completas com narração bilíngue e recursos visuais cinematográficos.
O Goedel-Prover-V2 é um modelo de prova de teoremas de código aberto de instituições importantes, como a Universidade de Princeton, a Universidade de Tsinghua e a NVIDIA. O modelo baseia-se em técnicas inovadoras, como síntese hierárquica de dados, autocorreção orientada pelo verificador e média de modelos para melhorar significativamente o desempenho de provas formais automatizadas...
A BytePlus é uma plataforma de serviços inteligentes de nível empresarial lançada pela BytePlus para fornecer serviços diversificados no exterior. A plataforma abrange funções avançadas, como distribuição e aceleração de conteúdo (CDN), recomendação personalizada, realidade aumentada, processamento e análise de dados, comunicação de áudio e vídeo em tempo real, inteligência artificial e aprendizado de máquina.
A Flying Book Miaohu é uma plataforma de construção de sistemas nativos de IA de nível empresarial lançada pela Flying Book. A plataforma transforma rapidamente os requisitos de negócios da empresa em aplicativos reais por meio de uma arquitetura multiagente, dando suporte a todo o processo, desde a análise de requisitos até o design funcional, o desenvolvimento de aplicativos e a correção de problemas. Os usuários usam o diálogo para criar facilmente aplicativos leves...
O MirageLSD é o primeiro modelo de vídeo de IA de difusão de streaming em tempo real da equipe de IA da Decart, permitindo a geração ilimitada de vídeo em tempo real com latência tão baixa quanto 40 milissegundos e saída suave a 24 quadros/segundo.
O Kimi Playground é uma plataforma de experiência de chamada de ferramentas de IA para desenvolvedores do Dark Side of the Moon. O Kimi Playground permite que a IA chame uma variedade de ferramentas (por exemplo, pesquisas meteorológicas, reservas de hotéis, análise de dados etc.) para concluir tarefas complexas, não apenas...
O ChatGPT Agent é um agente de IA de uso geral da OpenAI que combina vários recursos para concluir tarefas complexas de forma autônoma. Os usuários só precisam descrever suas necessidades em linguagem natural, e o agente pode selecionar automaticamente as ferramentas apropriadas, como navegar na Web, extrair informações, executar códigos...
O GLM-Experimental é um modelo experimental de linguagem grande lançado pela Wisdom Spectrum AI, que agora está disponível na plataforma Z.ai. O modelo tem a capacidade de gerar PPTs automaticamente. O modelo tem a capacidade de gerar automaticamente PPTs. Depois que os usuários inserem tópicos ou pontos-chave, o modelo pode gerar rapidamente apresentações claramente estruturadas e formatadas, que serão...
O PromptForge é um poderoso banco de trabalho de engenharia de dicas de IA que ajuda os usuários a criar, testar e otimizar dicas de IA com eficiência. O PromptForge fornece sugestões de otimização por meio de recursos de geração inteligente que suportam comparações de vários modelos e ajuste dinâmico de parâmetros, oferecendo aos usuários a flexibilidade de comparar...
O VikingDB é um banco de dados vetorial nativo da nuvem de alto desempenho lançado pelo Volcano Engine, projetado para processar dados vetoriais de alta dimensão em massa. O VikingDB tem uma variedade de métodos de gravação de dados, incluindo gravação síncrona em tempo real, assíncrona etc., para atender às necessidades de processamento de dados de diferentes cenários.
O RoboBrain 2.0 é um modelo de cérebro incorporado avançado de código aberto que oferece recursos avançados de percepção, raciocínio e planejamento para robôs. O RoboBrain 2.0 consiste em duas versões, 7B e 32B, e adota uma arquitetura heterogênea que integra codificadores visuais e modelos linguísticos para dar suporte...
O RoboOS 2.0 é uma estrutura de código aberto para colaboração cérebro-cérebro entre ontologias, que promove a transformação de robôs de inteligência única em inteligência colaborativa de grupo. A estrutura usa uma arquitetura de "cérebro grande" para obter uma divisão eficiente do trabalho, com o cérebro na nuvem responsável pela tomada de decisões complexas e pela colaboração, e os módulos de cérebro pequeno concentrados na execução de habilidades específicas.
O EXAONE 4.0 é um grande modelo de raciocínio híbrido da LG AI Research na Coreia, que combina processamento de linguagem natural de uso geral e recursos avançados de raciocínio. O modelo suporta coreano, inglês e espanhol e é dividido em uma versão profissional de 32B e uma versão final de 1,2B. A versão profissional é adequada para os setores jurídico, contábil...
O Tizzy.ai é um aplicativo de pesquisa inteligente de IA lançado pelo Baidu. O Tizzy.ai se baseia na tecnologia de modelo grande do Baidu, com funções de pesquisa inteligentes e poderosas, pode responder rapidamente a perguntas, pensar profundamente e ajudar na tomada de decisões.
O Voxtral é um modelo de fala de código aberto de última geração da Mistral AI que apóia o avanço da interação natural homem-computador por meio de recursos avançados de transcrição e compreensão de fala. O modelo está disponível em duas versões, 24B para produção em massa e 3B para implantação local.
O k2 é um modelo básico de arquitetura MoE com código excelente e recursos de agente da Moonshot AI, com parâmetros totais de 1T e parâmetros de ativação de 32B. Em testes de desempenho de benchmark nas principais categorias de Raciocínio de conhecimento geral, Programação, Matemática e Agente, o modelo k2...
O Grok 4 é o mais recente modelo de IA de grande porte da xAI, e o Grok 4 oferece uma melhoria de 10 vezes no poder de raciocínio em relação ao seu antecessor. A capacidade de raciocínio superior do modelo permite que ele tenha uma pontuação quase perfeita em exames difíceis, como o SAT e o GRE, e supera outros modelos de ponta em vários testes de referência...
O GenFlow Super Hitchhiker é um agente de IA de uso geral lançado pela Baidu Literature Library. Os usuários só precisam inserir comandos de linguagem natural e podem desmontar tarefas de forma independente, chamar as 1,4 bilhão de bibliotecas de documentos e recursos on-line da Baidu Literature Library e gerar PPTs, relatórios, gráficos, pôsteres e outros conteúdos totalmente modais de forma extremamente rápida.
O TRAE Agent é o assistente de engenharia de software inteligente de código aberto da ByteDance, desenvolvido com base em modelos avançados de linguagem grande (LLMs). O TRAE Agent lida com eficiência com tarefas complexas de desenvolvimento de software, incluindo exploração de base de código, reprodução de problemas, formulação de correções e geração de código de alta qualidade, etc. ....
O Higress MCP é uma plataforma inovadora lançada pela Invest Today que oferece suporte à rápida transformação de APIs de dados financeiros tradicionais em serviços MCP modernos. O Higress MCP permite a transformação de APIs REST em servidor MCP com base em uma configuração simples, sem a necessidade de codificação...
O CodeBuddy IDE é um assistente de desenvolvimento de pilha completa orientado por IA lançado pela Tencent, com base em meios inteligentes para melhorar a eficiência do desenvolvimento. O CodeBuddy IDE tem uma poderosa função de conclusão de código de IA, que suporta previsão em tempo real e conclusão automática de fragmentos de código para reduzir a duplicação de trabalho.
O Pet TA é um produto interativo AIGC para animais de estimação lançado pela Jingdong, que oferece uma plataforma interativa on-line divertida e acolhedora para os amantes de animais de estimação. Ele permite que os usuários escolham uma variedade de roupas e acessórios bonitos para seus animais de estimação, personalizem as roupas e criem uma imagem digital de seus animais de estimação para interagir com eles. A plataforma oferece...
O Chat Healing Small Universe é um produto de acompanhamento mental de IA lançado pela Jingdong Health. Lançado com base no grande modelo médico de Jingdiao Qianxin, o Chat Healing Little Universe pode simular o processo de comunicação humana e a empatia, além de fornecer aos usuários suporte de saúde mental 7×24 horas. Os usuários interagem com o personagem de IA Little Fish com base em texto, emoji ou voz para compartilhar emoções...
O Shortcut é uma ferramenta inovadora de assistência ao Excel orientada por IA. Com base em algoritmos inteligentes, ela pode concluir rapidamente uma variedade de tarefas complexas do Excel, incluindo entrada de dados, edição, cálculo e organização.
O StarFlow Agent é um agente de design criativo completo projetado para usuários chineses pela Liblib. O StarFlow Agent dá continuidade aos recursos de design inteligente de pilha completa da Lovart, adaptando-se totalmente à semântica chinesa, à estética oriental e aos cenários locais. Os usuários só precisam digitar uma frase e o Agen...
O Step-Audio-AQAA é um modelo de linguagem de áudio de ponta a ponta e em grande escala para tarefas AQAA (Audio Query-Audio Answer) da equipe StepFun. Ele pode processar diretamente a entrada de áudio para gerar respostas de fala naturais e precisas sem depender do reconhecimento automático de fala tradicional (A...
O MuseSteamer é um grande modelo para geração de vídeo multimodal lançado pela Baidu. O modelo pode gerar rapidamente conteúdo de vídeo dinâmico de alta qualidade com base em descrições de texto ou imagens fornecidas pelo usuário e suporta uma variedade de versões de clareza e funcionalidade para atender às necessidades de criação em diferentes cenários.
O Painting é uma plataforma de geração de vídeos com IA lançada pela Baidu, baseada na tecnologia de IA para ajudar os usuários a criar facilmente vídeos personalizados. A interface intuitiva do Painting, com ferramentas poderosas e função de recomendação de inspiração, pode fornecer aos criadores inspiração criativa, apoiar uma chave para a mesma operação, gerar rapidamente vídeos semelhantes e simplificar o processo criativo.
O Antelope é uma ferramenta de design inteligente lançada pela Jingdong, que oferece soluções de design eficientes e convenientes para comerciantes de comércio eletrônico e pessoas físicas. Por meio de digitação inteligente, layout inteligente, correspondência inteligente de cores e outras funções, ele ajuda os usuários a gerar rapidamente trabalhos de design de alta qualidade para atender à imagem principal do produto, ao banner de anúncio, à página da loja e a outros tipos de loja de comércio eletrônico...
A Tencent Advertising Miaosi é uma plataforma de criação de publicidade de IA única lançada pela Tencent Advertising, com base no grande modelo híbrido da Tencent, fornecendo aos anunciantes serviços eficientes e inteligentes de geração e otimização de criativos. Ela suporta uma variedade de ferramentas criativas, como texto para mapa, mapa para mapa, texto para vídeo etc. Os usuários só precisam inserir uma descrição simples em linguagem natural ou fazer upload de material...
O Tucoli é uma ferramenta de processamento de imagens com IA que se concentra em fornecer serviços eficientes e convenientes de edição de fotos e vídeos. Com base na avançada tecnologia de inteligência artificial, ele pode realizar rapidamente várias funções, como digitação com um clique, processamento de vídeo, reparo e embelezamento de fotos, pintura com IA e substituição de plano de fundo.
O Circle Journey é um aplicativo de planejamento de viagens com IA que ajuda os usuários a organizar seus itinerários de viagem de forma eficiente e conveniente. Os usuários podem inserir rapidamente informações como destino e horário para gerar automaticamente um itinerário razoável e personalizado. Ele suporta a importação com um clique de links, textos ou imagens de plataformas de mídia social para gerar rapidamente o mesmo itinerário.
O ML-Master é uma inteligência especializada em IA lançada pela equipe de agentes da Escola de Inteligência Artificial da Universidade de Shanghai Jiaotong. Ele teve um bom desempenho no teste de benchmark autorizado da OpenAI, o MLE-bench, encabeçando a lista com uma taxa média de medalhas de 29,3%, superando o RD-Agent da Microsoft...
O Paperpal é um auxílio de IA voltado para a redação acadêmica, ajudando pesquisadores, estudantes e profissionais a melhorar a qualidade e a eficiência de sua redação. Com recursos avançados de retoque de linguagem, ele oferece verificação gramatical, correção ortográfica e sugestões de escolha de palavras para garantir um texto preciso e fluente.
O GLM-4.1V-Thinking é um modelo de linguagem visual de código aberto introduzido pela Smart Spectrum AI, projetado para tarefas cognitivas complexas. O GLM-4.1V-Thinking é compatível com entradas multimodais, abrangendo imagens, vídeos e documentos. Com base na arquitetura GLM-4V, o modelo introduz uma cadeia de pensamento...
O ThinkSound é o primeiro modelo de geração de áudio CoT (Chain Thinking) introduzido pela equipe de fala de Ali Tongyi. O modelo pode gerar efeitos sonoros com correspondência precisa para imagens de vídeo, com base na introdução do raciocínio CoT, para resolver o problema da tecnologia tradicional, que é difícil de capturar os detalhes dinâmicos da tela e as relações espaciais.
O Mapify é um gerador de mapas mentais de IA da equipe da XMind. Ele pode converter rapidamente textos, PDFs, páginas da Web, vídeos, áudios e outros formatos em mapas mentais estruturados, ajudando os usuários a extrair e organizar com eficiência as principais informações.
O CodeArts Doer é um assistente de desenvolvimento inteligente de IA lançado pela Huawei Cloud para melhorar a eficiência do desenvolvimento e a qualidade do software por meio da tecnologia de IA. Com base em 6 inteligências de agente (equipe, projeto, produto, desenvolvedor, teste e assistente de committer), ele atende às necessidades de...
O Qwen-TTS é um modelo avançado de síntese de fala apresentado por Ali Tongyi. O modelo pode converter texto em fala natural e suave com eficiência, oferecendo suporte a vários idiomas e dialetos, como mandarim, inglês, dialeto de Pequim etc., para atender às necessidades de diferentes regiões e cenários. Com base no treinamento maciço de corpus, a saída de fala do modelo é de alta qualidade, rimando...
O MultiAgentPPT é um sistema de geração de apresentações de IA multiinteligente e de código aberto. Os usuários só precisam inserir o assunto, o sistema é baseado em colaboração multiinteligente, conclui automaticamente a geração do esboço, a divisão do assunto, a pesquisa paralela e o resumo do conteúdo e outras etapas para gerar rapidamente PPT.... de alta qualidade.
Ovis-U1 é um modelo unificado multimodal introduzido pela equipe Ovis do Alibaba Group com uma escala de parâmetros de 3 bilhões. O modelo tem três recursos principais de compreensão multimodal, geração de texto para imagem e edição de imagem e, com um projeto arquitetônico avançado e métodos de treinamento unificado colaborativo, ele oferece suporte à realização de imagens de alta fidelidade...
O Kangaroo Staff é um aplicativo de tomada de decisão inteligente de IA voltado para comerciantes, lançado pela Meituan para ajudar os comerciantes a resolver problemas na abertura e operação de lojas. Com base nos dados massivos de catering da Meituan e em mais de 10 anos de experiência em operações on-line, por meio da interação de diálogo, ele fornece aos comerciantes informações precisas sobre a seleção de faixas, o local de abertura da loja, o desenvolvimento de pratos, a operação da loja e outros cenários....
O AI Jitterbug é um aplicativo de pesquisa e deep thinking inteligente lançado pela Jitterbug para oferecer aos usuários uma experiência de aquisição de conteúdo mais eficiente e inteligente. Com base no poderoso ecossistema de conteúdo e na tecnologia de IA da Jitterbug, ele fornece aos usuários respostas mais abrangentes e detalhadas por meio de recursos de pesquisa e raciocínio conectados.
O Qwen VLo é um modelo multimodal unificado de compreensão e geração apresentado pela equipe da Tongyiqianqian. O Qwen VLo pode "entender" o mundo e recriá-lo com alta qualidade com base em sua compreensão, realizando o salto da percepção para a geração. O VLo pode compreender com precisão o conteúdo das imagens e, com base nisso, pode realizar uma geração consistente e de alta qualidade.
O AiBiao é uma ferramenta de processamento de gráficos de IA que ajuda os usuários a concluir com eficiência o trabalho de processamento e análise de dados por meio da interação de linguagem natural. Ela permite que os usuários consultem, limpem, mesclem, calculem e analisem dados por meio de diálogo, sem a necessidade de fórmulas ou códigos complexos, o que reduz o limite do processamento de dados.