BAGEL - Modelo de base multimodal de código aberto lançado pelo Wordpress
O BAGEL é um modelo de base multimodal de código aberto da ByteDance com 14 bilhões de parâmetros, dos quais 7 bilhões estão ativos. A base do modelo e a arquitetura de especialista em transformador misto (MoT), que captura recursos de nível de pixel e de nível semântico de uma imagem com dois codificadores independentes, respectivamente, oferecem suporte ao processamento eficiente de imagem, texto, vídeo...
DeepSeek-R1 - Modelo de inferência de IA do DeepSeek, desempenho alinhado à versão OpenAI o1
O DeepSeek-R1 é um modelo de inferência de IA de alto desempenho lançado pela DeepSeek, sediada em Hangzhou, comparando com a versão oficial o1 da OpenAI. O modelo é pós-treinado com base em técnicas de aprendizagem por reforço em larga escala e requer apenas uma quantidade muito pequena de dados rotulados para raciocinar em matemática, código e linguagem natural...
Phantom Boat AI - Plataforma completa de criação de curtas-metragens com IA, geração em lote de vários tipos de conteúdo de vídeo
O Phantom Boat AI é uma poderosa plataforma completa de criação de curtas-metragens com IA que oferece suporte à geração eficiente de lotes de vários tipos de conteúdo de vídeo, incluindo comerciais, promoções, animações e muito mais. A plataforma é baseada em Midjourney, Runway e outros modelos de IA líderes mundiais, e oferece aos criadores uma ampla gama de serviços, desde a criação de roteiros até...
Circuit Tracer - ferramenta de código aberto da Anthropic para visualizar o funcionamento interno dos modelos
O Circuit Tracer é uma ferramenta de código aberto da Anthropic para estudar o funcionamento interno de grandes modelos de linguagem. Com base na geração de gráficos de atribuição (gráficos de atribuição) para revelar as etapas internas realizadas pelo modelo na geração de uma determinada saída ...
Google AI Edge Gallery - Google lança aplicativo de IA para dar suporte a telefones celulares que executam modelos de IA
O Google AI Edge Gallery é um aplicativo experimental de IA do Google que permite aos usuários experimentar e usar modelos de Aprendizado de Máquina (ML) e Inteligência Artificial Generativa (GenAI) em dispositivos nativos. O aplicativo é compatível com dispositivos Android.
Data Agent - Uma nova geração de inteligência de dados de classe empresarial do Volcano Engine
O Data Agent é uma nova geração de inteligência de dados de nível empresarial lançada pela Volcano Engine, com foco em análise de dados e marketing inteligente. O Data Agent integra dados estruturados e não estruturados dentro da empresa e gera relatórios de pesquisa abrangentes e detalhados com base em pesquisa e análise aprofundadas.
Keling 2.1 - Modelos de geração de vídeo com IA da Shutterstock
O KeLing 2.1 é um modelo de geração de vídeo de IA lançado pela Racer, que agora está disponível na plataforma de vídeo de IA KeLing. O modelo contém três versões: padrão, de alta qualidade e mestre, fornecendo efeitos de 720P, 1080P e de nível de filme para atender a diferentes necessidades criativas. A versão padrão da velocidade de geração, adequada para produção rápida...
Little Lark - Agente de criação inteligente da Shear Image
O Little Lark é um agente de criação inteligente lançado pela Shear Image, com base na tecnologia de IA para remodelar os limites da criação de conteúdo, tornando a criação mais simples, mais eficiente e mais interessante. O Little Lark oferece suporte à criação de vídeos, vídeos pop-up digitais, desenhos de design e imagens para planos de fundo sem necessidade de limiar, os usuários só precisam digitar um comando e o suporte de IA conclui com eficiência...
Drafting AI Community - plataforma de design de conteúdo criativo de IA, uma variedade de recursos de design para atender a diferentes necessidades criativas
A Drafting AI Community é uma plataforma on-line de inspiração criativa de IA que oferece aos usuários uma grande variedade de recursos e ferramentas de design criativo. A plataforma abrange uma variedade de campos de design, incluindo fotos de imagens, design de comércio eletrônico, temas de feriados, ilustrações em 3D, design de avatar, materiais Xiaohongshu, design de retratos etc., para atender às necessidades de diferentes usuários.
Ming-lite-omni - Macromodelos multimodais unificados de código aberto pela equipe do Ant 100
O Ming-Lite-Omni é um grande modelo multimodal unificado de código aberto da equipe Bailing Big Model do Ant Group, desenvolvido com base na eficiente arquitetura Mixture of Experts (MoE). O Ming-Lite-Omni é compatível com o processamento de texto, imagens, áudio e vídeo...