🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Notícias sobre IA Página 13

基于MoE架构的Qwen2.5-Max全面超越DeepSeek V3-首席AI分享圈

Qwen2.5-Max baseado na arquitetura MoE supera completamente o desempenho do DeepSeek V3

Visão geral do modelo Nos últimos anos, o treinamento de modelos grandes com base na arquitetura Mixture of Experts (MoE) se tornou uma direção de pesquisa importante no campo da inteligência artificial. A equipe da Qwen lançou recentemente o modelo Qwen2.5-Max, que usa dados de pré-treinamento de mais de 20 trilhões de tokens e um esquema de pós-treinamento refinado em M...

2025-01-30

Destilação do LLM: uma "guerra negra" contra a independência dos grandes modelos?

I. ANTECEDENTES E DESAFIOS Com o rápido desenvolvimento das tecnologias de IA, os modelos de linguagem em grande escala (LLMs) se tornaram um fator essencial no campo do processamento de linguagem natural. No entanto, o treinamento desses modelos exige enormes recursos computacionais e custos de tempo, o que levou ao surgimento de técnicas de destilação de conhecimento (KD). A destilação de conhecimento funciona combinando grandes ...

2025-01-29

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.

2025-04-25

新年好礼：赠送价值799的 COZE 零基础设计自动化工作流课程-首席AI分享圈

Presente de Ano Novo: Curso gratuito de fluxo de trabalho de automação de projeto zero-básico COZE no valor de 799

Todos os cursos disponíveis incluem: Introdução básica + Aulas práticas de fluxo de trabalho de automação 30 sessões Aulas básicas - Coze Desenvolvendo a inteligência do agente do zero - 54 sessões https://pan.quark.cn/s/931e5e153f4d#/list/share

2025-01-29

DeepSeek limita temporariamente novos registros, citando "ataques maliciosos maciços"

A DeepSeek foi atingida por um ataque malicioso maciço que restringiu temporariamente novos registros devido a um ataque ao seu serviço on-line que resultou em um processo de registro muito movimentado. O problema começou a surgir por volta de 27 de janeiro de 2025 por meio de um relatório de erro da API do DeepSeek, durante o qual o registro também estava enfrentando problemas de pequena escala. No início da manhã de 28 de janeiro, a API ...

2025-01-28

Qwen2.5-VL 发布：支持长视频理解、视觉定位、结构化输出，开源可微调-首席AI分享圈

Qwen2.5-VL lançado: suporta compreensão de vídeos longos, localização visual, saída estruturada, código aberto ajustável

1 Introdução ao modelo Nos cinco meses desde que o Qwen2-VL foi lançado, vários desenvolvedores criaram novos modelos com base no modelo de linguagem visual Qwen2-VL, fornecendo feedback valioso para a equipe do Qwen. Durante esse tempo, a equipe do Qwen se concentrou em criar modelos de linguagem visual mais úteis. Hoje, a equipe do Qwen tem o prazer de apresentar...

2025-01-28

DeepSeek发布统一多模态理解与生成模型：从 JanusFlow 到 Janus-Pro-首席AI分享圈

DeepSeek lança compreensão multimodal unificada e modelos generativos: do JanusFlow ao Janus-Pro

JanusFlow Quick Reads A equipe do DeepSeek está de volta com um novo modelo, lançando na madrugada do dia 28 uma estrutura multimodal inovadora, o Janus-Pro, um modelo unificado que pode lidar com tarefas de compreensão e geração multimodais. O modelo foi desenvolvido com base no DeepSeek-LLM-1.5b/base/DeepSeek-LLM-7b-base e suporta...

2025-01-28

百川智能发布Baichuan-Omni-1.5全模态大模型，多项测评超越GPT-4o Mini-首席AI分享圈

A Baichuan Intelligence lança o modelo grande omnimodal Baichuan-Omni-1.5, que supera o GPT-4o Mini em várias medições

Perto do final do ano, o campo de grandes modelos domésticos está novamente divulgando boas notícias. A Baichuan Intelligence lançou recentemente uma série de produtos de modelos grandes de forma intensiva, seguindo o modelo de inferência profunda de cena completa Baichuan-M1-preview e o modelo de código aberto médico aumentado Baichuan-M1-14B e, em seguida, relançou o modelo omnimodal Baichuan-Omni-1.5. Esse modelo ...

2025-01-27

DeepSeek: o furacão de IA de código aberto da China varre o Vale do Silício, remodelando o cenário global de IA

Hoje, o DeepSeek, uma estrela em ascensão no campo de IA da China, provocou um "terremoto" no setor de ciência e tecnologia em todo o mundo com sua incrível velocidade e força. Esse aplicativo, que é conhecido como "a luz da IA doméstica", não apenas liderou o ChatGPT na lista gratuita da App Store na região dos EUA, mas também liderou a lista gratuita da App Store na China....

2025-01-27

Análise aprofundada - O próximo mercado de agentes de US$ 300 bilhões, com estudos de caso

No final de 2024, o parceiro da YC, Jared, previu que, nos próximos anos, os agentes verticais de IA serão um mercado emergente 10 vezes maior que o SaaS, e esse campo também poderá dar origem a gigantes da tecnologia com uma capitalização de mercado de mais de US$ 300 bilhões. Naquela época, o CEO da Microsoft, Satya, também foi ousado: "Os agentes de IA substituirão todos os SaaS ...

2025-01-27

Por quanto tempo um modelo grande consegue entender um vídeo? Smart Spectrum GLM-4V-Plus: 2 horas

Com base nas duas gerações anteriores de modelos de vídeo (CogVLM2-Video e GLM-4V-PLUS), otimizamos ainda mais as técnicas de compreensão de vídeo com o lançamento da versão beta do GLM-4V-Plus-0111. Essa versão introduz técnicas como a resolução variável nativa, que melhora a capacidade do modelo de se adaptar a diferentes comprimentos e resoluções de vídeo....

2025-01-27

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型-首席AI分享圈

Qwen2.5-1M: um modelo Qwen de código aberto com suporte para 1 milhão de contextos de tokens

1. introdução Há dois meses, a equipe da Qwen atualizou o Qwen2.5-Turbo para suportar comprimentos de contexto de até um milhão de tokens. Hoje, a Qwen lançou oficialmente o modelo de código aberto Qwen2.5-1M e seu suporte de estrutura de inferência correspondente. Aqui estão os destaques do lançamento: Modelos de código aberto: Este lançamento apresenta dois...

2025-01-27

有道子曰-o1推理模型发布！首个输出分步式讲解，消费级显卡即可部署-首席AI分享圈

Lançamento do modelo de inferência Arigatou Ziyou-o1! Primeira explicação passo a passo de saída que pode ser implementada em placas gráficas de nível de consumidor

Em 2025, no início do ano, o setor de IA lançou um grande modelo de "maré de raciocínio". Desde que a OpenAI lançou o o1, vários modelos de raciocínio continuam a surgir, e a capacidade de raciocínio de ordem superior do modelo deu início ao surto de aprimoramento do valor de sua aplicação, o que também atraiu cada vez mais a atenção do setor. Recentemente, a NetEase lançou oficialmente a primeira explicação passo a passo do modelo de raciocínio de produção nacional...

2025-01-27

TokenVerse：谷歌开源了多图风格混合创意工具 Whisk-首席AI分享圈

TokenVerse: O Google abre o código-fonte do Whisk, uma ferramenta criativa para misturar estilos de várias imagens

1. introdução: uma nova era de geração de imagens Na era digital atual, a tecnologia de geração de imagens fez avanços impressionantes. Se você é um designer, um artista ou apenas uma pessoa comum que deseja criar conteúdo personalizado, as ferramentas de geração de imagens podem ajudá-lo a dar vida às suas ideias. Entretanto, as ferramentas tradicionais de geração de imagens...

2025-01-26

Windsurf CodiumAI: Assistente de RP atualizado!

Qual foi a origem do Assistente de RP? O Assistente de RP é um novo participante na área de desenvolvimento de software e surgiu porque as pessoas precisavam gerenciar as alterações de código com mais facilidade. Ele surgiu devido à necessidade de facilitar o gerenciamento das alterações de código, o que costumava ser uma dor de cabeça para as pessoas, e começou como uma forma de automatizar algumas verificações simples, mas agora se tornou muito poderoso...

2025-01-26

Text2Edit：文本驱动视频广告创作的原生多模态模型（未发布）-首席AI分享圈

Text2Edit: A Native Multimodal Model for Text-Driven Video Ad Creation (não publicado)

Introdução geral O Text2Edit é um projeto de código aberto hospedado no GitHub, com o objetivo de fornecer recursos eficientes de edição de texto e geração de anúncios. O principal objetivo do projeto é ajudar os usuários a processar rapidamente o conteúdo de texto e gerar material publicitário de alta qualidade por meio de uma interface fácil de usar e de recursos avançados.

2025-01-25Edição de áudio e vídeo com IA

Day of AI: um site gratuito de autoaprendizagem de IA criado pelo MIT

O Day of AI (Dia da Inteligência Artificial) nasceu em junho de 2021 no MIT. Liderado por uma equipe de professores e cientistas pesquisadores do RAISE (Responsible Artificial Intelligence and Education) do MIT, o projeto Day of AI tem como objetivo preparar alunos de todas as origens e habilidades para o Dia...

2025-01-25

O Ten Square Ronghai Xiaozhi AI saltou para o topo da classificação global do GitHub!

Na atual tecnologia em rápida mudança, a inteligência artificial (IA), como uma força a ser reconhecida, está mudando profundamente a maneira como vivemos e trabalhamos. Na onda crescente da IA, o Ten Square Ronghai Xiaozhi AI Voice Box saltou para o topo da classificação global do GitHub com seu excelente desempenho e experiência de usuário inovadora...

2025-01-24

Documentação técnica do sistema do operador

Artigo original: https://cdn.openai.com/operator_system_card.pdf EXPLAIN: OpenAI lança Operator, a primeira inteligência de nível L3: abrindo uma nova era de interação humano-computador 1 Introdução Operator é uma versão prévia de P&D do nosso modelo Computer Usage Agent (CUA), que combina o GPT -4...

2025-01-24

OpenAI 推出首个L3级智能体Operator：开启人机交互新时代-首席AI分享圈

OpenAI lança Operator, a primeira inteligência de nível L3: abrindo uma nova era de interação entre humanos e computadores

A área de Uso de Computadores está repleta de startups, competidores obscuros e grandes empresas gigantescas, e agora a OpenAI está arrasando. Você pode acompanhar o Desktop Automation Intelligence Body , coletamos dezenas de produtos relacionados. O campo da inteligência artificial está se tornando cada vez mais competitivo, não apenas com o surgimento de startups, mas também com a entrada de gigantes da tecnologia...

2025-01-24

página anterior
1
---
10
11
12
13
14
15
16
...
página seguinte
Total de 28 páginas

Notícias sobre IA Página 13

Qwen2.5-Max baseado na arquitetura MoE supera completamente o desempenho do DeepSeek V3

Destilação do LLM: uma "guerra negra" contra a independência dos grandes modelos?

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Presente de Ano Novo: Curso gratuito de fluxo de trabalho de automação de projeto zero-básico COZE no valor de 799

DeepSeek limita temporariamente novos registros, citando "ataques maliciosos maciços"

Qwen2.5-VL lançado: suporta compreensão de vídeos longos, localização visual, saída estruturada, código aberto ajustável

DeepSeek lança compreensão multimodal unificada e modelos generativos: do JanusFlow ao Janus-Pro

A Baichuan Intelligence lança o modelo grande omnimodal Baichuan-Omni-1.5, que supera o GPT-4o Mini em várias medições

DeepSeek: o furacão de IA de código aberto da China varre o Vale do Silício, remodelando o cenário global de IA

Análise aprofundada - O próximo mercado de agentes de US$ 300 bilhões, com estudos de caso

Por quanto tempo um modelo grande consegue entender um vídeo? Smart Spectrum GLM-4V-Plus: 2 horas

Qwen2.5-1M: um modelo Qwen de código aberto com suporte para 1 milhão de contextos de tokens

Lançamento do modelo de inferência Arigatou Ziyou-o1! Primeira explicação passo a passo de saída que pode ser implementada em placas gráficas de nível de consumidor

TokenVerse: O Google abre o código-fonte do Whisk, uma ferramenta criativa para misturar estilos de várias imagens

Windsurf CodiumAI: Assistente de RP atualizado!

Text2Edit: A Native Multimodal Model for Text-Driven Video Ad Creation (não publicado)

Day of AI: um site gratuito de autoaprendizagem de IA criado pelo MIT

O Ten Square Ronghai Xiaozhi AI saltou para o topo da classificação global do GitHub!

Documentação técnica do sistema do operador

OpenAI lança Operator, a primeira inteligência de nível L3: abrindo uma nova era de interação entre humanos e computadores

Não consegue encontrar ferramentas de IA? Tente aqui!

Gerador de imagens FLUX.1 (suporta entrada em chinês)

Hotspots de IA recentes

Recomendações de ferramentas de IA

Classificação das ferramentas de IA