Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

Conhecimento de IA Página 5

一文带你了解RAG(检索增强生成),概念理论介绍+ 代码实操-首席AI分享圈

Um artigo para levá-lo a entender o RAG (Retrieval Augmented Generation), o conceito de introdução teórica + prática de código

I. Os LLMs já são altamente capazes, então por que eles precisam de RAG (Retrieval Augmented Generation)? Embora os LLMs tenham demonstrado recursos significativos, os seguintes desafios ainda merecem atenção: Problema da ilusão: os LLMs usam uma abordagem probabilística com base estatística para gerar texto palavra por palavra, um mecanismo que inerentemente leva à possibilidade de...

OpenAI-o3 与 Monte-Carlo 思想-首席AI分享圈

OpenAI-o3 e ideias de Monte-Carlo

A o3 está aqui para compartilhar algumas percepções pessoais. O progresso na Lei de Escala de Tempo de Teste tem sido muito mais rápido do que pensávamos. Mas eu gostaria de dizer que o caminho é, na verdade, um pouco complicado - é a maneira da OpenAI de salvar o país da curva em sua busca pela AGI. Aprendizado por reforço e pensamento de atalho para ...

如何为RAG应用选择最佳Embedding模型-首席AI分享圈

Como escolher o melhor modelo de incorporação para aplicativos RAG

A incorporação de vetores está no centro dos atuais aplicativos RAG (Retrieval Augmented Generation). Eles capturam informações semânticas sobre objetos de dados (por exemplo, texto, imagens etc.) e as representam como matrizes de números. Nos aplicativos atuais de IA generativa, essas incorporações de vetores geralmente são geradas por modelos de incorporação. Como se inscrever no RAG ...

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化-首席AI分享圈

Um artigo de 10.000 palavras sobre otimização de RAG em cenários reais de DB-GPT.

Prefácio Nos últimos dois anos, a tecnologia Retrieval-Augmented Generation (RAG, Geração Aumentada por Recuperação) tornou-se gradualmente um componente essencial das inteligências aprimoradas. Ao combinar os recursos duplos de recuperação e geração, a RAG é capaz de trazer conhecimento externo, proporcionando assim mais aplicações de modelos grandes em cenários complexos...

2025年值得入坑的 AI Agent 五大框架-首席AI分享圈

As 5 principais estruturas de agentes de IA que vale a pena conhecer em 2025

Agent A tradução mais comum que vi até agora é "corpo inteligente", mas a tradução direta é "agente". Qual deveria ser a tradução de Agentic? Acho que o termo "agentic" é mais apropriado. Portanto, para não confundir os leitores, usarei diretamente o inglês neste artigo. Com o desenvolvimento do LLM, a capacidade da IA...

朴素、有效的RAG检索策略:稀疏+密集混合检索并重排,并利用“提示缓存”为文本块生成整体文档相关的上下文-首席AI分享圈

Estratégia de recuperação RAG simples e eficaz: pesquisa e rearranjo híbrido esparso + denso e uso de "cache de dicas" para gerar um contexto geral relevante para o documento para blocos de texto.

Para que um modelo de IA seja útil em um cenário específico, ele geralmente precisa ter acesso ao conhecimento prévio. Por exemplo, um chatbot de suporte ao cliente precisa entender o negócio específico que atende, enquanto um bot de análise jurídica precisa ter acesso a um grande número de casos anteriores. Os desenvolvedores costumam usar o Retrieval-Augmente...

小白也能看懂的大模型微调知识点-首席AI分享圈

Grandes pontos de conhecimento de ajuste fino do modelo que até mesmo um novato pode entender

Processo completo de ajuste fino de modelos grandes Recomenda-se seguir rigorosamente o processo acima durante o ajuste fino e evitar pular etapas, o que pode levar a um trabalho ineficaz. Por exemplo, se o conjunto de dados não for totalmente construído e, no final, for constatado que o efeito ruim do modelo ajustado é um problema de qualidade do conjunto de dados, os esforços preliminares serão desperdiçados e a questão...

Late Chunking×Milvus:如何提高RAG准确率-首席AI分享圈

Late Chunking x Milvus: como melhorar a precisão do RAG

01.Histórico No desenvolvimento de aplicativos RAG, a primeira etapa é dividir o documento em partes. A divisão eficiente de documentos em partes pode melhorar efetivamente a precisão do conteúdo recuperado subsequentemente. A fragmentação eficiente de documentos pode melhorar a precisão do conteúdo recuperado subsequente. Como fragmentar com eficiência é um tema muito discutido, como a fragmentação de tamanho fixo, a fragmentação de tamanho aleatório, a janela deslizante...

Anthropic总结构建高效智能体简单且有效的方法-首席AI分享圈

A Anthropic resume maneiras simples e eficazes de desenvolver inteligências eficientes

No ano passado, trabalhamos com equipes que criaram agentes LLM (Large Language Model) em vários setores. De forma consistente, descobrimos que as implementações mais bem-sucedidas não usaram estruturas complexas ou bibliotecas especializadas, mas foram construídas por meio de padrões simples e compostáveis. Nesta postagem, compartilharemos o que aprendemos ao trabalhar com nossos clientes e também com nossas próprias...

多为来自Anthropic的专家关于Prompt Engineering的讨论-首席AI分享圈

A maioria dos especialistas da Anthropic discute a Prompt Engineering

Resumo da IA Visão geral Uma análise aprofundada da engenharia de dicas de IA, com um formato de mesa redonda em que vários especialistas da Anthropic compartilham seu entendimento e experiência prática de engenharia de dicas a partir de uma variedade de perspectivas, incluindo pesquisa, consumidor e empresa. O artigo detalha a definição de engenharia de dicas, sua importância e como...

2024年度RAG清单,RAG应用策略100+-首席AI分享圈

2024 Inventário RAG, estratégia de aplicativo RAG 100+

  Olhando para 2024, os grandes modelos estão mudando a cada dia, e centenas de corpos inteligentes estão competindo. Como uma parte importante dos aplicativos de IA, o RAG também é um "grupo de heróis e vassalos". No início do ano, o ModularRAG continuou a esquentar, o GraphRAG brilhou, no meio do ano as ferramentas de código aberto estavam em pleno andamento, o gráfico de conhecimento criou uma nova oportunidade, no final do ano, o raciocínio gráfico ...

Best-of-N 越狱法:对输入内容进行简单的随机变形并反复尝试,就能让主流 AI 系统突破安全限制产生有害回应-首席AI分享圈

Best-of-N Jailbreak: uma simples transformação aleatória de entradas e tentativas repetidas de fazer com que os principais sistemas de IA ultrapassem as restrições de segurança para produzir respostas prejudiciais

Nos últimos anos, com o rápido desenvolvimento da IA generativa (GAI) e dos modelos de linguagem ampla (LLM), seus problemas de segurança e confiabilidade atraíram muita atenção. Um estudo recente descobriu um método de ataque simples, mas eficiente, chamado Best-of-N jailbreak (BoN, abreviado). Ao inserir ...

卷起来了!长文本向量模型分块策略大比拼-首席AI分享圈

Enrolados! Modelos vetoriais de texto longo Estratégias de fragmentação Competição

O modelo de vetor de texto longo é capaz de codificar dez páginas de texto em um único vetor, o que parece poderoso, mas será que é realmente prático? Muitas pessoas pensam... Não necessariamente. É possível usá-lo diretamente? Ele deve ser dividido em pedaços? Como fazer a divisão mais eficiente? Neste artigo, vamos levá-lo a uma discussão aprofundada sobre diferentes estratégias de fragmentação para modelos de vetores de texto longo, analisando os prós e os contras...

如何有效测试 LLM 提示词 - 从理论到实践的完整指南-首席AI分享圈

Como testar as pistas do LLM de forma eficaz - um guia completo da teoria à prática

  I. A causa principal do teste de prompts: o LLM é altamente sensível a prompts, e mudanças sutis no texto podem levar a resultados significativamente diferentes Prompts não testados podem produzir: informações factualmente incorretas respostas irrelevantes custos desnecessários de API desperdiçados II. Otimização sistemática de prompts...

Faculdade de Engenharia da AI: 1. Engenharia de dicas

Engenharia de prompts A engenharia de prompts, uma habilidade fundamental na era da IA generativa, é a arte e a ciência de projetar instruções eficazes para orientar os modelos de linguagem na geração do resultado desejado. Conforme relatado pelo DataCamp, essa disciplina emergente envolve a criação e a otimização de prompts para gerar os resultados desejados dos modelos de IA (...

AI工程学院:2.1从零开始实现 RAG-首席AI分享圈

AI Engineering Academy: 2.1 Implementando o RAG do zero

Visão geral Este guia o orientará na criação de um sistema RAG (Retrieval Augmented Generation) simples usando Python puro. Usaremos um modelo de incorporação e um modelo de linguagem grande (LLM) para recuperar documentos relevantes e gerar respostas com base nas consultas do usuário. https://github.com/adithya-s-k/A...

AI工程学院:2.2基本 RAG 实现-首席AI分享圈

AI Engineering Academy: 2.2 Implementação básica do RAG

Introdução A geração aprimorada por recuperação (RAG) é uma técnica avançada que combina os benefícios de grandes modelos de linguagem com a capacidade de recuperar informações relevantes de uma base de conhecimento. Essa abordagem melhora a qualidade e a precisão das respostas geradas, baseando-as em informações recuperadas específicas.a Este notebook tem como objetivo ...

pt_BRPortuguês do Brasil