Aprendizagem pessoal com IA
e orientação prática
豆包Marscode1

Conhecimento de IA Página 5

小白也能看懂的大模型微调知识点-首席AI分享圈

Grandes pontos de conhecimento de ajuste fino do modelo que até mesmo um novato pode entender

Processo completo de ajuste fino de modelos grandes Recomenda-se seguir rigorosamente o processo acima durante o ajuste fino e evitar pular etapas, o que pode levar a um trabalho ineficaz. Por exemplo, se o conjunto de dados não for totalmente construído e, no final, for constatado que o efeito ruim do modelo ajustado é um problema de qualidade do conjunto de dados, os esforços preliminares serão desperdiçados e a questão...

Late Chunking×Milvus:如何提高RAG准确率-首席AI分享圈

Late Chunking x Milvus: como melhorar a precisão do RAG

01.Histórico No desenvolvimento de aplicativos RAG, a primeira etapa é dividir o documento em partes. A divisão eficiente de documentos em partes pode melhorar efetivamente a precisão do conteúdo recuperado subsequentemente. A fragmentação eficiente de documentos pode melhorar a precisão do conteúdo recuperado subsequente. Como fragmentar com eficiência é um tema muito discutido, como a fragmentação de tamanho fixo, a fragmentação de tamanho aleatório, a janela deslizante...

Anthropic总结构建高效智能体简单且有效的方法-首席AI分享圈

A Anthropic resume maneiras simples e eficazes de desenvolver inteligências eficientes

No ano passado, trabalhamos com equipes que criaram agentes LLM (Large Language Model) em vários setores. De forma consistente, descobrimos que as implementações mais bem-sucedidas não usaram estruturas complexas ou bibliotecas especializadas, mas foram construídas por meio de padrões simples e compostáveis. Nesta postagem, compartilharemos o que aprendemos ao trabalhar com nossos clientes e também com nossas próprias...

多为来自Anthropic的专家关于Prompt Engineering的讨论-首席AI分享圈

A maioria dos especialistas da Anthropic discute a Prompt Engineering

Resumo da IA Visão geral Uma análise aprofundada da engenharia de dicas de IA, com um formato de mesa redonda em que vários especialistas da Anthropic compartilham seu entendimento e experiência prática de engenharia de dicas a partir de uma variedade de perspectivas, incluindo pesquisa, consumidor e empresa. O artigo detalha a definição de engenharia de dicas, sua importância e como...

2024年度RAG清单,RAG应用策略100+-首席AI分享圈

2024 Inventário RAG, estratégia de aplicativo RAG 100+

  Olhando para 2024, os grandes modelos estão mudando a cada dia, e centenas de corpos inteligentes estão competindo. Como uma parte importante dos aplicativos de IA, o RAG também é um "grupo de heróis e vassalos". No início do ano, o ModularRAG continuou a esquentar, o GraphRAG brilhou, no meio do ano as ferramentas de código aberto estavam em pleno andamento, o gráfico de conhecimento criou uma nova oportunidade, no final do ano, o raciocínio gráfico ...

Best-of-N 越狱法:对输入内容进行简单的随机变形并反复尝试,就能让主流 AI 系统突破安全限制产生有害回应-首席AI分享圈

Best-of-N Jailbreak: uma simples transformação aleatória de entradas e tentativas repetidas de fazer com que os principais sistemas de IA ultrapassem as restrições de segurança para produzir respostas prejudiciais

Nos últimos anos, com o rápido desenvolvimento da IA generativa (GAI) e dos modelos de linguagem ampla (LLM), seus problemas de segurança e confiabilidade atraíram muita atenção. Um estudo recente descobriu um método de ataque simples, mas eficiente, chamado Best-of-N jailbreak (BoN, abreviado). Ao inserir ...

卷起来了!长文本向量模型分块策略大比拼-首席AI分享圈

Enrolados! Modelos vetoriais de texto longo Estratégias de fragmentação Competição

O modelo de vetor de texto longo é capaz de codificar dez páginas de texto em um único vetor, o que parece poderoso, mas será que é realmente prático? Muitas pessoas pensam... Não necessariamente. É possível usá-lo diretamente? Ele deve ser dividido em pedaços? Como fazer a divisão mais eficiente? Neste artigo, vamos levá-lo a uma discussão aprofundada sobre diferentes estratégias de fragmentação para modelos de vetores de texto longo, analisando os prós e os contras...

如何有效测试 LLM 提示词 - 从理论到实践的完整指南-首席AI分享圈

Como testar as pistas do LLM de forma eficaz - um guia completo da teoria à prática

  I. A causa principal do teste de prompts: o LLM é altamente sensível a prompts, e mudanças sutis no texto podem levar a resultados significativamente diferentes Prompts não testados podem produzir: informações factualmente incorretas respostas irrelevantes custos desnecessários de API desperdiçados II. Otimização sistemática de prompts...

Faculdade de Engenharia da AI: 1. Engenharia de dicas

Engenharia de prompts A engenharia de prompts, uma habilidade fundamental na era da IA generativa, é a arte e a ciência de projetar instruções eficazes para orientar os modelos de linguagem na geração do resultado desejado. Conforme relatado pelo DataCamp, essa disciplina emergente envolve a criação e a otimização de prompts para gerar os resultados desejados dos modelos de IA (...

AI工程学院:2.1从零开始实现 RAG-首席AI分享圈

AI Engineering Academy: 2.1 Implementando o RAG do zero

Visão geral Este guia o orientará na criação de um sistema RAG (Retrieval Augmented Generation) simples usando Python puro. Usaremos um modelo de incorporação e um modelo de linguagem grande (LLM) para recuperar documentos relevantes e gerar respostas com base nas consultas do usuário. https://github.com/adithya-s-k/A...

AI工程学院:2.2基本 RAG 实现-首席AI分享圈

AI Engineering Academy: 2.2 Implementação básica do RAG

Introdução A geração aprimorada por recuperação (RAG) é uma técnica avançada que combina os benefícios de grandes modelos de linguagem com a capacidade de recuperar informações relevantes de uma base de conhecimento. Essa abordagem melhora a qualidade e a precisão das respostas geradas, baseando-as em informações recuperadas específicas.a Este notebook tem como objetivo ...

AI工程学院:2.3BM25 RAG (检索增强生成)-首席AI分享圈

Academia de Engenharia de IA: 2.3BM25 RAG (Retrieval Augmented Generation)

INTRODUÇÃO O BM25 Retrieval Augmented Generation (BM25 RAG) é uma técnica avançada que combina o algoritmo BM25 (Best Matching 25) para recuperação de informações com um modelo de linguagem ampla para geração de texto. Ao usar um modelo de recuperação probabilístico validado, esse método melhora a precisão e a relevância das respostas geradas....

AI工程学院:2.4用于检索增强生成(RAG)系统的数据分块技术-首席AI分享圈

AI Engineering Academy: 2.4 Técnicas de fragmentação de dados para sistemas de geração aumentada de recuperação (RAG)

Introdução A fragmentação de dados é uma etapa fundamental dos sistemas RAG (Retrieval Augmented Generation). Ele divide documentos grandes em partes menores e gerenciáveis para indexação, recuperação e processamento eficientes. Este LEIAME apresenta uma visão geral dos vários métodos de fragmentação disponíveis no pipeline do RAG. https://github.com/adithya-...

AI 辅助编程给软件工程带来的需求开发范式变化(宝玉)-首席AI分享圈

Mudanças no paradigma de desenvolvimento de requisitos na engenharia de software provocadas pela programação assistida por IA (Baoyu)

As ferramentas de programação de IA, como o Cursor e o v0 dev, não apenas reduziram drasticamente o limite de programação para a pessoa comum, mas também permitiram que os programadores profissionais aumentassem drasticamente sua eficiência de desenvolvimento. Mas todas as notícias que ouvimos são sobre estudantes do ensino médio que não sabem programar,...

AI工程学院:2.5RAG 系统评估-首席AI分享圈

Faculdade de Engenharia da IA: Avaliação de sistemas 2,5 RAG

Introdução A avaliação é um componente essencial para o desenvolvimento e a otimização dos sistemas RAG (Retrieval Augmentation Generation). A avaliação envolve a medição do desempenho, da precisão e da qualidade de todos os aspectos do processo de RAG, desde a eficácia da recuperação até a relevância e a autenticidade das respostas geradas. Importância da avaliação do RAG Um sistema RAG eficaz...

pt_BRPortuguês do Brasil