À medida que a aplicação da IA na programação se torna cada vez mais profunda, muitos desenvolvedores, depois de experimentar a conveniência da programação assistida por IA, esperam ter um "engenheiro de IA exclusivo" que entenda melhor suas necessidades. O cerne dessa demanda está na capacidade da IA de seguir com precisão as instruções personalizadas do desenvolvedor...
Histórico: Desafios do n8n com a integração da base de conhecimento do RAG O n8n está ganhando força como uma poderosa ferramenta de fluxo de trabalho automatizado de código aberto. Ela foi fundada em 2019 por Jan Oberhauser, ex-designer visual de Piratas do Caribe, com o objetivo de...
Vibe Coding: o código desaparece, uma nova onda de desenvolvimento de software orientado pela intuição? O crescimento exponencial da inteligência artificial generativa está remodelando os setores, e o desenvolvimento de software não é exceção. Por volta do início de 2025, uma nova onda de pensamento começou a se estabelecer no Vale do Silício: o desenvolvimento de...
Histórico: por que você precisa de acesso público n8n O n8n é uma poderosa ferramenta de automação de fluxo de trabalho de código aberto que permite aos usuários conectar diferentes aplicativos e serviços para criar processos automatizados. No entanto, durante o uso, muitos dos nós de aplicativos do n8n (especialmente aqueles que envolvem serviços de terceiros que concedem...
Introdução geral O serverless-qrcode-hub é uma ferramenta de código aberto projetada para resolver o problema da falha frequente dos códigos QR nos bate-papos em grupo do WeChat. Ela se baseia em Cloudflare Workers e bancos de dados D1, sem a necessidade de servidores tradicionais para executar ...
Recentemente, o MCP (Model Calling Protocol) tornou-se um termo muito usado nos círculos técnicos. Simplificando, o MCP foi projetado para simplificar o processo de uso de ferramentas ou serviços externos para grandes modelos de linguagem (LLMs), reduzindo significativamente a necessidade de desenvolvedores e usuários criarem...
As estruturas tradicionais de rastreamento da Web são versáteis, mas geralmente exigem limpeza e formatação adicionais ao processar dados, o que torna sua integração com os modelos de linguagem grande (LLMs) relativamente complexa. A saída de muitas ferramentas (por exemplo, HTML bruto ou JSON não estruturado) contém muito ruído e não é adequada para uso direto...
Com a popularidade dos LLMs (Large Language Models) e de vários serviços de IA, está se tornando cada vez mais comum que os desenvolvedores integrem esses recursos em seus aplicativos. No entanto, chamar diretamente os pontos de extremidade da API de provedores de serviços, como OpenAI, Hugging Face e outros, geralmente traz uma série de problemas de gerenciamento...
VS Code 1.99 apresenta suporte ao protocolo de contexto de modelo O Visual Studio Code (VS Code) apresenta oficialmente o suporte ao protocolo de contexto de modelo (MCP) em sua versão 1.99.
Capturar, organizar e utilizar de forma eficaz o conteúdo da Web tornou-se uma habilidade fundamental nas informações digitais cada vez mais ricas de hoje em dia. Muitos usuários que experimentaram ferramentas como Notion, Instapaper ou Readwise podem se deparar com captura incompleta de conteúdo, gerenciamento de recuperação inconveniente...
Esse sonho fornece a cota do modelo de geração de imagens 3.0, que sempre não é suficiente, e hoje o teste direto não será usado. E o uso diário desse sonho para gerar diretamente a capa do artigo também é um tanto inconveniente. Por isso, pensei em usar a fivela na referência do modelo de imagem 3.0 do dream (o nome padrão é seedream3.0...).
Recentemente, o MCP (Model Context Protocol) atraiu muita atenção da comunidade de desenvolvedores e entusiastas de tecnologia. Essa tecnologia tem como objetivo simplificar a forma como os LLMs (Large Language Models, modelos de linguagem grandes) interagem com várias ferramentas e serviços externos, prometendo remodelar a forma como...
A disseminação da Inteligência Artificial (IA) trouxe oportunidades de mudança na educação, mas também traz sérios desafios, sendo o mais imediato deles o impacto sobre a integridade acadêmica. A capacidade das ferramentas de IA de gerar texto obscureceu os limites do plágio no sentido tradicional, criando dificuldades sem precedentes para os educadores...
O Three.js é uma ferramenta que permite que as páginas da Web exibam imagens "tridimensionais". Pense assim: ele fornece um conjunto de ferramentas que permite aos desenvolvedores desenhar formas 3D em páginas da Web, como cubos, esferas e assim por diante. Ele também permite que essas formas 3D se movam, de modo que...
À medida que o desenvolvimento de software assistido por IA cresce em popularidade, surge um desafio importante: como permitir que os assistentes de codificação de IA tenham uma "memória" entre sessões como um desenvolvedor humano, lembrando e aplicando as especificações de codificação de um projeto, preferências, processos específicos e até mesmo detalhes de requisitos. Atualmente, o popular...
O sistema tradicional de atendimento ao cliente de comércio eletrônico se baseia na cooperação entre o sistema inteligente de atendimento ao cliente e a equipe humana, mas esse modelo geralmente enfrenta gargalos de eficiência e pontos problemáticos de experiência. Embora a tecnologia de big model tenha sido desenvolvida há vários anos, a maior parte do atendimento ao cliente com IA ainda se limita à assistência baseada em processos predefinidos (modo SOP) ou à simples colaboração homem-máquina (modo Copilo...
O ecossistema Python nunca teve falta de ferramentas de gerenciamento de pacotes e de ambiente, desde o pip clássico e o virtualenv até o pip-tools e o conda, passando pelo moderno Poetry, PDM e assim por diante. Cada ferramenta tem sua própria área de especialização, mas geralmente...
Nas mídias sociais, essas fotos impressionantes de flores de cerejeira sempre chamam a atenção facilmente. As pessoas podem se perguntar por que algumas pessoas conseguem tirar fotos de flores de cerejeira no mesmo dia de primavera, enquanto suas próprias fotos parecem medíocres ou até mesmo desanimadoras. Uma piada pode apontar a verdade: "Ele usa a teleobjetiva para capturar as cores da primavera, mas você...
O Deep Research Web UI é uma ferramenta de visualização de pesquisa inteligente impulsionada por IA. Ela integra tecnologias avançadas, como mecanismos de pesquisa, rastreamento da Web e modelagem de linguagem ampla, para se aprofundar automaticamente em problemas complexos e gerar relatórios de pesquisa bem estruturados. A ferramenta é forte...
Recentemente, um serviço de MCP que gera imagens chamou minha atenção. Com base no Together AI, o serviço se integra a editores de código como o Cursor, permitindo que os desenvolvedores experimentem as alegrias do mapeamento de IA sem precisar sair de seu ambiente de codificação familiar. Foi relatado que o M...
Este artigo orientará os leitores sobre como atualizar facilmente a Dify. Antes de começar, verifique se você tem as duas ferramentas a seguir instaladas: Dify Local Deployment: essa é a base da operação de atualização. Cursor: uma ferramenta de programação de IA que melhora drasticamente a eficiência do desenvolvimento. Ferramentas opcionais: Silicon Flow...
O OpenManus foi atualizado com frequência recentemente. Além de oferecer suporte a Ollama local e provedores de API da Web, ele também adiciona suporte a mecanismos de pesquisa nacionais e várias adaptações de WebUI. Neste artigo, apresentaremos várias WebUIs do OpenManus, distribuídas pela comunidade...
Antecedentes Com base na plataforma Wenshin Intelligent Body, combinada com o mais recente desenvolvimento do modelo DeepSeek de assistente de recomendação de livros, pode ser baseada no conteúdo do diálogo do usuário para recomendação inteligente de produtos, para obter conversão precisa e dinheiro de transação, para construir um negócio de ciclo fechado. Este tutorial analisará profundamente a recomendação de livros do DeepSeek...
Deseja criar um aplicativo que forneça recomendações personalizadas de jogos? Este tutorial o guiará passo a passo na criação de um sistema de recomendação de jogos personalizado usando as técnicas Retrieval Augmented Generation (RAG), combinadas com os modelos DeepSeek e Ollama. Usaremos o Epic G...
Para facilitar a diferenciação, as bases de conhecimento fora da plataforma Dify são coletivamente chamadas de "bases de conhecimento externas" neste artigo. Introdução A funcionalidade da base de conhecimento integrada e os mecanismos de recuperação de texto da Dify podem não atender às necessidades de alguns desenvolvedores avançados que podem exigir um controle mais preciso sobre os resultados da recuperação de texto. Alguns...
Recentemente, a Dify lançou a versão 1.0.1, que corrige alguns problemas da versão anterior. De acordo com o feedback dos usuários, muitos deles estão interessados no efeito da integração da Dify com o RAGFlow. Neste artigo, apresentaremos a integração da Dify com o RAGFlow em detalhes....
Recentemente, a Anthropic lançou o Claude 3.7 Sonnet, uma versão atualizada do modelo Claude 3.5 Sonnet. Embora apenas a versão 0.2 tenha sido adicionada ao número da versão, essa atualização traz uma série de mudanças no desempenho e na funcionalidade...
Já faz algum tempo que a bolt.new uniu forças com a Anima para lançar um recurso inovador que gera aplicativos de pilha completa executáveis simplesmente copiando o URL de um design do Figma. Na página inicial do bolt.new, clique em "Import from Figma": ...
Introdução Este documento detalha como criar um aplicativo RAG (Retrieval Augmented Generation) localizado usando o DeepSeek R1 e o Ollama. Ele também complementa o uso do LangChain para criar aplicativos RAG locais. Veremos exemplos...
Introdução Este documento descreve como implementar um agente local simples usando o ReActAgent do LlamaIndex em conjunto com o Ollama. O LLM usado neste documento é o modelo qwen2:0.5b e, devido aos diferentes modelos...
INTRODUÇÃO O ReAct (Reasoning and Acting) é uma estrutura que combina raciocínio e ação para aprimorar o desempenho das inteligências em tarefas complexas. A estrutura permite que as inteligências tenham um desempenho mais eficaz em ambientes dinâmicos, integrando fortemente o raciocínio lógico com a ação prática...
Introdução Este documento detalha como usar a estrutura do LlamaIndex para criar um aplicativo RAG (Retrieval-Augmented Generation) local. Ao integrar o LlamaIndex, é possível criar um aplicativo RAG (Retrieval-Augmented Generation) ...
Este tutorial pressupõe que você já esteja familiarizado com os seguintes conceitos: Modelos de bate-papo Encadeamento de runnables Embeddings Armazenamentos de vetores Geração aumentada por recuperação...
A Dify oferece suporte ao acesso a recursos de inferência e incorporação de modelos de linguagem em larga escala implementados pelo Ollama. Acesso rápido Faça o download do Ollama Acesse a instalação e a configuração do Ollama e veja os tutoriais de implantação local do Ollama. Executar o Ol...
Introdução Este documento descreve como criar um assistente de programação local do tipo Copilot para ajudá-lo a escrever códigos mais bonitos e eficientes. Neste curso, você aprenderá a usar o Ollama para integrar assistentes de programação locais, incluindo o Continue Aider ...
I. Implementação com o Node.js 1. Instale o Node.js Faça o download e instale a ferramenta Node.js: https://www.nodejs.com.cn/download.html Configure a fonte espelho, por exemplo, usando o seguinte...
Introdução Este documento descreve como usar o Ollama para se integrar ao LangChain em um ambiente JavaScript para criar aplicativos avançados de IA. O Ollama é uma ferramenta de implantação de código aberto para modelos de linguagem grandes e o LangChain ...
Introdução Este documento descreve como usar o Ollama para se integrar ao LangChain em um ambiente Python para criar aplicativos avançados de IA. O Ollama é uma ferramenta de implantação de código aberto para modelos de linguagem grandes, e o LangChain é um...
Este artigo descreve como usar a API do Ollama em Golang. Este documento foi criado para ajudar os desenvolvedores a se familiarizarem rapidamente e aproveitarem ao máximo os recursos do Ollama.
Este artigo descreve como usar a API do Ollama em C++. Este documento foi criado para ajudar os desenvolvedores de C++ a se familiarizarem rapidamente e aproveitarem ao máximo os recursos do Ollama. Ao estudar este documento, você poderá integrar facilmente o Ollama aos seus projetos. Observação...
Este artigo descreve como usar a API do Ollama em JavaScript. Este documento foi criado para ajudar os desenvolvedores a se atualizarem rapidamente e aproveitarem ao máximo os recursos do Ollama. Você pode usá-lo em um ambiente Node.js ou diretamente no navegador, importando o par...
Este artigo descreve como usar a API do Ollama em Java. Este documento foi criado para ajudar os desenvolvedores a se familiarizarem rapidamente e aproveitarem ao máximo os recursos do Ollama. Você pode chamar a API do Ollama diretamente em seu aplicativo ou por meio do componente Spring AI...
Neste artigo, daremos uma breve olhada em como usar a API do Ollama em Python. Se você quiser ter uma simples conversa de bate-papo, trabalhar com big data usando respostas de fluxo contínuo ou quiser criar, copiar, excluir modelos etc. localmente, este artigo poderá orientá-lo...
Em dezembro passado, o Gemini 2.0 Flash foi apresentado pela primeira vez a testadores beta selecionados com seus recursos de saída de imagem nativa. Agora, os desenvolvedores podem experimentar esse novo recurso em todas as regiões compatíveis com o Google AI Studio. Os desenvolvedores podem ...
Introdução O Ollama fornece uma API REST avançada que permite que os desenvolvedores interajam facilmente com grandes modelos de linguagem. Com a API do Ollama, os usuários podem enviar solicitações e receber respostas geradas pelos modelos, aplicadas a tarefas como processamento de linguagem natural, geração de texto e assim por diante. Este documento ...
Windows A seguir, um exemplo de como personalizar o Ollama para ser executado na GPU em um sistema Windows. O Ollama usa a CPU para inferência por padrão. Para obter uma inferência mais rápida, você pode configurar o Ollama para usar...
Tomando o sistema Windows como exemplo, os modelos extraídos pelo Ollama são armazenados na unidade C por padrão. Se você precisar extrair mais de um modelo, a unidade C ficará cheia, o que afeta o espaço de armazenamento da unidade C. Portanto, esta seção apresentará como usar o Ollama no Windows, Linux e Mac...
Introdução Esta seção ensina como usar o Modelfile para personalizar a importação de modelos, que está dividida nas seguintes seções: Importando do GGUF Importando do Pytorch ou Safetensors Importando de modelos diretamente Importando de modelos Personalizando o prompt ...
Introdução Esta seção ensina como concluir a instalação e a configuração do Ollama no Docker. O Docker é uma tecnologia de contêineres virtualizados que se baseia em imagens e pode iniciar uma variedade de contêineres em segundos. Cada um desses contêineres é um ambiente de tempo de execução completo que permite a...
Introdução Esta seção ensina como concluir a instalação e a configuração do Ollama em um sistema Linux, bem como a atualização do Ollama, instalações específicas de versões, visualização de registros e desinstalação. I. Instalação rápida do Ollama Download: https://ollama...
Introdução Esta seção ensina como concluir a instalação e a configuração do Ollama no sistema Windows e está dividida nas seguintes partes: Visite o site oficial para concluir o download diretamente Configuração de variáveis de ambiente Execute o Ollama para verificar o sucesso da instalação 🎉 A. Visite o site oficial para concluir o download direto do ...
Introdução Esta seção ensina como concluir a instalação e a configuração do Ollama no sistema macOS, dividida principalmente nas três partes a seguir: Visite o site oficial para concluir o download diretamente Execute a instalação do Ollama Enchanted a. Visite o site oficial para concluir o download diretamente Visite o site oficial principal...
Já publiquei muitos tutoriais sobre a instalação e a implementação do Ollama, mas as informações são bastante fragmentadas. Desta vez, reuni um tutorial completo em uma única etapa sobre como usar o Ollama em um computador local. Este tutorial é voltado para iniciantes, para evitar cair em armadilhas, e recomendamos a leitura das instruções oficiais do Ollama se você tiver a capacidade de fazê-lo...
A tecnologia de inteligência artificial continua a evoluir, e os aplicativos de bate-papo estão se tornando mais ricos em recursos a cada dia. Recentemente, a plataforma Dify lançou uma atualização notável para seu aplicativo de bate-papo recém-lançado que permite a visualização e a análise de dados diretamente nas conversas, proporcionando aos usuários uma experiência de comunicação mais intuitiva e eficiente. Apesar de o título do artigo mencionar a...
Na era digital, as APIs (Interfaces de Programação de Aplicativos) se tornaram a base da interação entre diferentes sistemas de software. No entanto, as interfaces de API tradicionais geralmente são ineficientes, fazendo com que os desenvolvedores sofram. Você já se deparou com os seguintes dilemas: Documentação: a documentação da interface é obscura e difícil de entender, os parâmetros dizem...
OpenManus e OpenManus Recentemente, houve um grande evento no círculo de IA, ou seja, o Manus AI Agent foi lançado. O Manus, com suas funções poderosas e uso flexível, atraiu rapidamente inúmeros olhares...
Recentemente, a equipe da Qwen lançou o QwQ-32B, um modelo de inferência que demonstrou excelente desempenho em muitos benchmarks comparáveis ao DeepSeek-R1. No entanto, muitos usuários encontraram problemas com geração infinita, muito conteúdo duplicado, tok...
O campo da modelagem de Inteligência Artificial (IA) está sempre cheio de surpresas, e cada avanço tecnológico pode afetar os nervos do setor. Recentemente, a equipe QwQ da Alibaba lançou seu modelo de inferência mais recente, o QwQ-32B, nas primeiras horas da manhã, o que mais uma vez atraiu a atenção de todos. De acordo com o anúncio oficial, o QwQ-3...
Recentemente, a Manus, uma das primeiras inteligências (agentes) de uso geral do mundo, lançou uma versão prévia, e sua demonstração oficial é surpreendente. Ao contrário de muitas IAs que ficam apenas no nível de "sugestão", a Manus não só demonstra recursos sólidos de planejamento de tarefas, mas também consegue...
No setor da Internet, que passa por uma rápida iteração, a importância do design da interface do usuário (IU) está se tornando cada vez mais proeminente. Um excelente design de IU não só aprimora a experiência do usuário, mas também é um dos principais elementos do sucesso do produto. No entanto, para muitos desenvolvedores de front-end, o design da interface do usuário não é sua especialidade, e o resultado do design geralmente é...
Prefácio Este documento tenta implementar um aplicativo com o caminho mais curto e o modo mais leve, o que requer apenas três etapas grandes + 9 etapas pequenas, e o seguinte é um processo de ensino prático. Descrição dos requisitos Descrição sistemática do ponto de vista de um gerente de produto, consulte o seguinte modelo: Visão geral dos requisitos: qual problema é resolvido, qual funcionalidade é obtida e introdução geral. ...
Introdução O problema fundamental do motivo pelo qual as ferramentas de programação de IA geram páginas de front-end de ótima aparência e as suas não é que essas ferramentas criaram um conjunto completo de palavras-chave para gerar páginas de front-end que restringem todos os tipos de especificações de front-end. Esses prompts são longos... Não apenas os prompts são longos, mas a geração de uma página de front-end exige muita saída...
A tradução de PDFs é uma função muito madura, mas a tradução direta de PPT com base no formato original (formas, tabelas, gráficos, notas e outros conteúdos) não é possível. Agora está aqui, policial...
O Vanna é uma estrutura de código aberto Text2SQL altamente conceituada que transforma a linguagem natural em instruções de consulta SQL. Este artigo detalhará como implantar o Vanna localmente e configurá-lo em conjunto com um banco de dados MySQL e o modelo Deepseek...
Instalando o ambiente python Estou aqui com uma versão previamente instalada: python 3.11.5, que não será descrita aqui, você pode encontrar tutoriais on-line se precisar deles. Instalar o Anaconda I aqui está uma versão previamente instalada: conda 23.7.4, aqui também não...
Na era da explosão de informações, a gestão do conhecimento se tornou a chave para aumentar a competitividade pessoal. Não importa em que setor você esteja, todos os dias você precisa enfrentar uma enorme quantidade de informações, documentos, materiais de aprendizagem, como recuperar e usar esse conhecimento de forma eficiente, tornou-se um problema urgente para todos. A Khoj, justamente para resolver esse...
Ferramentas de assistente de IA: como escolher? Com o rápido desenvolvimento da tecnologia de IA, a escolha de uma ferramenta de assistente de IA que possa gerenciar com eficácia vários modelos e obter uma colaboração eficiente tornou-se o foco de muitos usuários diante de uma ampla variedade de ferramentas de IA. Neste artigo, daremos uma olhada no posicionamento funcional, nas características...
Você também está interessado no recente modelo de IA de grande porte, quer conversar com a IA e deixar que a IA o ajude a fazer alguma coisa? Mas você não se sente um pouco sobrecarregado ou até mesmo assustado quando se depara com a janela preta da linha de comando? Sempre achei que lidar com o código frio é um pouco menos humano...
Quando se trata do IMA, alguns podem defini-lo como uma bancada de trabalho inteligente de IA lançada pela Tencent, projetada para ajudar os usuários a coletar, organizar e aplicar o conhecimento de forma eficiente. Ele tem recursos como pesquisa inteligente, interpretação de documentos, escrita inteligente, tomada de notas, gerenciamento e compartilhamento de bases de conhecimento e sincronização de vários terminais...
Na era da explosão de informações, como capturar com eficiência a inspiração fugaz e organizar o conhecimento fragmentado de forma ordenada e, por fim, transformá-lo em artigos valiosos e materiais criativos, tornou-se um desafio comum para muitos criadores de conteúdo e trabalhadores do conhecimento. Recentemente, uma caneta de IA de ponta a ponta chamada NoteGen...
O DeepSeek-R1 não tem nada de especial em comparação com outros modelos grandes; sua surpresa é ver o processo de raciocínio ou a excelente expressão chinesa. Se você já usou o ChatGPT e o achou entediante, a surpresa do DeepSeek-R1 pode ser uma ilusão. Se você já usou o ChatGPT todas as vezes...
Este documento fornece um guia passo a passo para a criação de um fluxo de trabalho automatizado no Bit Flows. Ele mostra como configurar acionadores usando o WordPress e o evento "On Post Status Update" e conectá-los ao Google ...
Não importa se você é novo no Microsoft 365 Copilot ou se já é um veterano experiente, se está usando o copilot chat ou o copilot no Office 365, o dicionário de sinônimos de prompts do copilot o ajudará a...
Esta é uma reimpressão do artigo, de acordo com o que foi escrito anteriormente: "Usando ferramentas de programação inteligente Trae para criar uma plataforma de escrita todo-poderosa", o próximo episódio será sobre como usar o Trae para capacitar a base de conhecimento local, pela falha do servidor contida por dois dias, aconteceu de ler este artigo sobre o empréstimo de flores para o Buda, como um artigo irmão do original...
Uma falha no servidor que resulta na perda de dados do site é um desastre! Se você tem apenas um site pequeno, não pode comprar vários servidores de backup e não pode configurar o backup do site, espero que seja útil para aqueles que estão enfrentando o mesmo problema. Aplicável a servidores Linux, para garantir a segurança dos dados do site, mesmo se o servidor estiver danificado, poderá ser restaurado...
O que aconteceria se ferramentas de programação inteligentes fossem usadas para automatizar a escrita? Muito provavelmente, seria um golpe descendente... Por que isso aconteceria? As ferramentas de programação inteligente, como representadas pelo Trae, têm as seguintes vantagens em relação às ferramentas de escrita normais: Seriam usados modelos melhores, como o Claude3.5-Sonn...
Recentemente, a chave da API do DeepSeek ficou muito presa, o que dificultou o uso do cline por muitos amigos desenvolvedores. Então, existem outras boas ferramentas de programação de IA? A resposta é, obviamente, o Cursor! No entanto, por vários motivos, muitos amigos talvez não consigam...
Com a tecnologia de IA mudando rapidamente, o Microsoft 365 Copilot, como uma poderosa ferramenta de produtividade, está mudando gradualmente a maneira como as pessoas trabalham. E com o Copilot Studio, ele oferece aos usuários a capacidade de personalizar ainda mais...
Recentemente, a equipe do Qwen orgulhosamente lançou uma série de exemplos do Qwen2.5-VL Use Case Notebook que demonstram o poder do modelo nativo e da API. O objetivo deste Notebook cuidadosamente elaborado é ajudar os desenvolvedores e usuários a obter uma compreensão mais profunda do...
Nos últimos anos, a tecnologia de Modelagem de Linguagem Grande (LLM) vem se desenvolvendo em um ritmo sem precedentes e penetrando gradualmente em vários setores. Ao mesmo tempo, há uma demanda crescente pela implantação local de LLMs. O Ollama, como uma ferramenta conveniente de implantação local de modelos grandes, é bem conhecido por sua facilidade de uso e seu suporte ao DeepSe...
Para o DeepSeek-R1 em uso diário no escritório, diretamente no site oficial é a melhor escolha, se você tiver outras preocupações ou necessidades especiais... Se você tiver outras preocupações ou necessidades especiais, deverá implantar o DeepSeek-R1 localmente (com um instalador de um clique), e o tutorial aqui é perfeito para você. Se...
O DeepSeek apresenta uma série de modelos de inferência avançados que desafiam a posição da OpenAI no setor e são totalmente gratuitos e de uso ilimitado, beneficiando todos os usuários. Neste documento, descrevemos como usar o conjunto de dados Medical Mind Chain do Hugging Face para testar o DeepSeek...
Recentemente, a venda de pacotes de instalação do DeepSeek no Taobao atraiu muita atenção. É surpreendente que algumas empresas estejam lucrando com esse modelo de IA gratuito e de código aberto. Isso também é um reflexo do fato de que a implantação local dos modelos do DeepSeek é...
Na semana passada, o Google DeepMind lançou o Gemini 2.0, que inclui o Gemini 2.0 Flash (totalmente disponível), o Gemini 2.0 Flash-Lite (novo e econômico) e o Gemini ...
Introdução: O O1 e o O3-mini da OpenAI são modelos avançados de "raciocínio" que diferem do GPT-4 básico (comumente chamado de GPT-4o) na forma como processam dicas e geram respostas. Esses modelos foram projetados para passar mais tempo "pensando" em problemas complexos...
No artigo anterior "Implementação local do DeepSeek-R1 e tutorial de acesso ao WeChat Bot", conseguimos a implementação local do DeepSeek-R1 e o acesso ao WeChat Bot, para que ele possa conversar conosco. Hoje, quero compartilhar com você uma maneira mais interessante de jogar: como dar ao nosso...
Hoje apresentamos a você um poderoso modelo multimodal de código aberto - o Janus-Pro, a versão mais recente da série Janus do DeepSeek. Ele pode não apenas ler imagens e responder a perguntas, mas também gerar imagens com base em descrições de texto. Em resumo, ele integra algo como o GPT-4...
Pergunta: Os gráficos de conhecimento são importantes, o modelo de linguagem do DeepSeek está em alta, ele pode ser usado para criar gráficos de conhecimento rapidamente? Gostaria de experimentar o DeepSeek de verdade para ver como ele se sai na extração de informações, na integração do conhecimento e na criação de gráficos do nada. Métodos: Realizei três experimentos para medir...
Imagine ter um aplicativo de IA privado que seja autônomo, confidencial e capaz de analisar texto local, fornecer conversas precisas a qualquer momento e ter recursos de pesquisa em rede. Neste artigo, vamos conduzi-lo passo a passo pelo processo de criação do DeepSeek + Ollama...
Estas são as instruções (mínimas) para implantar o DeepSeek R1 671B (a versão completa e não refinada) localmente usando o ollama. Recentemente, algumas grandes armas lançaram o Deepseek R1 671b por US$ 2.000, o que é ótimo para uso pessoal. Modelos ...
Você quer usar o Local Large Language Model (LLM) dentro da Obsidian, assim como o ChatGPT, e totalmente gratuito? Se a resposta for sim, então este guia é para você! Eu o orientarei na instalação e no uso do Dee...
Recentemente, encontrei uma atraente estrutura de base de conhecimento de IA de código aberto nacional: KAG (Knowledge Augmented Generation). O KAG foi lançado em conjunto pelo Ant Group, pela Universidade de Zhejiang e por muitas outras instituições, com foco em...
Nota do editor: O DeepSeek R1 está explodindo em popularidade, e muitas pessoas que não usavam muito a IA agora estão tentando conversar com grandes modelos. A postagem de hoje é sobre como conversar adequadamente com o DeepSeek a partir da perspectiva de um modelo de inferência.
Visão geral O DeepSeek é um modelo inovador de big language de código aberto que traz uma experiência revolucionária às interações de diálogo de IA com sua arquitetura algorítmica avançada e recursos de encadeamento reflexivo. Com a implementação privada, você tem controle total sobre a segurança dos dados e a segurança de uso. Você também pode ajustar com flexibilidade o esquema de implementação...
Muitos serviços de IA podem usar o endereço de e-mail de estudante .edu para obter descontos ou até mesmo gratuidade. O sufixo .edu está ficando cada vez mais difícil de registrar. Considerando a dificuldade de enviar informações durante o registro e o tempo que ele pode ser mantido, apresentamos uma solução relativamente viável no momento. Pre...
Bom ano novo! Saudações a todos vocês! Recentemente, meu círculo de amigos foi bombardeado com notícias relacionadas ao DeepSeek-R1, e acredito que todos vocês já ouviram falar sobre nosso modelo doméstico de código aberto, o DeepSeek! Tenho certeza de que todos vocês já ouviram falar do DeepSeek, nosso modelo doméstico de código aberto, e os tutoriais sobre como implantar o DeepSeek-R1 localmente têm sido...
Uma primeira olhada no MCP O MCP (Model Context Protocol) é um protocolo desenvolvido para padronizar a forma como os aplicativos fornecem contexto para modelos grandes. O MCP oferece uma forma padrão de fornecer dados e ferramentas para LLMs.