介绍
随着人工智能(AI)领域的不断发展,提示工程已成为一项颇具前景的职业。如今,许多人都在努力掌握与大语言模型(LLM)有效交互的技能。你是否也有同样的愿望?是否在思考从哪里开始以及如何进行?我们提供了这个学习路径,帮助你成为一名提示工程专家。这个全面的指南旨在帮助你从基础到高级技巧,逐步掌握提示工程。无论你是初学者还是有经验的,这个结构化的学习路径将为你提供掌握 LLM 所需的知识和实践技能。
概述
- 理解什么是提示工程。
- 学习如何在 6 周内掌握提示工程。
- 了解每周需要学习的内容以及如何进行练习。
目录
- 第 1 周:提示工程简介
- 第 2 周:为提示设置 LLM
- 第 3 周:编写有效的提示
- 第 4 周:理解提示模式
- 第 5 周:高级提示技巧
- 第 6 周:高级提示策略
- 常见问题
第 1 周:提示工程简介
在提示工程之旅的第一周,重点学习以下主题
什么是提示工程?
- 了解NLP 中提示工程的概念及其重要性。
- 理解如何编写有效的提示及其对语言模型输出的影响。
- 学习提示工程的历史背景和发展演变,了解其如何逐步发展。
LLM 如何工作?
- 探索 LLM 的基本原理,并用简单、非技术性的语言理解其工作原理。
- 学习 LLM 的训练和工作原理,结合简单的类比和示例进行理解。
- 了解不同的 LLM,如 GPT-4o、Llama 和 Mistral,以及它们的独特功能和应用场景。
提示工程的角色
- 理解提示工程师、数据科学家、等职位的工作描述及其所需的特定技能。
- 通过实际项目和任务示例,了解提示工程的实际应用。
提示工程的实际应用
- 研究展示提示工程在各行业成功应用的案例研究。
例如:LLMs 在工作场所:关于提示工程用于职位分类的案例研究。 - 讨论提示工程对 AI 模型性能的影响,并了解其如何提高这些模型的有效性。
实践
- 探索 LLM 排行榜:了解 MMLU-Pro、HuamnEval、Chatbot Arena 等各种基准测试。探索不同的 LLM 排行榜,了解在不同基准测试中目前领先的模型。
例如:open-llm-leaderboard 的 Hugging Face Space、LLM 排行榜 | Artificial Analysis - 识别关键技能并分析提示工程案例研究:首先通过查看职位描述和专业档案,识别提示工程师所需的常见技能和资格。研究并总结提示工程在各行业中的实际应用,重点关注提示的设计方式及其实现的结果。
例如:案例研究——提示工程、生成式 AI 驱动的 AI 应用在 13 个实际用例中的影响。
第 2 周:为提示设置大语言模型
本周,我们将学习如何通过不同方式设置大语言模型(LLM)来进行提示。用户可以使用任何提到的方法。
直接在 LLM 网站上访问
- 学习如何通过 LLM 的网页平台直接使用这些模型。
- 了解如何创建账户以及如何在流行的大语言模型平台上导航界面。
在本地运行开源 LLM
- 探索如何在本地机器上运行 开源 LLM (例如 Llama3、Mistral、Phi3 等) 的设置过程,使用 Hugging Face 或 Ollama 以及 msty.app 或 Open WebUI。
- 了解不同开源 LLM 的硬件和软件要求。
通过 API 进行编程访问
- 学习如何注册获取 API 访问权限。例如,通过平台为 LLM 提供 API 访问权限,像 GPT-4o、Claude、Gemini 等,以及使用 Hugging Face Inference API 访问 Llama、Phi、Gemma 等模型。
- 学习如何配置 API 密钥,并将其集成到各种应用程序中以进行提示生成。
在 AI Content Labs 设置 API 密钥
实践
- 通过网站访问 LLM:创建账户并在 LLM 的网站上直接尝试生成提示。
- 在本地设置开源 LLM:按照指南下载、安装和配置本地的开源 LLM,并使用各种提示进行测试。
- 注册 API 密钥:完成从 OpenAI 等提供商处获取 API 密钥的过程,并编写一个简单的脚本,使用该密钥生成提示。
第 3 周:编写有效的提示
本周我们将学习如何创建各种提示类型,以有效引导语言模型,重点关注清晰的指令、示例、迭代、分隔符、结构化格式以及温度参数。
编写清晰且具体的指令
- 学习如何编写清晰且具体的指令,以引导模型生成预期输出。
- 了解清晰度和具体性在避免歧义和提高响应准确性方面的重要性。
使用具体示例
- 学习在提示中使用具体示例的技巧,以提供上下文并提高模型输出的相关性。
- 了解如何通过示例来展示预期的格式或响应类型。
变换提示并进行迭代
- 探讨变换提示并进行迭代,以改进输出质量的优势。
- 了解提示中的小变化如何导致结果的显著改善。
使用分隔符
- 学习如何在提示中有效使用 分隔符 ,以分隔不同的部分或输入类型。
- 学习如何通过示例使用分隔符来增强提示的结构和可读性。
指定结构化输出格式
- 了解在提示中指定结构化输出格式的重要性,以确保响应的一致性和组织性。
- 学习清晰定义预期输出格式的技巧。
使用温度参数
- 学习语言模型中的温度参数概念,以及它如何影响输出的创造性和随机性。
- 学习如何调整温度参数,以在多样性和连贯性之间找到平衡,控制模型的响应。
实践
- 编写清晰且具体的指令:创建具有清晰且具体指令的提示,并观察清晰度如何影响模型输出。
- 使用具体示例:在提示中加入具体示例,比较有无示例时输出的相关性差异。
- 变换提示并进行迭代:尝试变换提示并迭代,观察小变化如何改善结果。
- 使用分隔符:在提示中使用分隔符分隔不同的部分,并分析对响应结构和可读性的影响。
第 4 周:理解提示模式
在本周,我们将学习提示模式,这是一种提供可重用且结构化方法的高级技术,用于解决大语言模型(LLM)输出中的常见问题。
提示模式概述
- 了解提示模式的概念及其在为 LLM(如 )编写有效提示时的作用。
- 学习提示模式与软件工程中的设计模式的相似之处,提示模式为特定且重复出现的问题提供了可重用的解决方案。
- 探讨提示模式的目标是通过提供编写提示的框架,使提示工程更加轻松,并能重用和适应不同场景。
输入语义
- 学习输入语义类别,了解 LLM 如何理解和处理提供的输入。
- 学习「元语言创建」提示模式,该模式涉及定义与 LLM 互动的自定义语言或符号。
输出定制化
- 了解输出定制化类别,重点是根据特定需求或格式调整 LLM 的输出。
- 探索「模板」提示模式,确保 LLM 的输出遵循准确的模板或格式。
- 学习「角色」提示模式,其中 LLM 在生成输出时扮演特定角色或视角。
错误识别
- 学习错误识别类别,重点是检测并解决 LLM 输出中的潜在错误。
- 了解「事实检查清单」提示模式,生成输出中的事实列表以进行验证。
- 探索「反思」提示模式,提示 LLM 反思其输出并识别潜在错误或改进的地方。
提示优化
- 学习提示优化类别,重点是优化发送给 LLM 的提示,确保提示质量。
- 学习「问题优化」提示模式,引导 LLM 优化用户问题以获取更准确的答案。
- 探索「替代方法」提示模式,确保 LLM 提供多种完成任务或解决问题的方法。
互动与上下文控制
- 了解互动类别,增强用户与 LLM 之间的互动动态,使对话更具参与性和有效性。
- 学习「反向互动」提示模式,在此模式中,LLM 通过提问来主导对话。
- 学习上下文控制类别,重点是维护和管理对话中的上下文信息。
- 探索「上下文管理器」提示模式,确保持续对话的连贯性和相关性。
练习
- 探索不同的提示模式:研究各种提示模式,了解它们如何解决 LLM 输出中的特定、重复性问题。
- 分析提示模式的示例:研究提示模式在现实世界中的使用示例,了解它们如何实现特定目标和结果。
- 识别并分类提示模式:练习在给定示例中识别不同的提示模式,并将它们分类到相应的类别中。
- 组合多种提示模式:探索如何组合多种提示模式以应对更复杂的提示问题,并改善整体输出。
第五周:高级提示技术
本周我们将深入探讨高级提示技术,以进一步增强提示的有效性和复杂性。以下是几个示例。
N-shot 提示
- 学习 N-shot 提示,该方法涉及提供零个、一个或多个示例(N-shot)以指导模型的响应。
- 了解通过提供上下文和示例,N-shot 提示如何提高模型输出的准确性和相关性。
思维链
- 探索 思维链(COT) 技术,通过引导模型逐步推理问题。
- 学习该方法如何帮助生成更加连贯和逻辑一致的输出。
自我一致性
- 了解自我一致性方法,涉及提示模型生成多个解决方案,然后选择最一致的一个。
- 学习此技术如何提高生成响应的可靠性和准确性。
思维树
- 学习 思维树 技术,鼓励模型为给定问题考虑多种路径和潜在结果。
- 学习如何构建提示以促进这种分支思维过程,并改善决策能力。
思维图
- 探索思维图方法,模型在此方法中构建相互关联的思想和概念网络。
- 了解如何利用此技术生成更全面和多方面的响应。
练习
- 实施 N-shot 提示:为模型提供几个示例(N-shot),观察其如何提高响应的相关性和准确性。
- 尝试思维链:创建引导模型逐步推理问题的提示,并分析输出的连贯性。
- 应用自我一致性:提示模型生成问题的多个解决方案,并选择最一致的一个以提高可靠性。
- 使用思维树:开发提示,鼓励模型考虑多种路径和结果,评估其决策过程。
第 6 周:高级提示设计策略
在本周,我们将探索高级提示设计策略,以进一步增强与语言模型交互的能力和精准度。
React
- 学习 React 技术,通过让模型进行「行动」和「推理」来学习新任务并做出决策或推理。
- 了解如何使用这种方法生成更具互动性和吸引力的输出。
重述与响应提示
- 理解「重述与响应」技术,涉及提示模型重述给定输入,然后做出响应。
- 学习如何通过这种方法提高清晰度,并为同一输入提供多种观点。
自我优化
- 探索「自我优化」方法,提示模型审查并改进其自身的响应,以提高准确性和连贯性。
- 研究这种技术如何通过鼓励自我评估来提高输出质量。
迭代提示
- 学习「迭代提示」方法,通过反复提示和反馈,不断优化模型的输出。
- 了解如何通过这种技术逐步提高响应的质量和相关性。
链式技术
- 验证链:使用验证问题及其答案来减少幻觉现象。
- 知识链:创建建立在动态知识基础上的提示,以生成全面的响应。
- 情感链:在提示末尾添加情感刺激,以尝试增强模型的表现。
- 密度链:生成多个摘要,使其逐步更加详细,但长度不增加。
- 符号链:通过在链式中间推理步骤中使用凝练的符号化空间表示来表示复杂环境。
实践
- 实施 React 技术:创建提示,要求模型对特定刺激做出反应或回应,并评估输出的互动性。
- 使用重述与响应提示:尝试提示模型重述输入然后回应,并分析输出的清晰度和多样性。
- 应用自我优化:开发提示,鼓励模型审查和改进其响应,以提高准确性和连贯性。
- 探索链式技术:使用各种链式技术(如自然语言推理链、知识链)创建一系列提示,并评估响应的连贯性和深度。
结论
通过遵循这个学习路径,任何人都可以成为提示工程专家。这将使你深入了解如何设计有效的提示,并使用高级技术优化大语言模型的性能。这些知识将使你能够应对复杂任务,改进模型输出,并为日益增长的 AI 和机器学习领域做出贡献。持续的练习和对新方法的探索将进一步确保你处于这一动态且令人兴奋的领域的前沿。
提示工程是构建和训练生成式 AI 模型的核心部分。通过我们的全面且完整的生成式 AI 顶峰计划,掌握提示工程及生成式 AI 的其他各方面。该课程涵盖从 AI 基础到高级技术,帮助你为各种需求微调生成式 AI 模型。立即查看课程!
常见问题
Q1. 什么是提示工程?为什么它很重要?
A. 提示工程是指设计输入以引导大语言模型生成期望的输出。这对于提高 AI 生成的响应的准确性和相关性至关重要。
Q2. 使用大语言模型的常见工具和平台有哪些?
A. 常用的工具和平台包括 OpenAI 的 GPT 模型、Hugging Face、Ollama,以及 Llama 和 Mistral 等开源的大语言模型。
Q3. 初学者如何开始学习提示工程?
A. 初学者可以先了解自然语言处理(NLP)和大语言模型的基础知识,尝试使用简单的提示,并逐步探索本学习路径中提到的更高级技术。
Q4. 从事提示工程需要哪些关键技能?
A. 关键技能包括 NLP 熟练度、对大语言模型的理解、设计有效提示的能力,以及熟悉编程和 API 集成。
Q5. 提示工程如何影响现实世界的应用?
A. 有效的提示工程可以显著提升 AI 模型在多个行业中的表现,从客户服务、内容生成到数据分析和决策支持。