
盘点与 Ollama 类似的 LLM 框架:本地部署大模型的多元选择
在人工智能和大型语言模型 (LLMs) 领域,Ollama 框架的出现无疑吸引了众多目光。这款开源框架专注于简化大型语言模型在本地的部署和运行,让更多开发者能够轻松体验 LLM 的魅力。然而,放眼市场,Ollama 并非孤军...
在人工智能和大型语言模型 (LLMs) 领域,Ollama 框架的出现无疑吸引了众多目光。这款开源框架专注于简化大型语言模型在本地的部署和运行,让更多开发者能够轻松体验 LLM 的魅力。然而,放眼市场,Ollama 并非孤军...
在人工智能领域,模型的选择至关重要。OpenAI 作为行业领导者,提供了两种主要类型的模型系列:推理模型 (Reasoning Models) 和 GPT 模型 (GPT Models)。前者以 o 系列模型为代表,例如 o1 和 o3-mini;后者则以 ...
中国的 Cursor ! 字节跳动推出 Trae ,内置 Claude 3.5 Sonnet 和 GPT-4o 等强大AI模型! 想一键批量给图片加水印? 想定制专属Excel 自动化脚本? 想十分钟搭建一个在线简历网站? 这些,Trae AI 都能帮你免费实现! 无需任何编程基础,立刻体验 Trae AI,让 AI 助你轻松开发实用工具,效率提升 10 倍! 点击免费试用,告别重复劳动,迎接效率爆发,让你的能力,即刻变现!
发现一篇好玩的论文《Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs》,主题是分析o1 类推理模型 思考路径频繁切换、思维缺乏聚焦,简称为“思考不足”(underthinking),同时给出缓解...
导读 在人工智能科技的浩瀚星空中,深度学习模型以其卓越的性能,驱动着诸多领域的创新发展。然而,模型规模的持续膨胀,如同双刃剑,在提升性能的同时,也带来了算力需求与存储压力的剧增。特别是在资源受限的应...
摘要 尽管大型语言模型(LLMs)表现出色,但它们容易产生幻觉并生成事实不准确的信息。这一挑战促使人们努力进行属性文本生成,促使LLMs生成包含支持证据的内容。在本文中,我们提出了一种名为Think&Cite的新...
导读 本文档旨在通过一系列提示词示例(部分),帮助读者快速理解并掌握提示词工程的核心概念与应用。这些示例均源自于一篇关于提示工程技术系统综述的学术论文(《The Prompt Report: A Systematic Survey of Pr...
《Titans: Learning to Memorize at Test Time》原文:https://arxiv.org/pdf/2501.00663v1 Titans 架构 非官方实现:https://github.com/lucidrains/titans-pytorch 一、 研究背景与动机:Transformer 的...
对于任何需要检索增强生成 (RAG) 系统的应用来说,将海量 PDF 文档变成机器能读懂的文本块(也就是 “PDF 分块”)都是个让人头疼的大难题。 市面上既有开源的方案,也有商业化的产品,但说实话,还没哪个方案能真...
DeepSeek R1 官网越狱是非常好的实验环境,能触发到基本所有类型的审查机制,可以学习很多防御技巧,所以这是一篇大模型审查机制的学习文章,会带你看到历年来大模型越狱的示例。 大模型审查机制通常采用...
原文:https://cdn.openai.com/o3-mini-system-card.pdf 1 引言 OpenAI o 模型系列使用大规模强化学习进行训练,以使用思维链进行推理。这些先进的推理能力为提高我们模型的安全性和稳健性提供了新的途径。特别是...
文章速读 文章全面而深入地探讨了 大语言模型 (LLM) 规模定律(缩放法则/Scaling Law)的前世今生,以及 AI 研究的未来方向。作者 Cameron R. Wolfe 以清晰的逻辑和丰富的例证,带领读者从基础概念出发,逐步深入...
摘要 大型语言模型(LLMs),如OpenAI的GPT-4、Google的PaLM和Meta的LLaMA,通过实现类人文本生成和自然语言理解,极大地改变了人工智能(AI)。然而,它们对静态训练数据的依赖限制了其响应动态、实时查询的能力...