文章

Langchain相关概念

概念

  • 聊天模型:通过聊天 API 公开的 LLM,它们将消息序列作为输入并输出一条消息。
  • 消息:聊天模型中的通信单元,用于表示模型输入和输出。
  • 聊天记录:一个对话,表示为消息序列,在用户消息和模型响应之间交替。
  • 工具:一个具有关联架构的函数,定义了函数的名称、描述及其接受的参数。
  • 工具调用:一种聊天模型 API,它接受工具架构以及消息作为输入,并将这些工具的调用作为输出消息的一部分返回。
  • 结构化输出: 一种使聊天模型以结构化格式(例如匹配给定模式的 JSON)响应的技术。
  • 记忆: 关于对话的信息,会被持久化存储,以便在未来的对话中使用。
  • 多模态: 处理来自不同形式的数据(例如文本、音频、图像和视频)的能力。
  • 可运行接口: 许多 LangChain 组件和 LangChain 表达式语言构建于其上的基础抽象。
  • 流式传输: LangChain 流式 API,用于在结果生成时将其呈现出来。
  • LangChain 表达式语言 (LCEL): 一种用于编排 LangChain 组件的语法。对于较简单的应用程序最有用。
  • 文档加载器: 将源加载为文档列表。
  • 检索: 信息检索系统可以从数据源检索结构化或非结构化数据以响应查询。
  • 文本分割器: 将长文本分割成更小的块,这些块可以单独索引以实现精细检索。
  • 嵌入模型: 在向量空间中表示文本或图像等数据的模型。
  • 向量存储: 向量和相关元数据的存储和高效搜索。
  • 检索器: 一种组件,它从知识库中返回与查询相关的文档。
  • 检索增强生成 (RAG): 一种通过将语言模型与外部知识库相结合来增强语言模型的技术。
  • 代理: 使用 语言模型 来选择要执行的操作序列。代理可以通过 工具 与外部资源进行交互。
  • 提示模板: 用于分解模型“提示”(通常是消息序列)的静态部分的组件。对于序列化、版本控制和重用这些静态部分非常有用。
  • 输出解析器: 负责获取模型的输出并将其转换为更适合下游任务的格式。在 工具调用 和 结构化输出 普遍可用之前,输出解析器主要有用。
  • 少样本提示: 一种通过在提示中提供几个要执行的任务示例来提高模型性能的技术。
  • 示例选择器: 用于根据给定输入从数据集中选择最相关的示例。示例选择器用于少样本提示中,为提示选择示例。
  • 异步编程: 在异步上下文中使用 LangChain 时应了解的基础知识。
  • 回调: 回调使内置组件能够执行自定义辅助代码。回调用于在 LangChain 中流式传输来自 LLM 的输出、跟踪应用程序的中间步骤等等。
  • 跟踪: 记录应用程序从输入到输出所采取步骤的过程。跟踪对于调试和诊断复杂应用程序中的问题至关重要。
  • 评估: 评估人工智能应用程序的性能和有效性的过程。这涉及根据一组预定义的标准或基准测试模型的响应,以确保其满足所需的质量标准并实现预期的目的。此过程对于构建可靠的应用程序至关重要。
  • 测试: 验证集成或应用程序的组件是否按预期工作的过程。测试对于确保应用程序行为正确以及对代码库的更改不会引入新的错误至关重要。
本文由作者按照 CC BY 4.0 进行授权