Wang1997

MultipleNegativesRankingLoss

MultipleNegativesRankingLoss(多负样本排序损失)总结 1. 定义 MultipleNegativesRankingLoss(多负样本排序损失)是一种用于训练嵌入模型的损失函数,特别适用于只有正样本对(如相似文本对、查询与相关文档对)的场景。它通过将一个批次中的所有非正样本作为负样本,来增强模型对正负样本的区分能力。 2. 工作原理 输入为正样本对 (a_...

Transformer源码-位置编码(PositionalEncoder)

Transformer模型自2017年提出以来,已经成为自然语言处理(NLP)领域的主流模型。与传统的循环神经网络(RNN)不同,Transformer模型完全基于自注意力机制,因此在处理长距离依赖关系方面有显著优势。然而,由于Transformer模型缺乏内置的序列顺序信息,必须通过位置编码(Positional Encoding)显式引入位置信息,以便模型能够区分序列中的不同位置。 位置...

Langchain相关概念

概念 聊天模型:通过聊天 API 公开的 LLM,它们将消息序列作为输入并输出一条消息。 消息:聊天模型中的通信单元,用于表示模型输入和输出。 聊天记录:一个对话,表示为消息序列,在用户消息和模型响应之间交替。 工具:一个具有关联架构的函数,定义了函数的名称、描述及其接受的参数。 工具调用:一种聊天模型 API,它接受工具架构以及消息作为输入,并将这些工具的调用作为输出...