SBERT(Sentence-BERT)技术详解

216 字
1 分钟
SBERT(Sentence-BERT)技术详解

SBERT,即 Sentence-BERT,是在 BERT 基础上面向句子向量表示进行优化的模型结构。

原始 BERT 更适合句对分类、阅读理解等任务,而 SBERT 更适合把一个句子或文本片段编码成可直接比较的向量。

基本流程#

  1. 文本经过 tokenizer 切分为 token。
  2. 输入 Transformer 编码器得到隐藏状态。
  3. 使用 pooling 操作聚合 token 表示。
  4. 输出固定维度的句向量。
  5. 使用余弦相似度等方法比较语义距离。

应用场景#

SBERT 常用于语义搜索、文本聚类、相似问匹配、推荐系统和知识库召回。

在 RAG 系统中,SBERT 或同类 embedding 模型可以作为文本向量化组件,影响知识召回的相关性。

原文#

本文根据我的 CSDN 文章整理,原文链接:SBERT(Sentence-BERT)技术详解

支持与分享

如果这篇文章对你有帮助,欢迎分享给更多人或打赏支持!

打赏
SBERT(Sentence-BERT)技术详解
https://blog.csdn.net/weixin_74143209/article/details/151318176
作者
方静文
发布于
2025-09-08
许可协议
CC BY-NC-SA 4.0

评论区

Profile Image of the Author
方静文
AI 开发应用工程师 / Fang's Blue Hour
公告
欢迎来到我的博客!这是一则示例公告。
音乐
封面

音乐

暂未播放

0:000:00
暂无歌词
分类
标签
站点统计
文章
8
分类
5
标签
22
总字数
2,821
运行时长
0
最后活动
0 天前
站点信息
构建平台
Vercel
博客版本
Firefly v6.13.5
文章许可
CC BY-NC-SA 4.0

文章目录