Fang's Blue Hour

企业级知识库构建与检索优化

Mon, 29 Sep 2025 00:00:00 GMT

企业级知识库的核心价值，是把分散在文档、系统、流程和经验中的信息沉淀为可检索、可复用、可持续更新的知识资产。

在 AI 应用场景中，知识库不仅服务于传统搜索，也会成为大模型问答、智能客服、内部助手和自动化办公流程的重要基础。

关键建设点#

文档治理：统一文档来源、格式、版本和权限边界。
切分策略：根据段落、标题、语义块进行合理 chunk 切分，避免信息过碎或过长。
向量化：使用合适的 embedding 模型，让语义相近的内容更容易被召回。
混合检索：结合关键词检索、向量检索和重排序，提高答案相关性。
权限控制：企业知识库必须保证用户只能检索自己有权限访问的内容。

与大模型结合#

知识库与大模型结合后，常见流程是“用户问题 -> 检索相关文档 -> 拼接上下文 -> 大模型生成答案”。这类方案可以降低模型幻觉，并让答案基于企业内部最新资料。

实际落地时，检索质量往往比模型本身更影响最终体验。检索不到、召回不准或上下文噪声过多，都会导致回答质量下降。

原文#

本文根据我的 CSDN 文章整理，原文链接：企业级知识库构建与检索优化。

向量数据库在大模型应用中的关键作用

Sun, 28 Sep 2025 00:00:00 GMT

向量数据库是大模型应用中的关键基础设施。它负责存储文本、图片、音频等数据经过模型编码后的向量表示，并通过相似度检索找到与用户问题最相关的内容。

相比传统数据库，向量数据库更擅长处理“语义相似”问题。例如用户问法不同，但表达的是同一个需求，向量检索仍然有机会召回相关资料。

核心能力#

向量存储：保存 embedding 模型生成的高维向量。
相似度检索：通过余弦相似度、点积或欧氏距离查找相近内容。
索引结构：利用 HNSW、IVF 等索引提升大规模检索性能。
元数据过滤：结合用户、业务、权限、时间等字段进行精确筛选。
混合检索：将关键词检索与语义检索结合，提升召回质量。

应用场景#

向量数据库常用于企业知识库问答、智能客服、金融风控、医疗问答、推荐系统和代码检索等场景。

在 RAG 系统中，它通常承担“记忆层”角色，检索结果会直接影响大模型生成答案的准确性。

原文#

本文根据我的 CSDN 文章整理，原文链接：向量数据库在大模型应用中的关键作用。

深入理解 RAG：让大模型更聪明的检索增强生成

Sat, 27 Sep 2025 00:00:00 GMT

RAG，全称 Retrieval-Augmented Generation，即检索增强生成。它通过把外部知识库检索结果提供给大模型，让模型在回答时参考更准确、更及时的资料。

单纯依赖大模型自身参数记忆，容易遇到两个问题：知识不够新，以及在不确定时产生幻觉。RAG 的目标就是把“检索”和“生成”结合起来。

基本流程#

用户提出问题。
系统将问题向量化。
在知识库或向量数据库中检索相关内容。
对检索结果进行过滤、重排和拼接。
将上下文和问题一起交给大模型生成答案。

为什么重要#

RAG 让 AI 应用可以接入企业文档、产品手册、数据库说明、项目资料等外部知识，同时保留大模型的语言理解和生成能力。

相比直接微调模型，RAG 更容易更新知识，也更适合企业内部知识快速变化的场景。

原文#

本文根据我的 CSDN 文章整理，原文链接：深入理解RAG：让大模型更聪明的检索增强生成。

如何查看 WandB 的 API Key

Wed, 17 Sep 2025 00:00:00 GMT

Weights & Biases，简称 WandB，是机器学习实验管理中常用的工具。它可以记录训练指标、模型参数、运行日志和实验对比结果。

在本地或服务器使用 WandB 时，通常需要先配置 API Key，用于账号认证和实验数据同步。

获取方式#

打开 WandB 官网并登录账号。
进入个人设置或授权页面。
找到 API Key 并复制。
在终端执行 wandb login。
粘贴 API Key 完成认证。

使用建议#

API Key 不应该写进公开代码仓库。更推荐使用环境变量、服务器密钥管理或本地配置文件保存。

如果是在多人项目中使用，需要区分个人账号、团队项目和实验记录归属，避免训练日志混乱。

原文#

本文根据我的 CSDN 文章整理，原文链接：如何查看Wandb的apikey？。

学习 REGEN：实时游戏画面光照增强的生成对抗网络框架

Sat, 13 Sep 2025 00:00:00 GMT

REGEN 是一个面向实时游戏画面光照增强的生成对抗网络框架。它希望在不显著增加性能负担的情况下，提高游戏画面的真实感和视觉表现。

这类方案对游戏开发、虚拟现实、影视预览和实时渲染增强都有参考价值。

技术思路#

使用 GAN 学习从普通渲染画面到增强光照画面的映射。
通过无监督图像转换降低成对数据依赖。
采用轻量级网络结构控制实时推理开销。
在视觉质量和帧率之间做工程平衡。

工程启发#

实时视觉增强不能只看生成效果，还要考虑推理速度、显存占用、画面稳定性和部署成本。

在实际项目中，这类框架更适合与传统渲染管线结合，而不是完全替代渲染流程。

原文#

本文根据我的 CSDN 文章整理，原文链接：学习REGEN：实时游戏画面光照增强的生成对抗网络框架。

motionlcm 安装部署与实战指南：从环境搭建到项目集成

Tue, 09 Sep 2025 00:00:00 GMT

motionlcm 是基于 LCM 通信框架的运动控制相关模块，常见于机器人、自动驾驶和实时系统通信场景。

部署这类项目时，环境依赖、编译链路和动态库路径往往比业务代码本身更容易出问题。

部署重点#

安装系统依赖和 LCM 核心框架。
获取 motionlcm 源码。
使用 CMake 完成编译和安装。
配置环境变量和动态库路径。
运行示例或测试程序验证安装结果。

常见问题#

如果编译时找不到头文件或库文件，通常需要检查 CMAKE_PREFIX_PATH、LD_LIBRARY_PATH 或安装路径。

如果运行时出现动态库加载失败，需要确认库路径是否写入系统配置，或者在当前 shell 中临时导出环境变量。

原文#

本文根据我的 CSDN 文章整理，原文链接：motionlcm 安装部署与实战指南：从环境搭建到项目集成。

SBERT（Sentence-BERT）技术详解

Mon, 08 Sep 2025 00:00:00 GMT

SBERT，即 Sentence-BERT，是在 BERT 基础上面向句子向量表示进行优化的模型结构。

原始 BERT 更适合句对分类、阅读理解等任务，而 SBERT 更适合把一个句子或文本片段编码成可直接比较的向量。

基本流程#

文本经过 tokenizer 切分为 token。
输入 Transformer 编码器得到隐藏状态。
使用 pooling 操作聚合 token 表示。
输出固定维度的句向量。
使用余弦相似度等方法比较语义距离。

应用场景#

SBERT 常用于语义搜索、文本聚类、相似问匹配、推荐系统和知识库召回。

在 RAG 系统中，SBERT 或同类 embedding 模型可以作为文本向量化组件，影响知识召回的相关性。

原文#

本文根据我的 CSDN 文章整理，原文链接：SBERT（Sentence-BERT）技术详解。

知识库调用 Prompt 应该怎么写

Wed, 03 Sep 2025 00:00:00 GMT

知识库问答系统中，Prompt 不是简单地把“请回答问题”写给大模型，而是要明确模型如何使用检索到的资料。

一个好的知识库调用 Prompt，能减少答非所问、降低幻觉，并让输出更符合业务场景。

四个核心要素#

角色定位：告诉模型当前应该扮演什么角色。
任务目标：明确要回答、总结、抽取还是对比。
输入上下文：把检索到的知识片段作为受控信息源。
输出要求：限制格式、语气、长度和引用方式。

常见问题#

如果 Prompt 没有限制信息范围，模型可能会使用自身知识自由发挥。

如果没有定义输出格式，答案可能难以被前端展示或后续流程解析。

如果没有允许“不知道”，模型在信息不足时更容易生成不可靠答案。

原文#

本文根据我的 CSDN 文章整理，原文链接：知识库调用Prompt应该怎么写。