<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Fang&apos;s Blue Hour</title><description>AI Development Portfolio</description><link>https://www.yolof.top/</link><templateTheme>Firefly</templateTheme><templateThemeVersion>6.13.5</templateThemeVersion><templateThemeUrl>https://github.com/CuteLeaf/Firefly</templateThemeUrl><lastBuildDate>2026年7月2日 20:25:05</lastBuildDate><item><title>企业级知识库构建与检索优化</title><link>https://www.yolof.top/posts/enterprise-knowledge-base-search/</link><guid isPermaLink="true">https://www.yolof.top/posts/enterprise-knowledge-base-search/</guid><description>构建企业级知识库时，重点不只是存储文档，还要围绕检索质量、权限控制、知识更新和大模型调用链路进行整体设计。</description><pubDate>Mon, 29 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;企业级知识库的核心价值，是把分散在文档、系统、流程和经验中的信息沉淀为可检索、可复用、可持续更新的知识资产。&lt;/p&gt;
&lt;p&gt;在 AI 应用场景中，知识库不仅服务于传统搜索，也会成为大模型问答、智能客服、内部助手和自动化办公流程的重要基础。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;关键建设点&lt;a href=&quot;#关键建设点&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;文档治理：统一文档来源、格式、版本和权限边界。&lt;/li&gt;
&lt;li&gt;切分策略：根据段落、标题、语义块进行合理 chunk 切分，避免信息过碎或过长。&lt;/li&gt;
&lt;li&gt;向量化：使用合适的 embedding 模型，让语义相近的内容更容易被召回。&lt;/li&gt;
&lt;li&gt;混合检索：结合关键词检索、向量检索和重排序，提高答案相关性。&lt;/li&gt;
&lt;li&gt;权限控制：企业知识库必须保证用户只能检索自己有权限访问的内容。&lt;/li&gt;
&lt;/ul&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;与大模型结合&lt;a href=&quot;#与大模型结合&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;知识库与大模型结合后，常见流程是“用户问题 -&amp;gt; 检索相关文档 -&amp;gt; 拼接上下文 -&amp;gt; 大模型生成答案”。这类方案可以降低模型幻觉，并让答案基于企业内部最新资料。&lt;/p&gt;&lt;p&gt;实际落地时，检索质量往往比模型本身更影响最终体验。检索不到、召回不准或上下文噪声过多，都会导致回答质量下降。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/152176899&quot; target=&quot;_blank&quot;&gt;企业级知识库构建与检索优化&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>向量数据库在大模型应用中的关键作用</title><link>https://www.yolof.top/posts/vector-database-llm/</link><guid isPermaLink="true">https://www.yolof.top/posts/vector-database-llm/</guid><description>向量数据库是大模型应用的记忆层，负责高效存储、索引和检索语义向量，是 RAG、智能客服和知识问答的重要基础设施。</description><pubDate>Sun, 28 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;向量数据库是大模型应用中的关键基础设施。它负责存储文本、图片、音频等数据经过模型编码后的向量表示，并通过相似度检索找到与用户问题最相关的内容。&lt;/p&gt;
&lt;p&gt;相比传统数据库，向量数据库更擅长处理“语义相似”问题。例如用户问法不同，但表达的是同一个需求，向量检索仍然有机会召回相关资料。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;核心能力&lt;a href=&quot;#核心能力&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;向量存储：保存 embedding 模型生成的高维向量。&lt;/li&gt;
&lt;li&gt;相似度检索：通过余弦相似度、点积或欧氏距离查找相近内容。&lt;/li&gt;
&lt;li&gt;索引结构：利用 HNSW、IVF 等索引提升大规模检索性能。&lt;/li&gt;
&lt;li&gt;元数据过滤：结合用户、业务、权限、时间等字段进行精确筛选。&lt;/li&gt;
&lt;li&gt;混合检索：将关键词检索与语义检索结合，提升召回质量。&lt;/li&gt;
&lt;/ul&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;应用场景&lt;a href=&quot;#应用场景&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;向量数据库常用于企业知识库问答、智能客服、金融风控、医疗问答、推荐系统和代码检索等场景。&lt;/p&gt;&lt;p&gt;在 RAG 系统中，它通常承担“记忆层”角色，检索结果会直接影响大模型生成答案的准确性。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/152176777&quot; target=&quot;_blank&quot;&gt;向量数据库在大模型应用中的关键作用&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>深入理解 RAG：让大模型更聪明的检索增强生成</title><link>https://www.yolof.top/posts/rag-retrieval-augmented-generation/</link><guid isPermaLink="true">https://www.yolof.top/posts/rag-retrieval-augmented-generation/</guid><description>RAG 通过外部知识检索增强大模型生成能力，能够缓解知识过期和模型幻觉问题，是企业级 AI 应用的重要架构。</description><pubDate>Sat, 27 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;RAG，全称 Retrieval-Augmented Generation，即检索增强生成。它通过把外部知识库检索结果提供给大模型，让模型在回答时参考更准确、更及时的资料。&lt;/p&gt;
&lt;p&gt;单纯依赖大模型自身参数记忆，容易遇到两个问题：知识不够新，以及在不确定时产生幻觉。RAG 的目标就是把“检索”和“生成”结合起来。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;基本流程&lt;a href=&quot;#基本流程&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;用户提出问题。&lt;/li&gt;
&lt;li&gt;系统将问题向量化。&lt;/li&gt;
&lt;li&gt;在知识库或向量数据库中检索相关内容。&lt;/li&gt;
&lt;li&gt;对检索结果进行过滤、重排和拼接。&lt;/li&gt;
&lt;li&gt;将上下文和问题一起交给大模型生成答案。&lt;/li&gt;
&lt;/ol&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;为什么重要&lt;a href=&quot;#为什么重要&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;RAG 让 AI 应用可以接入企业文档、产品手册、数据库说明、项目资料等外部知识，同时保留大模型的语言理解和生成能力。&lt;/p&gt;&lt;p&gt;相比直接微调模型，RAG 更容易更新知识，也更适合企业内部知识快速变化的场景。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/152176574&quot; target=&quot;_blank&quot;&gt;深入理解RAG：让大模型更聪明的检索增强生成&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>如何查看 WandB 的 API Key</title><link>https://www.yolof.top/posts/wandb-api-key/</link><guid isPermaLink="true">https://www.yolof.top/posts/wandb-api-key/</guid><description>WandB API Key 用于训练实验记录、模型监控和远程同步，正确配置后可以让机器学习实验管理更清晰。</description><pubDate>Wed, 17 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;Weights &amp;amp; Biases，简称 WandB，是机器学习实验管理中常用的工具。它可以记录训练指标、模型参数、运行日志和实验对比结果。&lt;/p&gt;
&lt;p&gt;在本地或服务器使用 WandB 时，通常需要先配置 API Key，用于账号认证和实验数据同步。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;获取方式&lt;a href=&quot;#获取方式&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;打开 WandB 官网并登录账号。&lt;/li&gt;
&lt;li&gt;进入个人设置或授权页面。&lt;/li&gt;
&lt;li&gt;找到 API Key 并复制。&lt;/li&gt;
&lt;li&gt;在终端执行 &lt;code&gt;wandb login&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;粘贴 API Key 完成认证。&lt;/li&gt;
&lt;/ol&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;使用建议&lt;a href=&quot;#使用建议&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;API Key 不应该写进公开代码仓库。更推荐使用环境变量、服务器密钥管理或本地配置文件保存。&lt;/p&gt;&lt;p&gt;如果是在多人项目中使用，需要区分个人账号、团队项目和实验记录归属，避免训练日志混乱。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/151795566&quot; target=&quot;_blank&quot;&gt;如何查看Wandb的apikey？&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>学习 REGEN：实时游戏画面光照增强的生成对抗网络框架</title><link>https://www.yolof.top/posts/regen-real-time-lighting-enhancement/</link><guid isPermaLink="true">https://www.yolof.top/posts/regen-real-time-lighting-enhancement/</guid><description>REGEN 使用生成对抗网络增强实时游戏画面光照效果，在视觉质量和推理性能之间取得平衡。</description><pubDate>Sat, 13 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;REGEN 是一个面向实时游戏画面光照增强的生成对抗网络框架。它希望在不显著增加性能负担的情况下，提高游戏画面的真实感和视觉表现。&lt;/p&gt;
&lt;p&gt;这类方案对游戏开发、虚拟现实、影视预览和实时渲染增强都有参考价值。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;技术思路&lt;a href=&quot;#技术思路&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;使用 GAN 学习从普通渲染画面到增强光照画面的映射。&lt;/li&gt;
&lt;li&gt;通过无监督图像转换降低成对数据依赖。&lt;/li&gt;
&lt;li&gt;采用轻量级网络结构控制实时推理开销。&lt;/li&gt;
&lt;li&gt;在视觉质量和帧率之间做工程平衡。&lt;/li&gt;
&lt;/ul&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;工程启发&lt;a href=&quot;#工程启发&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;实时视觉增强不能只看生成效果，还要考虑推理速度、显存占用、画面稳定性和部署成本。&lt;/p&gt;&lt;p&gt;在实际项目中，这类框架更适合与传统渲染管线结合，而不是完全替代渲染流程。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/151650750&quot; target=&quot;_blank&quot;&gt;学习REGEN：实时游戏画面光照增强的生成对抗网络框架&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>motionlcm 安装部署与实战指南：从环境搭建到项目集成</title><link>https://www.yolof.top/posts/motionlcm-deployment-guide/</link><guid isPermaLink="true">https://www.yolof.top/posts/motionlcm-deployment-guide/</guid><description>motionlcm 基于 LCM 通信框架，常用于机器人和自动驾驶等系统，部署时要重点关注依赖、编译和环境变量配置。</description><pubDate>Tue, 09 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;motionlcm 是基于 LCM 通信框架的运动控制相关模块，常见于机器人、自动驾驶和实时系统通信场景。&lt;/p&gt;
&lt;p&gt;部署这类项目时，环境依赖、编译链路和动态库路径往往比业务代码本身更容易出问题。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;部署重点&lt;a href=&quot;#部署重点&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;安装系统依赖和 LCM 核心框架。&lt;/li&gt;
&lt;li&gt;获取 motionlcm 源码。&lt;/li&gt;
&lt;li&gt;使用 CMake 完成编译和安装。&lt;/li&gt;
&lt;li&gt;配置环境变量和动态库路径。&lt;/li&gt;
&lt;li&gt;运行示例或测试程序验证安装结果。&lt;/li&gt;
&lt;/ul&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;常见问题&lt;a href=&quot;#常见问题&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;如果编译时找不到头文件或库文件，通常需要检查 &lt;code&gt;CMAKE_PREFIX_PATH&lt;/code&gt;、&lt;code&gt;LD_LIBRARY_PATH&lt;/code&gt; 或安装路径。&lt;/p&gt;&lt;p&gt;如果运行时出现动态库加载失败，需要确认库路径是否写入系统配置，或者在当前 shell 中临时导出环境变量。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/151357246&quot; target=&quot;_blank&quot;&gt;motionlcm 安装部署与实战指南：从环境搭建到项目集成&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>SBERT（Sentence-BERT）技术详解</title><link>https://www.yolof.top/posts/sbert-sentence-bert/</link><guid isPermaLink="true">https://www.yolof.top/posts/sbert-sentence-bert/</guid><description>SBERT 将句子编码为固定长度向量，适合语义相似度、文本检索、聚类和 RAG 召回等任务。</description><pubDate>Mon, 08 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;SBERT，即 Sentence-BERT，是在 BERT 基础上面向句子向量表示进行优化的模型结构。&lt;/p&gt;
&lt;p&gt;原始 BERT 更适合句对分类、阅读理解等任务，而 SBERT 更适合把一个句子或文本片段编码成可直接比较的向量。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;基本流程&lt;a href=&quot;#基本流程&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;文本经过 tokenizer 切分为 token。&lt;/li&gt;
&lt;li&gt;输入 Transformer 编码器得到隐藏状态。&lt;/li&gt;
&lt;li&gt;使用 pooling 操作聚合 token 表示。&lt;/li&gt;
&lt;li&gt;输出固定维度的句向量。&lt;/li&gt;
&lt;li&gt;使用余弦相似度等方法比较语义距离。&lt;/li&gt;
&lt;/ol&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;应用场景&lt;a href=&quot;#应用场景&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;SBERT 常用于语义搜索、文本聚类、相似问匹配、推荐系统和知识库召回。&lt;/p&gt;&lt;p&gt;在 RAG 系统中，SBERT 或同类 embedding 模型可以作为文本向量化组件，影响知识召回的相关性。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/151318176&quot; target=&quot;_blank&quot;&gt;SBERT（Sentence-BERT）技术详解&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item><item><title>知识库调用 Prompt 应该怎么写</title><link>https://www.yolof.top/posts/knowledge-base-prompt/</link><guid isPermaLink="true">https://www.yolof.top/posts/knowledge-base-prompt/</guid><description>知识库调用 Prompt 要明确角色、任务、上下文和输出格式，才能减少答非所问并提升 RAG 系统可控性。</description><pubDate>Wed, 03 Sep 2025 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;知识库问答系统中，Prompt 不是简单地把“请回答问题”写给大模型，而是要明确模型如何使用检索到的资料。&lt;/p&gt;
&lt;p&gt;一个好的知识库调用 Prompt，能减少答非所问、降低幻觉，并让输出更符合业务场景。&lt;/p&gt;
&lt;section&gt;&lt;h2&gt;四个核心要素&lt;a href=&quot;#四个核心要素&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;角色定位：告诉模型当前应该扮演什么角色。&lt;/li&gt;
&lt;li&gt;任务目标：明确要回答、总结、抽取还是对比。&lt;/li&gt;
&lt;li&gt;输入上下文：把检索到的知识片段作为受控信息源。&lt;/li&gt;
&lt;li&gt;输出要求：限制格式、语气、长度和引用方式。&lt;/li&gt;
&lt;/ul&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;常见问题&lt;a href=&quot;#常见问题&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;如果 Prompt 没有限制信息范围，模型可能会使用自身知识自由发挥。&lt;/p&gt;&lt;p&gt;如果没有定义输出格式，答案可能难以被前端展示或后续流程解析。&lt;/p&gt;&lt;p&gt;如果没有允许“不知道”，模型在信息不足时更容易生成不可靠答案。&lt;/p&gt;&lt;/section&gt;
&lt;section&gt;&lt;h2&gt;原文&lt;a href=&quot;#原文&quot;&gt;&lt;span&gt;#&lt;/span&gt;&lt;/a&gt;&lt;/h2&gt;&lt;p&gt;本文根据我的 CSDN 文章整理，原文链接：&lt;a href=&quot;https://blog.csdn.net/weixin_74143209/article/details/151150796&quot; target=&quot;_blank&quot;&gt;知识库调用Prompt应该怎么写&lt;/a&gt;。&lt;/p&gt;&lt;/section&gt;</content:encoded></item></channel></rss>