分类: 未分类

116 篇文章

使用 LangChain + Ollama 构建本地知识库问答系统 | 完整搭建指南
# 使用 LangChain + Ollama 构建本地知识库问答系统 ## 背景介绍 企业内部有大量文档:技术手册、操作指南、会议记录、产品说明。这些东西靠关键词搜索很难找准——用户打个"怎么部署",可能返回十条不相关的结果。更麻烦的是,把这些内部资料发给第三方 API 存在数据泄露风险,老板第一个不答应。 大语言模型出现后,局面变了。检索增强生…
使用 LangChain 构建企业级 RAG 应用:完整指南
## 背景介绍 大语言模型现在已经是企业提升效率的常用工具了。但它有个根本问题:知识只到训练数据为止,没法获取实时信息,也抓不到企业内部私有的那些文档。这就催生了检索增强生成(RAG)技术——让 AI 在回答问题之前,先去外部知识库里翻一翻有没有相关信息,然后把搜到的内容跟问题一起交给大模型处理。 这种做法至少有三个好处:大模型能查到最新数据、幻觉…
Kubernetes HPA 完整指南:如何实现 Pod 自动弹性伸缩
# Kubernetes HPA 完整指南:如何实现 Pod 自动弹性伸缩 ## 背景介绍 云原生应用的流量总是不稳定的。白天高峰期可能需要 20 个 Pod 来扛请求,深夜低谷期 2-3 个就够了。按照峰值流量配 Pod,资源浪费严重;按照低谷期配,高峰期服务就挂。 Horizontal Pod Autoscaler(HPA)是 Kubernet…
构建本地 RAG 问答系统:Ollama + LangChain 完全指南
# 构建本地 RAG 问答系统:Ollama + LangChain 完全指南 很多企业在用 AI 处理内部文档时,都会担心数据泄露的问题。把机密文件发给第三方 API,总让人觉得不踏实。通用大模型的知识有截止日期,还经常一本正经地胡说八道。商业 API 调多了,成本也是笔不小的开销。 这些问题都可以通过本地部署的 RAG 系统来解决。 ## 什么…
Go+Redis大模型响应缓存系统实战
# 使用Go+Redis实现大模型响应缓存系统实战 在大语言模型应用飞速发展的今天,工程师们面临一个很实际的问题:怎么省钱,怎么让响应更快。每次用户提问都直接调OpenAI Claude的API,钱花得肉疼,延迟也下不来。特别是那些反复问同样问题的人,简直是浪费资源。 这篇文章聊聊我是怎么用Go+Redis搭一个缓存系统的,效果还不错。 ## 实际…
使用 Ollama + LangChain 构建本地 RAG 知识库问答系统(完整指南)
在人工智能快速发展的今天,大语言模型(LLM)已经成为了开发者必备的工具。然而,如何将 LLM 与私有数据结合,一直是企业级应用的核心挑战。RAG(Retrieval Augmented Generation,检索增强生成)技术的出现,完美解决了这个问题。传统的 LLM 应用面临几个痛点:第一,模型的知识受限于训练数据,无法获取实时或私有信息;第二…
使用 Ollama + LangChain 构建本地文档问答系统
使用 Ollama + LangChain 构建本地文档问答系统 背景介绍 日常工作中有大量技术文档、论文和内部知识库需要处理。关键词搜索的痛点在于无法理解语义查询——搜"如何安装软件"和"安装步骤"本应返回相同结果,但传统搜索引擎办不到。 云端大语言模型能力很强,数据隐私是个问题。把内部文档上传到第三方 A…
Docker 容器网络配置详解:从基础到实战
# Docker 容器网络配置详解:从基础到实战 做 Docker 开发的人很多,但真正能把网络配置搞清楚的不多。我见过太多项目因为网络问题卡住:容器之间打不通、端口映射乱套、甚至有把数据库直接暴露到公网的惨剧。这篇教程就是为了解决这些问题。 ## 背景介绍 Docker 已经成为现代软件开发的基础设施。这话虽然听起来像套话,但确实是事实。不管是本…
windows用AMD RX 6700XT本地部署大模型
ollama就是用llama.cpp作为后端引擎来封装了模型下载、版本管理和API服务等便捷功能,ollama对旧的AMD显卡支持不好,这里干脆就切换到直接使用llama.cpp来在旧的AMD RTX6700显卡上本地部署大模型。 一、安装llama.cpp winget install llama.cpp 二、下载模型 1. 在魔搭社区的模型库那…
Python + pytest + Allure 自动化测试报告生成完整指南
# Python + pytest + Allure 自动化测试报告生成完整指南 ## 背景介绍 现代软件开发离不开自动化测试。随着项目越来越大,测试用例越来越多,这时候一个清晰的测试报告就变得很关键。pytest 是 Python 生态里用得最广的测试框架,它本身的功能已经很强大了,但在可视化方面总觉得差了那么一点意思。Allure 框架就是为了…