Aliyun ddns client
万网注册的域名有福了,背靠阿里这个大金主,最近推出了不少有用的功能,甩出新网之类的域名注册商不止一条街了。朋友之前一直使用DNSPod和花生壳来构筑VPN内网的域名解析,可TPLINK自带的路由器花生壳功能太不稳定了,DNSPod也拒绝加入那些免费的二级域名了,只能想看看有没有办法在他已有的域名上实现DDNS的二级域名解析了。凑巧看见万网和阿里云推…
使用 LangChain + Ollama 构建本地 RAG 知识库问答系统
# 使用 LangChain + Ollama 构建本地 RAG 知识库问答系统 ## 背景介绍 企业日常运营中会积累大量内部文档:技术手册、会议记录、产品说明、操作指南等等。这些文档散落在各个文件夹和系统里,查找起来非常麻烦。传统的关键词搜索只能匹配字面内容,比如搜"服务器"就找不到"主机"相关的内容,导致经常漏掉真正相关的信息。 大语言模型出现…
Kubernetes VPA 垂直 Pod 自动扩缩容实战指南:智能调整容器资源配额
# Kubernetes VPA 垂直 Pod 自动扩缩容实战指南:智能调整容器资源配额 ## 背景 Kubernetes 集群中,容器的资源配额(CPU 和内存)设置是个老难题。配高了浪费资源,配低了 Pod 被 OOM Killer 杀掉。Horizontal Pod Autoscaler(HPA)只能调副本数,改不了单个容器的大小。 VPA …
构建智能 LLM Agent:函数调用实战指南
# 构建智能 LLM Agent:函数调用实战指南 ## 背景介绍 大语言模型发展到现在,光能"说"已经不够了,怎样让它真正"做"事情?函数调用(Function Calling)就是解决这个问题的关键技术。 说白了,函数调用让 LLM 可以和外部系统打交道——查实时数据、执行操作,不再局限于训练数据里那点过时的东西。 这篇文章会手把手教你搭建一个…
使用 LangChain + ChromaDB 从零构建本地知识库问答系统
背景介绍大语言模型很强,但这东西有个致命问题:它懂的东西全是训练数据里的。你公司内部的文档、产品手册、个人笔记——这些私有数据它根本看不到。这就是 RAG(检索增强生成)要解决的问题。简单说就是把私有数据先存到向量数据库里,用户提问的时候,系统去数据库里找相关内容,然后把找到的内容和问题一起喂给大模型,让它基于真实资料来回答。这篇文章手把手教你在本…
使用 LangChain 构建基于 RAG 的企业知识库问答系统
# 使用 LangChain 构建基于 RAG 的企业知识库问答系统 在企业里待过的朋友都知道这样一个场景:员工遇到问题,得在成堆的 PDF、Word 文档、公司 Wiki 里翻来翻去,运气好的话能搜到点有用的,运气不好就只能在各个群里追问。这种情况一多,查找信息的成本就成了个大问题。 关键词搜索的局限很明显——你得用准确的词才能找到东西,同一个意…
在 VS Code 中集成 Ollama 本地大模型:打造私有化 AI 编程助手
## 背景介绍 大语言模型这两年火得不行,AI 辅助编程也从概念变成了 reality。GitHub Copilot、Cursor 这些工具确实好用,但用起来总有点担心——代码上传到第三方服务器合规吗?网络不稳定的时候响应慢怎么办?想用自己微调的模型完全没戏。 Ollama 解决了这个问题。它是一个开源的本地大模型运行框架,直接在你电脑上跑各种开源…
使用 Ollama + LangChain + Chroma 构建本地 RAG 应用完整指南
背景介绍大语言模型(LLM)现在应用很广,但直接用它有一些问题:知识库是固定的、专业知识不够、偶尔会胡扯。检索增强生成(RAG)技术把检索和生成结合起来,先从知识库里找相关信息,再把这些内容喂给 LLM,这样生成的答案更靠谱。以前的 RAG 方案基本都调用 OpenAI API,得花钱,还有数据隐私的破事。这两年开源出了不少能在本地跑的方案。Oll…
Python 实现 RAG 系统实战:让你的 AI 应用拥有记忆
# Python 实现 RAG 系统实战:让你的 AI 应用拥有“记忆” ## 背景 大语言模型很强大,但有个致命缺点:它不知道你公司的事儿。你喂给它的训练数据早就过时了,最新产品文档、内部技术文档、客户问答记录——这些它通通看不到。 这就是检索增强生成(RAG,Retrieval-Augmented Generation)要解决的问题。简单说,R…
使用 OpenAI Function Calling 构建智能 AI 代理实战指南
背景介绍 大语言模型已经具备了强大的文本理解和生成能力。然而,单纯依靠模型自身的知识库,往往难以满足实际业务场景的需求。我们需要 AI 不仅能"思考",还能"行动"——这就是 Function Calling 技术出现的背景。 Function Calling 是 OpenAI 在 2023 年 6 月推出的重要功能,它允许 GPT 模型在生成回复…