背景介绍大语言模型现在很火,但直接用云端 API 有不少问题。数据要传出去、公司机密可能泄露,每个月调用费用也是笔开销。最麻烦的是网络一不稳定,整个服务就挂掉。Ollama 这东西让在本地跑 LLM 变成了现实。它支持 Llama 2、Mistral、Gemma 这些开源模型,macOS 和 Linux 都能装,一行命令就把模型拉下来用。光有模型不…
你有多少份文档需要处理?十份?一百份?当数量少的时候,搜索一下或者人工看看就能找到需要的信息。但文档一多,特别是达到几百上千份的时候,这个问题就变得棘手了。 传统的关键词搜索有多烂,我相信你一定有数。它只能匹配字面上的词,无法理解你真正想问什么。比如搜"如何安装 Python",它可能完全忽略"Python 安装教程"这种相关结果。你也无法表达模糊…
## 背景介绍 在 LLM 应用浪潮中,RAG(Retrieval-Augmented Generation,检索增强生成)已经成为了企业级 AI 应用的核心架构。但真正的挑战不在于 能做出一个 RAG,而在于做出一个生产级别的 RAG——它需要快速、准确、稳定。 我过去几个月参与了多个 RAG 项目的研发,从零开始搭建过,也重构过遗留系统。这篇文…
# Python 实战:用 OpenAI API 构建智能对话机器人 在 AI 应用蓬勃发展的今天,如何快速构建一个能够进行多轮对话的智能机器人?本文将手把手教你用 Python 调用 OpenAI API,从环境配置到完整代码实现,帮助你搭建自己的第一个 AI 对话应用。 ## 背景介绍 OpenAI 的 GPT 系列 API 已经成为开发者构建…
# 使用 Python 构建本地 RAG 知识库问答系统 ## 背景介绍 在人工智能快速发展的今天,大语言模型(LLM)已经能够处理各种复杂的自然语言任务。然而,直接让 LLM 回答私有领域的问题往往面临两大困境:第一,模型的知识截止日期限制导致无法获取最新信息;第二,模型的训练数据中可能不包含企业或个人独有的专业文档。这就是检索增强生成——先把相…
## 背景 GPT-4、Claude 这几个模型出来以后,调用它们的能力不再是大厂的专利。OpenAI 开放的 API 接口,让任何一个会写 Python 的人都能把这些语言模型接入自己的项目。 但真刀真枪做起来,问题就来了:密钥怎么管?错误怎么catch?多轮对话怎么实现?内容质量怎么控制?这些破事不处理好,系统根本没法上线。 这篇文章,直接上代…
## 背景介绍 在日常开发中,为代码添加注释是一件费时费力的工作。很多开发者,要么是因为赶工期,要么是觉得写注释太枯燥,最终导致代码缺乏必要的文档。当团队协作或几个月后回顾代码时,理解逻辑变成了一项艰巨的任务。 有没有一种方法,可以利用大语言模型自动为代码生成注释?本文将介绍如何使用 Go 语言结合 LLM API,构建一个实用的代码注释生成工具。…
背景介绍很多企业在做内部文档问答时,第一反应是把文件丢给 ChatGPT 或者 Claude。这确实方便,但把公司内部资料上传到第三方服务这件事,足以让法务部门跳起来。数据隐私这事儿不是闹着玩的。Ollama 出现之后,情况变了。我们可以在自己的电脑上跑大语言模型,配合 LangChain 的 RAG 框架,整个问答系统完全可以私有化部署。本文记录…
# 如何使用 Python + LangChain 构建基于 LLM 的本地知识库问答系统 ## 背景介绍 很多公司都有大量的内部文档:技术手册、FAQ、产品说明之类的。问题是,用传统关键词搜索来查这些资料,效果通常不怎么样。用户搜"电脑开不了机",系统可能返回"显示器不显示"——虽然有点关系,但不完全是一回事。 大语言模型出现以后,情况变了。RA…
# 使用 Python + OpenAI API 实现自动化代码审查 代码审查是软件开发的重要环节,能帮助发现潜在 bug、提升代码质量、促进团队知识共享。但传统人工审查效率低、主观性强、难以规模化。随着大语言模型的发展,AI 已经具备理解代码逻辑、识别潜在问题、提供改进建议的能力。本文介绍如何使用 Python 调用 OpenAI API,实现自…