diff --git a/README.md b/README.md new file mode 100644 index 0000000..324e57f --- /dev/null +++ b/README.md @@ -0,0 +1,44 @@ +# AI 智能客服系统 + +> 🤖 基于大语言模型 + 自定义知识库的智能问答系统 +> 🧠 支持多轮对话 · 记忆持久化 · 向量检索增强(RAG) +> 🧱 技术栈:Java 21 · Spring Boot 3 · Spring AI · PGVector + +## 📌 项目简介 + +本项目是一个 AI 驱动的智能客服系统,结合大语言模型与企业知识库(RAG),支持多轮对话、上下文记忆持久化以及高质量的问题检索应答能力,广泛适用于网站客服、内部知识助手、文档问答等场景。 + + +## 🔧 核心技术 + +| 类别 | 技术组件 | +|-----------------|-------------------------------------| +| 语言与框架 | Java 21、Spring Boot 3 | +| AI 支持 | Spring AI / OpenAI / Ollama / Qwen 等大模型 | +| 向量数据库 | PostgreSQL + PGVector 插件 | +| 知识增强检索 | RAG(Retrieval Augmented Generation) | +| 对话存储 | 数据库 / 内存 / 文件持久化等 | + + +## ✨ 关键功能亮点 + +1. **多轮对话管理** + - 支持用户连续提问,智能保持上下文 + - 引入角色扮演与对话状态记忆机制 + +2. **对话记忆持久化** + - 将对话历史写入数据库,实现用户上下文恢复 + - 可扩展为多用户会话场景 + +3. **RAG 知识库增强** + - 文档切片 + 嵌入向量化(Embedding) + - 支持 Markdown、PDF、TXT 等文档导入 + - 基于 PGVector 快速相似度查询,提升回答准确度 + +4. **模型对接灵活** + - 默认集成 OpenAI API + - 支持本地模型如 Ollama、通义千问(Qwen)、GLM 等,适用于离线部署 + +5. **Spring AI 深度集成** + - 使用 `ChatClient`、`EmbeddingClient` 实现模型和向量一体化调用 + - 简化大模型与向量检索之间的数据流协作