From 7884a9ec84f4cd99b22a52241234bddc41f87dce Mon Sep 17 00:00:00 2001 From: hygl <3154803225@qq.com> Date: Mon, 30 Jun 2025 18:52:01 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0readme=E6=96=87=E4=BB=B6?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 122 ++++++++++++++++++++++++++++++++++++++++-------------- 1 file changed, 92 insertions(+), 30 deletions(-) diff --git a/README.md b/README.md index 324e57f..2f394f6 100644 --- a/README.md +++ b/README.md @@ -1,44 +1,106 @@ -# AI 智能客服系统 +# Support Bot - AI智能客服系统 -> 🤖 基于大语言模型 + 自定义知识库的智能问答系统 -> 🧠 支持多轮对话 · 记忆持久化 · 向量检索增强(RAG) -> 🧱 技术栈:Java 21 · Spring Boot 3 · Spring AI · PGVector +> 🤖 基于 Spring AI 和阿里云通义千问的智能客服机器人 +> 🧠 支持 RAG 知识库检索 · 多种对话模式 · 结构化数据提取 +> 🧱 技术栈:Java 17 · Spring Boot 3.4.4 · Spring AI Alibaba · PGVector ## 📌 项目简介 -本项目是一个 AI 驱动的智能客服系统,结合大语言模型与企业知识库(RAG),支持多轮对话、上下文记忆持久化以及高质量的问题检索应答能力,广泛适用于网站客服、内部知识助手、文档问答等场景。 +本项目是一个基于 Spring AI 和阿里云通义千问构建的智能客服系统,集成了文档检索增强生成(RAG)、聊天记忆、结构化数据提取等功能。系统采用现代化的微服务架构,支持同步/异步对话、SSE流式输出、向量语义搜索等多种交互方式,广泛适用于电商客服、企业知识问答、文档智能检索等场景。 +## 🚀 功能特性 -## 🔧 核心技术 +- **💬 智能对话**: 基于阿里云通义千问模型的自然语言对话 +- **🔍 RAG检索**: 文档检索增强生成,从知识库中精准检索相关信息 +- **📺 多模式交互**: 支持同步、SSE流式、ServerSentEvent等多种API接口 +- **🧠 记忆管理**: 完整的会话上下文记忆,支持数据库持久化存储 +- **🏷️ 结构化提取**: 从自然语言中智能提取商品信息等结构化数据 +- **⚡ 向量搜索**: 基于PGVector的高性能语义相似度搜索 +- **🔧 查询优化**: 多种预检索优化策略提升问答质量 +- **📖 API文档**: 集成Knife4j提供完整的交互式API文档 -| 类别 | 技术组件 | -|-----------------|-------------------------------------| -| 语言与框架 | Java 21、Spring Boot 3 | -| AI 支持 | Spring AI / OpenAI / Ollama / Qwen 等大模型 | -| 向量数据库 | PostgreSQL + PGVector 插件 | -| 知识增强检索 | RAG(Retrieval Augmented Generation) | -| 对话存储 | 数据库 / 内存 / 文件持久化等 | +## 🛠 技术栈 +| 技术分类 | 技术组件 | 版本 | 用途说明 | +|---------|---------|------|---------| +| **后端框架** | Spring Boot | 3.4.4 | 主框架,提供依赖注入和自动配置 | +| **AI框架** | Spring AI Alibaba | 1.0.0-M6.1 | AI集成框架,简化大模型调用 | +| **大语言模型** | 阿里云通义千问 | qwen-turbo | 对话生成和文本理解 | +| **数据库** | PostgreSQL + PGVector | 12+ | 关系数据存储 + 向量存储 | +| **ORM框架** | MyBatis Plus | 3.5.12 | 数据库操作和对象映射 | +| **API文档** | Knife4j | 4.4.0 | Swagger UI增强版 | +| **工具库** | Hutool | 5.8.37 | 常用工具类集合 | +| **序列化** | Kryo | 5.6.2 | 高性能序列化框架 | +| **文档解析** | Apache Tika | 1.0.0 | 多格式文档内容提取 | -## ✨ 关键功能亮点 +## 🗃️ 数据库设计 -1. **多轮对话管理** - - 支持用户连续提问,智能保持上下文 - - 引入角色扮演与对话状态记忆机制 +### 核心表结构 -2. **对话记忆持久化** - - 将对话历史写入数据库,实现用户上下文恢复 - - 可扩展为多用户会话场景 +#### 1. 聊天消息表 (`chat_message`) +```sql +CREATE TABLE chat_message ( + id BIGSERIAL PRIMARY KEY, -- 消息唯一ID + conversation_id VARCHAR(64) NOT NULL, -- 会话标识符 + message_type VARCHAR(20) NOT NULL, -- 消息类型: USER/ASSISTANT/SYSTEM + content TEXT NOT NULL, -- 消息内容 + metadata JSONB DEFAULT '{}', -- 消息元数据(JSON格式) + create_time TIMESTAMP DEFAULT NOW(), -- 创建时间 + update_time TIMESTAMP DEFAULT NOW(), -- 更新时间 + is_delete BOOLEAN DEFAULT FALSE -- 逻辑删除标识 +); +``` +**功能**: 存储用户与AI助手的完整对话历史,支持多轮对话上下文维护 -3. **RAG 知识库增强** - - 文档切片 + 嵌入向量化(Embedding) - - 支持 Markdown、PDF、TXT 等文档导入 - - 基于 PGVector 快速相似度查询,提升回答准确度 +#### 2. 向量存储表 (`vector_store`) +```sql +CREATE TABLE vector_store ( + id UUID DEFAULT uuid_generate_v4() PRIMARY KEY, -- 向量记录ID + content TEXT NOT NULL, -- 原始文档内容 + metadata JSONB DEFAULT '{}', -- 文档元数据 + embedding VECTOR(1536) NOT NULL, -- 1536维向量嵌入 + create_time TIMESTAMP DEFAULT NOW(), -- 创建时间 + update_time TIMESTAMP DEFAULT NOW() -- 更新时间 +); +``` +**功能**: 存储知识库文档的向量表示,支持语义相似度搜索和RAG检索 -4. **模型对接灵活** - - 默认集成 OpenAI API - - 支持本地模型如 Ollama、通义千问(Qwen)、GLM 等,适用于离线部署 +## 📁 项目架构 + +### 代码结构 +``` +src/main/java/com/wok/supportbot/ +├── SupportBotApplication.java # 主启动类 +├── advisor/ # AI对话增强器 +│ ├── MyLoggerAdvisor.java # 日志记录顾问 +│ └── ReReadingAdvisor.java # 重读机制顾问 +├── app/ # 核心应用服务 +│ ├── AssistantApp.java # 智能客服应用 +│ └── ProductInfoApp.java # 商品信息提取应用 +├── chatmemory/ # 聊天记忆管理 +│ ├── DatabaseChatMemory.java # 数据库记忆存储 +│ └── FileBasedChatMemory.java # 文件记忆存储 +├── config/ # 系统配置 +│ └── CorsConfig.java # 跨域请求配置 +├── controller/ # REST API控制器 +│ ├── AiController.java # AI对话接口 +│ └── DocumentController.java # 文档管理接口 +├── entity/ # 数据实体类 +│ ├── ChatMessage.java # 聊天消息实体 +│ └── ProductInfo.java # 商品信息实体 +├── rag/ # RAG检索增强 +│ ├── config/ # RAG配置 +│ ├── load/ # 文档加载器 +│ └── preretrieval/ # 预检索优化 +│ ├── RewriteQueryRewriter.java # 查询重写 +│ ├── MultiQueryExpanderRewriter.java # 多查询扩展 +│ ├── CompressionQueryRewriter.java # 压缩查询 +│ └── TranslationQueryRewriter.java # 翻译查询 +└── repository/ # 数据访问层 + └── ChatMessageRepository.java # 聊天消息仓库 + +src/main/resources/ +├── application.yml # 应用配置文件 +└── support-bot.sql # 数据库初始化脚本 +``` -5. **Spring AI 深度集成** - - 使用 `ChatClient`、`EmbeddingClient` 实现模型和向量一体化调用 - - 简化大模型与向量检索之间的数据流协作