diff --git a/README.md b/README.md
new file mode 100644
index 0000000..324e57f
--- /dev/null
+++ b/README.md
@@ -0,0 +1,44 @@
+# AI 智能客服系统
+
+> 🤖 基于大语言模型 + 自定义知识库的智能问答系统  
+> 🧠 支持多轮对话 · 记忆持久化 · 向量检索增强（RAG）  
+> 🧱 技术栈：Java 21 · Spring Boot 3 · Spring AI · PGVector
+
+## 📌 项目简介
+
+本项目是一个 AI 驱动的智能客服系统，结合大语言模型与企业知识库（RAG），支持多轮对话、上下文记忆持久化以及高质量的问题检索应答能力，广泛适用于网站客服、内部知识助手、文档问答等场景。
+
+
+## 🔧 核心技术
+
+| 类别            | 技术组件                            |
+|-----------------|-------------------------------------|
+| 语言与框架      | Java 21、Spring Boot 3              |
+| AI 支持         | Spring AI / OpenAI / Ollama / Qwen 等大模型 |
+| 向量数据库      | PostgreSQL + PGVector 插件          |
+| 知识增强检索    | RAG（Retrieval Augmented Generation） |
+| 对话存储        | 数据库 / 内存 / 文件持久化等    |
+
+
+## ✨ 关键功能亮点
+
+1. **多轮对话管理**
+   - 支持用户连续提问，智能保持上下文
+   - 引入角色扮演与对话状态记忆机制
+
+2. **对话记忆持久化**
+   - 将对话历史写入数据库，实现用户上下文恢复
+   - 可扩展为多用户会话场景
+
+3. **RAG 知识库增强**
+   - 文档切片 + 嵌入向量化（Embedding）
+   - 支持 Markdown、PDF、TXT 等文档导入
+   - 基于 PGVector 快速相似度查询，提升回答准确度
+
+4. **模型对接灵活**
+   - 默认集成 OpenAI API
+   - 支持本地模型如 Ollama、通义千问（Qwen）、GLM 等，适用于离线部署
+
+5. **Spring AI 深度集成**
+   - 使用 `ChatClient`、`EmbeddingClient` 实现模型和向量一体化调用
+   - 简化大模型与向量检索之间的数据流协作