liqupan/webUI

Fork 0

Files

Your Name 86cfcc5af1 首次提交

2025-05-29 14:25:13 +08:00

16 KiB

Raw Permalink Blame History

小智AI产品设计需求文档

1. 产品概述

1.1 产品背景

本产品是小智AI的用户操作界面，基于微信小程序开发，为用户提供AI语音交互、剧本创作和智能对话等功能。产品通过整合阿里云语音技术，提供高质量的TTS（文本转语音）、ASR（语音识别）和声音克隆服务，结合小智AI强大的自然语言处理能力，为用户创造沉浸式的AI交互体验。

小程序作为前端界面，所有核心AI功能均由部署在服务器端的小智AI Java后端提供支持。产品不仅满足用户对AI语音交互的需求，还通过配网中心功能，为ESP32等IoT设备提供便捷的网络配置服务，构建完整的智能生态系统。

1.2 产品目标

核心目标：打造小智AI的标准用户界面，提供流畅的AI语音交互体验
技术集成：深度集成阿里云语音服务，确保语音识别和合成的高质量表现
用户价值：为用户提供直观易用的AI对话界面，支持多种交互模式和个性化设置
生态构建：通过ESP32配网功能，连接智能硬件设备，构建完整的AIoT生态
平台优势：充分利用微信生态，降低用户使用门槛，提升产品推广效率

1.3 产品定位

小智AI的官方微信小程序界面，专注于提供AI语音交互、智能对话和设备配网服务，是连接用户与小智AI生态系统的重要桥梁。

2. 后端功能需求

2.1 用户认证系统

2.1.1 微信授权登录

功能描述：作为小智AI的用户入口，实现与微信生态的无缝集成，为用户提供便捷的登录体验。

核心功能：

微信OAuth 2.0集成：处理微信小程序登录流程，获取用户openid和基本信息
小智AI账户关联：将微信用户与小智AI后端用户系统进行关联绑定
统一身份认证：生成小智AI系统的用户token，实现跨服务的身份验证
设备绑定管理：支持用户绑定多个智能设备，统一管理设备权限
会话保持：维护用户登录状态，支持长期免登录使用
多端同步：支持用户在不同设备间的数据同步和会话延续

技术要求：

与小智AI后端用户系统深度集成
实现微信小程序与服务器的安全通信
支持设备授权和权限管理

2.1.2 用户信息管理

功能描述：管理用户在小智AI系统中的个人资料和偏好设置。

核心功能：

用户档案系统：存储用户基本信息、使用偏好和历史数据
AI交互偏好：管理用户对AI助手的个性化设置（语音类型、回复风格等）
设备管理中心：展示和管理用户绑定的所有智能设备
使用统计：记录用户的AI交互次数、时长等使用数据
隐私设置：提供细粒度的隐私控制选项
数据同步：与小智AI后端保持用户数据的实时同步

数据模型：

用户表 (users)
- user_id: 小智AI用户ID
- openid: 微信唯一标识  
- nickname: 用户昵称
- avatar_url: 头像地址
- voice_preference: 语音偏好设置
- ai_personality: AI助手个性设置
- device_count: 绑定设备数量
- last_active: 最后活跃时间
- created_at: 创建时间

2.1.3 权限与设备管理

功能描述：实现用户权限控制和智能设备的统一管理。

核心功能：

分级权限系统：区分普通用户、高级用户和管理员权限
设备权限控制：管理用户对不同设备的访问和控制权限
功能使用限制：根据用户等级限制AI服务的使用频率和功能范围
设备分组管理：支持用户对设备进行分组和场景化管理
权限审计：记录用户权限变更和设备操作日志

权限级别定义：

普通用户：基础AI对话和设备控制功能
高级用户：高级AI功能、更多设备绑定、优先服务支持
管理员：系统管理和用户支持权限

2.2 AI对话系统

2.2.1 智能对话服务

功能描述：基于小智AI后端提供的自然语言处理能力，实现智能对话功能。

核心功能：

多轮对话管理：支持上下文相关的连续对话，保持对话连贯性
意图识别与槽位填充：准确理解用户意图，提取关键信息
个性化回复：根据用户偏好和历史交互调整AI回复风格
多模态交互：支持文本、语音、图片等多种输入输出方式
知识库查询：集成小智AI的知识库，提供准确的信息回复
情感分析：识别用户情感状态，提供相应的情感回应
对话历史管理：保存对话记录，支持历史对话回顾和继续

技术架构：

前端采集用户输入，发送至小智AI后端处理
集成阿里云ASR服务进行语音识别
使用阿里云TTS服务进行语音合成
实现对话状态管理和上下文维护

数据模型：

对话会话表 (chat_sessions)
- session_id: 会话ID
- user_id: 用户ID
- start_time: 开始时间
- last_message_time: 最后消息时间
- context: 对话上下文JSON
- status: 会话状态

对话消息表 (chat_messages)
- message_id: 消息ID
- session_id: 会话ID
- sender_type: 发送者类型(user/ai)
- content_type: 内容类型(text/audio/image)
- content: 消息内容
- timestamp: 时间戳

2.2.2 语音服务集成

功能描述：集成阿里云语音服务，提供高质量的语音识别和合成功能。

核心功能：

实时语音识别：使用阿里云ASR API进行实时语音转文本
智能语音合成：使用阿里云TTS API将AI回复转换为自然语音
多语言支持：支持中文、英文等多语言的语音识别和合成
语音参数调节：支持语速、音调、音色等参数的个性化调节
噪音抑制：集成语音增强算法，提升识别准确率
离线缓存：对常用回复进行语音缓存，提升响应速度
音频格式优化：支持多种音频格式，优化传输效率

技术要求：

集成阿里云语音服务SDK
实现音频数据的高效传输和处理
优化语音识别和合成的延迟

2.2.3 声音克隆与个性化

功能描述：基于阿里云语音技术，为用户提供个性化声音克隆服务。

核心功能：

声音样本采集：指导用户录制高质量的声音样本
阿里云声音克隆：调用阿里云语音克隆API进行模型训练
声音质量评估：评估克隆声音的质量和相似度
多场景适配：为不同应用场景优化声音表现
声音管理：管理用户的个人声音资产
隐私保护：确保用户声音数据的安全和隐私

数据模型：

用户声音表 (user_voices)
- voice_id: 声音ID
- user_id: 用户ID
- voice_name: 声音名称
- aliyun_voice_id: 阿里云声音ID
- sample_urls: 样本音频URLs
- quality_score: 质量评分
- training_status: 训练状态
- created_at: 创建时间

2.3 设备配网中心

2.3.1 ESP32设备配网

功能描述：为ESP32等智能硬件设备提供便捷的Wi-Fi配网服务。

核心功能：

设备发现：自动发现附近的待配网ESP32设备
Wi-Fi配置：通过小程序为设备配置Wi-Fi网络信息
配网协议支持：支持SmartConfig、AP配网等多种配网方式
设备绑定：配网成功后自动绑定设备到用户账户
配网状态监控：实时监控配网进程和设备连接状态
错误处理：提供配网失败的诊断和重试机制
批量配网：支持同时为多个设备进行配网

技术实现：

集成微信小程序的设备配网API
实现与ESP32设备的通信协议
提供配网过程的用户指导界面

2.3.2 设备管理与控制

功能描述：提供已配网设备的统一管理和控制功能。

核心功能：

设备列表管理：展示用户绑定的所有智能设备
设备状态监控：实时显示设备在线状态和运行参数
远程控制：通过小程序远程控制设备功能
设备分组：支持按房间、功能等维度对设备分组
场景联动：创建智能场景，实现设备间的联动控制
设备信息管理：管理设备名称、位置等基础信息
固件升级：支持设备固件的OTA升级

数据模型：

设备表 (devices)
- device_id: 设备ID
- user_id: 用户ID
- device_type: 设备类型
- device_name: 设备名称
- mac_address: MAC地址
- ip_address: IP地址
- firmware_version: 固件版本
- online_status: 在线状态
- location: 设备位置
- group_id: 分组ID
- created_at: 创建时间

设备状态表 (device_status)
- status_id: 状态ID
- device_id: 设备ID
- status_data: 状态数据JSON
- timestamp: 时间戳

2.3.3 IoT场景管理

功能描述：提供智能场景的创建和管理功能，实现设备间的智能联动。

核心功能：

场景创建：图形化界面创建智能场景
条件触发：支持时间、传感器数据、语音指令等触发条件
动作执行：定义场景触发后的设备动作序列
场景调试：提供场景逻辑的测试和调试功能
场景分享：支持场景模板的分享和导入
语音控制：通过语音指令激活智能场景

2.4 内容管理系统

2.4.1 AI角色管理

功能描述：管理小智AI系统中的各种AI角色和其特性。

核心功能：

角色库管理：维护系统预设的AI角色库
角色个性化：允许用户自定义AI角色的性格和回复风格
角色切换：支持用户在不同场景下切换AI角色
角色训练：基于用户反馈持续优化AI角色表现
角色分享：支持用户创建和分享自定义AI角色

2.4.2 知识库管理

功能描述：管理小智AI的知识库内容，确保AI回复的准确性和时效性。

核心功能：

知识内容更新：定期更新AI知识库内容
领域知识管理：按不同领域组织和管理知识内容
知识质量控制：确保知识内容的准确性和可靠性
个性化知识：根据用户需求定制专属知识内容

2.5 系统管理功能

2.5.1 数据统计与分析

功能描述：收集和分析用户使用数据，优化产品体验。

核心功能：

用户行为分析：分析用户的使用习惯和偏好
AI服务统计：统计AI对话、语音服务的使用情况
设备使用统计：分析设备的使用频率和模式
性能监控：监控系统性能和服务质量
用户反馈收集：收集用户对产品的反馈和建议

2.5.2 系统监控与维护

功能描述：确保小程序和后端服务的稳定运行。

核心功能：

服务健康监控：监控小智AI后端服务的运行状态
API调用监控：跟踪小程序与后端API的调用情况
阿里云服务监控：监控语音服务API的调用状态和质量
错误日志管理：收集和分析系统错误日志
性能优化：持续优化系统性能和用户体验

3. 技术架构需求

3.1 整体架构设计

架构原则：

前后端分离：小程序作为纯前端界面，核心逻辑由小智AI后端处理
服务集成：深度集成阿里云语音服务和小智AI核心能力
高可用性：确保关键服务的稳定性和容错能力

核心组件：

微信小程序前端：用户界面和交互逻辑
小智AI Java后端：核心业务逻辑和AI服务
阿里云语音服务：TTS、ASR、声音克隆API
设备配网服务：ESP32等IoT设备的配网支持
数据存储层：用户数据、设备数据、对话记录等

3.2 数据存储架构

存储策略：

关系型数据库：MySQL存储用户信息、设备数据、对话记录
缓存系统：Redis缓存热点数据，提升响应速度
文件存储：阿里云OSS存储音频文件和媒体资源
时序数据库：存储设备状态数据和监控指标

3.3 AI服务集成

集成架构：

小智AI核心：自然语言理解、对话管理、知识问答
阿里云ASR：语音识别服务，支持实时和批量识别
阿里云TTS：语音合成服务，提供多种音色和语言
阿里云语音克隆：个性化声音克隆和训练服务
API网关：统一管理外部API调用和安全认证

3.4 安全与隐私

安全措施：

数据传输加密：HTTPS/WSS加密传输
API安全认证：OAuth 2.0和JWT token验证
隐私数据保护：用户语音数据的加密存储和处理
设备安全：ESP32设备的安全配网和通信加密
合规性保障：符合数据保护法规要求

4. 功能特性需求

4.1 用户界面设计

设计原则：

简洁直观：遵循微信小程序设计规范，界面简洁易用
响应迅速：优化交互响应时间，提升用户体验
适配性强：适配不同尺寸的手机屏幕

关键界面：

主对话界面：AI对话的主要交互界面
设备管理界面：设备列表、状态监控、控制面板
配网向导界面：设备配网的步骤指导
设置界面：用户偏好、语音设置、隐私控制

4.2 性能要求

关键指标：

AI对话响应时间：<2秒
语音识别延迟：<1秒
语音合成延迟：<3秒
设备配网成功率：>95%
小程序启动时间：<3秒

4.3 兼容性要求

支持范围：

微信版本：7.0及以上
iOS系统：12.0及以上
Android系统：8.0及以上
设备类型：ESP32系列开发板

5. 部署与运维

5.1 部署架构

部署方案：

小程序发布：通过微信开发者工具发布到微信平台
后端部署：小智AI Java后端部署在云服务器
服务依赖：阿里云语音服务、数据库、缓存等基础服务
CDN加速：静态资源通过CDN加速分发

5.2 监控与维护

监控体系：

业务监控：AI服务调用、用户活跃度、设备连接状态
性能监控：响应时间、并发量、资源使用率
错误监控：API调用失败、异常日志、用户反馈
第三方服务监控：阿里云API调用状态和限额使用情况

6. 项目实施计划

6.1 开发阶段

第一阶段（基础功能，2个月）：

用户认证和基础AI对话功能
阿里云语音服务集成
基础设备管理功能

第二阶段（设备配网，1.5个月）：

ESP32设备配网功能
设备控制和状态监控
IoT场景管理

第三阶段（优化完善，1个月）：

用户体验优化
性能调优和稳定性提升
功能完善和Bug修复

6.2 技术选型

主要技术栈：

前端：微信小程序原生开发
后端：Java Spring Boot (小智AI现有架构)
数据库：MySQL + Redis
外部服务：阿里云语音服务
通信协议：HTTPS/WebSocket

7. 总结

本产品设计需求文档详细描述了小智AI微信小程序的完整功能需求和技术架构。作为小智AI的官方用户界面，小程序将提供AI对话、语音交互、设备配网等核心功能，通过集成阿里云语音技术和小智AI后端服务，为用户创造优质的AI交互体验。

关键成功因素：

与小智AI后端的深度集成
阿里云语音服务的高效利用
ESP32设备配网的稳定实现
优秀的用户体验设计
完善的监控和运维保障

16 KiB Raw Permalink Blame History Unescape Escape

小智AI产品设计需求文档

1. 产品概述

1.1 产品背景

1.2 产品目标

1.3 产品定位

2. 后端功能需求

2.1 用户认证系统

2.1.1 微信授权登录

2.1.2 用户信息管理

2.1.3 权限与设备管理

2.2 AI对话系统

2.2.1 智能对话服务

2.2.2 语音服务集成

2.2.3 声音克隆与个性化

2.3 设备配网中心

2.3.1 ESP32设备配网

2.3.2 设备管理与控制

2.3.3 IoT场景管理

2.4 内容管理系统

2.4.1 AI角色管理

2.4.2 知识库管理

2.5 系统管理功能

2.5.1 数据统计与分析

2.5.2 系统监控与维护

3. 技术架构需求

3.1 整体架构设计

3.2 数据存储架构

3.3 AI服务集成

3.4 安全与隐私

4. 功能特性需求

4.1 用户界面设计

4.2 性能要求

4.3 兼容性要求

5. 部署与运维

5.1 部署架构

5.2 监控与维护

6. 项目实施计划

6.1 开发阶段

6.2 技术选型

7. 总结

16 KiB

Raw Permalink Blame History