产品定位与价值主张 核心定位 该产品以情感交互机器人为本体,围棋专业模块为首发扩展,构建模块化桌面智能陪伴生态系统。 差异化价值
- 情感AI实体化:表情灯光、耳朵动作、触觉反馈多模态融合,实现有温度的陪伴体验
- 专业围棋生态:承载赛事级对弈、考级评测、监考管理的完整闭环
- 模块化扩展:开放式架构支持后续棋类、游戏、教育等场景持续进化 目标用户场景
- 家庭娱乐与成长陪伴
- 围棋培训机构专业教学
- 线上围棋赛事与考级认证
- 桌面智能助手日常互动
- 产品架构与系统定义 1.1 整体架构设计 双机协同形态
- 陪伴主控机器人(Companion Core):语音交互、情感表达、UI显示、监考管理 [图片]
- 围棋功能模块(Go Board Module, GBM-19):棋盘识别、AI对弈、机械臂自动落子 [图片] 核心设计原则
- 职责清晰:围棋AI计算与机械控制在GBM-19完成,主控专注交互与管理
- 本地优先:关键功能离线可用,联网仅用于更新与云端增强
- 安全隐私:最小化采集、边缘推理、数据可控
- 标准化接口:机械、电气、软件三层标准化,确保扩展兼容性 1.2 系统分工与核心能力边界 陪伴主控机器人职责 推荐配置档位:主控建议(≥6 TOPS NPU,兼容Linux、丰富外设。
- 计算能力:A53四核 + NPU算力满足语音情感处理需求
- 交互管理:4路伺服驱动身体耳朵表情、LED灯环、触控显示
- 感知汇聚:前置摄像头、麦克风阵列、触摸传感统一处理
- 系统枢纽:数据同步、云连接、模块管理、监考录像协调 围棋功能模块职责 推荐配置档位:不再单独配置算力芯片。
- 视觉处理:摄像头芯片处理视觉数据,围棋字符串传输至主控机器人,处理后返回控制数据,
- 围棋AI引擎:独立围棋算法推理,评估分析与决策生成
- 机械执行:高精度机械臂控制,自动落子与复盘演示
- 专业功能:围棋规则、定式库、教学题库等领域专用能力 1.3 接口与系统集成 标准化连接方案
- 数据传输:WIFI(TCP)或蓝牙方案
- 扩展预留:标准化模块扩展接口,支持未来棋类/教育模块 供电与安全管理
- 主控供电:内置18650电池组
- 模块供电:外接适配器主供。
- 功率管理:智能功率分配,过载保护,双向供电切换
- 电气安全:符合CE/FCC安全标准,EMC兼容性设计
- 核心BOM及技术方案 2.1 陪伴主控机器人核心模块 暂时无法在飞书文档外展示此内容 2.2 围棋功能模块(GBM-19)核心模块 暂时无法在飞书文档外展示此内容 2.3 关键技术方案要点 SoC及NPU算力配置 主控建议配置:RK3587或同级(≥6 TOPS NPU,四核A76@2.2GHz)支撑多模态交互;备选JH7203(国产化,视频编解码优化)等。 围棋模块建议配置:不再配置算力芯片,由主控负责计算,使用摄像头芯片处理视觉数据,运动控制芯片做机械臂运动控制。 机械臂控制架构6 运动控制方案:采用实时控制器+分布式驱动架构,支持实时轨迹规划与碰撞检测。 安全保护机制:硬件急停回路、软件限位检查、力矩监控、人体检测多重保护。 精度保证措施:闭环位置控制、视觉反馈校正、温度补偿、机械背隙补偿。 视觉识别技术路线 识别算法:基于深度学习的棋子检测+传统计算机视觉的几何校正融合方案。 光照适应:自适应曝光控制+可控LED补光+多光谱成像技术。 标定策略:出厂标定+运行时动态校准,适应不同环境和棋盘材质。
- 功能需求与核心用例 3.1 情感交互系统(主控) 语音交互能力
- 唤醒识别:本地唤醒词检测,响应延迟目标 ≤300ms
- 语音理解:轻量ASR + NLU,支持围棋专业术语
- 情感表达:基于语境的TTS合成,配合表情动作联动
- 混合工作流:本地快速响应 + 云端深度理解 表情动作系统
- 硬件配置:4路伺服电机(身体俯仰/水平,耳朵左右)
- 动作库:预设表情组合,支持自定义动作序列
- 情感映射:根据语音情感分析驱动对应表情
- 状态指示:LED灯环配合表情表达系统状态 3.2 围棋专业系统(GBM-19) 视觉识别能力
- 棋盘检测:自动识别19×19标准棋盘,适配多种材质
- 棋子识别:黑白棋子准确分类,目标准确率 ≥99.5%
- 状态跟踪:实时监测棋局变化,支持动态遮挡处理
- 标定系统:自动几何校准,补偿光照变化 AI引擎能力
- 自研算法:独立开发的围棋AI引擎,不依赖第三方
- 实时评估:局面分析、胜率计算、候选手推荐
- 教学模式:定式识别、死活题库、错误分析 机械执行能力
- 自动落子:精确抓取放置,定位精度目标 ≤1.0mm
- 复盘演示:按SGF文件回放棋局,可变速控制
- 教学演示:配合题库进行动作示范
- 安全保护:人手检测避障,软硬限位保护 3.3 监考反作弊系统 系统设计原则
- 公平竞赛优先:所有检测和处理机制以维护比赛公平公正为首要目标
- 证据链完整性:棋谱分析、行为监测、录像取证、历史数据多维度交叉验证
- 分级响应机制:根据风险等级采取差异化处理策略
- 双向审查制度:防范恶意举报,保护选手合法权益
- 隐私保护合规:遵守《未成年人保护法》与《个人信息保护法》,录像仅保留72小时备查
监考场景支持 线上考级场景
- 围棋段位认证:支持定级、定段考试远程监管
- 目标用户:每年约300万儿童参与的线上定级定段考试
- 价值模型:单次考级费用约¥450,提供视频存储增值服务 比赛监督场景
- AI vs 人类对弈:检测人类选手是否使用AI辅助
- 线上人人对弈:实体棋盘远程对弈反作弊
- 教学复盘:教学分析和对局复盘监督
- 观战裁判模式:支持教练、观众多角色观战 教学管理场景
- 培训机构监督:B端和G端机构教学质量管控
- 学校围棋课程:校内围棋教学过程监督
作弊检测能力矩阵 身份验证层
- 人脸识别:比赛开始前确认考生身份
- 持续验证:对局过程中定期抽查人脸匹配
- 多人检测:识别画面中出现多人情况
- 身份替换告警:检测中途更换对弈者 棋谱AI分析层 核心技术:
- 支持KataGo、Leela Zero、绝艺、星阵等主流AI引擎分析
- 实时计算AI吻合度(每手棋与AI推荐选点的匹配率)
- 动态阈值设置(根据棋手年龄、级别、局面复杂度调整) 三级风险判定标准:
- 低风险 (AI吻合度 < 60%)
- 正常范围,无需特殊处理
- 可驳回针对该选手的投诉
- 中风险 (60% ≤ AI吻合度 < 70%)
- 作弊嫌疑,进入人工复核
- 可要求下轮执行录像监督(面部+双手+棋盘)
- 若下轮再被投诉需提交录像证据
- 可要求到线下校区由教师监赛
- 高风险 (AI吻合度 ≥ 70%)
- 直接判定作弊
- 结果判负,取消成绩并要求退赛 吻合度分段分析:
- 分析前50手、中盘(50-120手)、官子阶段各时段吻合度
- 识别"精准规避检测"行为(故意选择AI第2、第3选点将吻合度控制在55-59%)
- 关键复杂战斗手数单独标注分析 行为监测层 视觉行为分析:
- 多人入镜检测:识别画面中出现第二人
- 频繁离座告警:统计离开座位次数和时长
- 视线偏移追踪:检测目光长时间偏离棋盘(疑似看其他屏幕)
- 异常动作识别:频繁低头看手机、使用耳机等动作 时间模式分析:
- 落子时间均匀度:检测每手棋耗时是否异常规律
- 思考时间反常:简单局面思考过久或复杂局面瞬间落子
- 暂停频率统计:频繁暂停对局(疑似咨询AI) 设备环境监控:
- 多屏检测:识别双屏、多屏显示器
- 画中画识别:检测伪造实时画面的软件特征
- 网络流量监控:检测IP地址异常流量(疑似上传棋盘至AI服务器) 物品检测层
- 违规设备:手机、平板电脑、蓝牙耳机、智能手表
- 纸质资料:棋谱书、笔记、打印材料
- 投屏设备:外接显示器、投影仪 音频分析层
- 远程声音检测:识别画面外有人说话
- 可疑对话关键词:"这手怎么下"、"AI推荐"等关键词识别
- 环境噪音异常:检测鼠标键盘声音(疑似操作其他设备) 环境监控层
- 光线变化:突然开关灯、屏幕反光异常
- 背景异常:背景中出现其他显示设备
- 摄像头切换:检测比赛中途更换摄像设备
- 画面遮挡:手部或物体故意遮挡摄像头
告警与记录系统 分级告警机制
- Info级 (信息提示)
- 轻微视线偏移、短暂离座(<30秒)
- 仅记录,不触发干预
- Warning级 (警告)
- 中度风险行为:离座超30秒、检测到手机、视线长时间偏离
- 本地语音提示:"请保持面部和双手在画面内"
- 屏幕弹窗提醒
- 累计3次Warning升级为Critical
- Critical级 (严重告警)
- 高风险行为:多人入镜、AI吻合度≥70%、使用蓝牙耳机
- 立即通知裁判组
- 自动截图和录制30秒视频片段
- 可暂停比赛要求选手说明 实时处理流程
- 预警阶段:检测到异常行为,本地语音+屏幕提示
- 记录阶段:自动标记时间戳,触发录像片段保存
- 上报阶段:Critical级别事件实时推送至裁判组
- 人工介入:裁判组远程查看实时画面,决定是否暂停 录像标记功能
- 关键事件截图:每个Warning/Critical事件自动截图
- 视频片段提取:事件前后各15秒视频片段单独保存
- 时间轴标注:在完整录像时间轴上标注所有告警事件
- 快速检索:裁判组可按事件类型快速跳转查看 数据导出能力 完整考试记录包含:
- 全程录像(面部+双手+棋盘画面)
- 完整棋谱及AI分析报告
- 所有告警事件列表(时间、类型、级别、截图)
- 行为数据统计(离座次数、视线偏移时长、落子时间分布)
- IP地址、设备信息、网络流量日志 数据保护:
- 录像仅保留72小时备查,用后即删
- 数据仅限裁判组和总裁判组访问
- 符合国家法律法规,不做他用
投诉处理机制 投诉发起规则
- 时限要求:比赛结束后30分钟内提交举报
- 举报内容:说明可疑手数及理由
- 证据提交:鼓励提供截图、录屏等辅助材料 裁判组架构 三级裁判体系:
- 地区裁判组
- 北京裁判组:2名职业棋手,负责北京1210名选手
- 异地裁判组:2名职业棋手(北京),负责异地1304名选手
- 网校/合作校裁判组:2名职业棋手(非网校),负责337名选手
- 总裁判组
- 不服地区裁判组裁决,可申诉至总裁判组
- 最终仲裁权 分级处理流程 低风险处理 (AI吻合度 < 60%):
- 进入人工复核裁定
- 可驳回申诉并出具理由
- 不服裁决可向总裁判组继续申诉 中风险处理 (60% ≤ AI吻合度 < 70%):
- 进入人工复核,综合行为数据和录像分析
- 驳回路径:
- 可驳回申诉并出具理由
- 不服裁决可向总裁判组继续申诉
- 改判路径:
- 判定存在作弊嫌疑
- 要求下轮执行动作:
- 方案A:下轮比赛全程开摄像头录像(露面部及双手)
- 若下轮再被投诉需提交视频证据
- 未提交证据可判负并要求退赛
- 证据无效或不符合要求,可要求线下重赛或直接判负
- 未再被投诉则无需提交
- 方案B:下轮到聂道线下校区由教师监赛
- 方案A:下轮比赛全程开摄像头录像(露面部及双手)
- 不服裁决可向总裁判组继续申诉 高风险处理 (AI吻合度 ≥ 70%):
- 直接终局裁定
- 结果判负,取消成绩并要求退赛
- 根据"反坐机制"触发双向嫌疑条款(见下文) 反坐机制(防恶意举报) 核心原则:任何投诉均进行双向审查,保护选手权益 触发条件:
- 双方棋谱AI吻合度均≥60% 处理措施:
- 判定本局双负
- 或安排双方重赛(线下)
- 将两人列入重点观察名单,后续比赛须全程录像 恶意举报惩罚:
- 举报方吻合度高于被举报方,视为恶意构陷
- 首次警告,扣除信用分
- 再犯取消当届比赛资格 重赛机制 适用场景:
- 经过上述流程处理,双方仍对仲裁结果不满
- 总裁判组调解无效 重赛要求:
- 方式1:双方线下面对面对弈
- 方式2:双方开摄像头直播在线对弈
- 以重赛结果为准,不同意重赛者可判负 仲裁文档:
- 总裁判组出具判罚说明
- 说明原判罚理由和重赛安排
- 双方签字确认
线上赛作弊技术对抗 高风险作弊平台识别
- 野狐围棋、腾讯围棋:用户基数大,匿名性强,AI接入插件多
- Tygem (韩国)、KGS (国际)、OGS (开源):国际平台监管弱 常见作弊工具库 AI分析引擎:
- KataGo、Leela Zero、绝艺(Fine Art)、星阵、Katrain 作弊插件:
- GoReviewPartner、AI GUI桥接工具
- 实时读取棋盘并返回AI选点 硬件辅助:
- 双屏/多屏显示器
- 投屏设备(iPad、手机投屏)
- 蓝牙微型耳机接收外部指导 反制措施升级 对抗"精准规避检测":
- 不仅分析吻合度,还分析AI推荐的第2、第3选点匹配率
- 标注"刻意规避"特征:吻合度长期稳定在55-59%区间 对抗"画中画"伪造:
- 检测画面压缩痕迹(二次编码特征)
- 要求选手进行实时动作指令(举手、转头等)
- 随机时刻要求展示完整房间环境 对抗"投屏到盲区":
- 要求摄像头俯视角度,覆盖桌面和周边环境
- 检测环境光源反射(其他屏幕的光照变化) 对抗"网络流量隐蔽":
- 封禁比赛期间使用VPN、代理
- 监控上传流量(棋盘截图上传AI服务器)
- 系统接口与扩展架构 4.1 标准化接口规范 物理连接标准
- 主连接:USB-C(PD 3.0)支持100W双向供电,USB 3.2数据传输
- 扩展接口:标准化模块接口,包含电源、数据、控制信号
- 安全特性:防反插设计、热插拔支持、过载保护
- 机械规范:工业级连接器,满足频繁插拔需求 电气安全要求
- 绝缘等级:符合IEC 61010安全标准
- EMC兼容:满足CE/FCC电磁兼容要求
- 防护等级:核心模块达到IP54防护标准
- 安全认证:通过UL/CCC/CE强制性安全认证 4.2 软件接口标准 服务接口定义
- 视觉服务:RESTful API提供棋盘状态查询和变化订阅
- 引擎服务:gRPC接口支持围棋AI评估和决策请求
- 动作服务:MQTT消息总线控制机械臂动作序列(待定)
- 监管服务:WebRTC协议支持实时音视频流传输 数据格式标准
- 棋局数据:SGF v4标准格式,兼容主流围棋软件
- 配置数据:JSON Schema标准,版本化配置管理
- 日志数据:结构化日志(JSON Lines),支持ELK分析
- 媒体数据:H.264/AAC编码,支持实时流和录制回放 4.3 模块化扩展能力 扩展模块标准 接口抽象层:统一的硬件抽象层(HAL),支持即插即用。 能力发现协议:自动识别模块类型和功能,动态加载驱动。 资源管理:计算资源、存储空间、网络带宽的智能调度分配。 未来扩展路径
- AI模型升级:支持ONNX/TensorRT等主流推理框架,模型版本化管理
- 算法能力扩展:开放SDK支持第三方算法集成,插件式架构
- 可插拔模块生态:中国象棋、国际象棋、五子棋等标准化模块接口
- 行业标准兼容:支持OpenAI API、ROS机器人标准等行业协议
- 关键工程实现要点 5.1 视觉识别工程化 关键技术指标
- 识别精度:棋子检测准确率≥99.5%,误判率≤0.1%
- 响应速度:棋局变化检测延迟≤1.0秒
- 环境适应:光照变化范围100-2000 lux正常工作
- 材质兼容:支持木质、塑料、陶瓷等主流棋盘材质 工程实现要点 标定策略:采用棋盘格标定板+实时几何校正,补偿镜头畸变和安装误差。 光照控制:可控LED补光系统,根据环境光照自动调节亮度和色温。 算法优化:端侧推理INT8量化,模型大小≤10MB,推理延迟≤50ms。 鲁棒性设计:多帧融合判断、异常检测和自动恢复机制。 5.2 机械控制工程化 关键性能要求
- 定位精度:末端定位精度≤±1.0mm,重复精度≤±0.5mm
- 运动速度:空载最大速度1000mm/s,负载速度500mm/s
- 安全响应:碰撞检测响应时间≤100ms,紧急停止距离≤2mm
- 工作寿命:连续工作≥8小时/日,整机寿命≥50万次落子 工程实现要点 控制架构:采用实时Linux内核,1ms控制周期,支持轨迹前瞻控制。 传感器融合:编码器位置反馈+力矩传感器+视觉校正的多重定位系统。 安全保护:硬件急停回路+软件安全区域+碰撞检测的三重保护机制。 维护设计:模块化设计便于维修,关键部件免润滑或长周期维护。 5.3 系统集成与通信 数据同步架构 本地优先:关键功能本地完成,云端仅用于增强和备份。 实时通信:设备间延迟≤50ms,支持音视频同步传输。 容错机制:网络断线自动恢复,本地数据缓存和重传机制。 一致性保证:分布式事务保证棋局状态一致性,冲突检测和解决。 性能优化策略 计算负载均衡:主控专注交互,围棋模块承担AI推理和视觉处理。 内存管理:大文件流式处理,避免内存峰值超限。 存储优化:热数据SSD缓存,冷数据压缩归档。 功耗控制:动态频率调节,待机模式功耗≤5W。
- 用户体验与交互设计 6.1 核心使用场景 家庭娱乐场景
- 对弈陪练:AI难度可调,适合不同水平用户
- 学习指导:实时提示和复盘分析
- 情感陪伴:个性化交流,建立情感连接
- 娱乐互动:多样化表情动作,增加趣味性 专业培训场景
- 教学辅助:配合教师进行专业指导
- 练习监督:自动记录练习过程和进度
- 考级准备:模拟考试环境和标准
- 技能评估:客观分析技术水平和改进方向 线上考试场景
- 身份认证:确保考试参与者身份真实
- 过程监督:全程监控确保考试公正
- 违规检测:自动识别和记录违规行为
- 结果记录:完整的考试过程和结果存档 6.2 交互体验优化 语音交互优化
- 自然对话:支持多轮对话和上下文理解
- 专业术语:围棋专业词汇准确识别
- 情感识别:根据语音情感调整回应方式
- 多语言支持:支持中英文切换使用 视觉体验优化
- UI设计:简洁直观的界面设计
- 动画效果:流畅的过渡动画和反馈
- 状态指示:清晰的系统状态显示
- 个性化设置:用户偏好设置和记忆 物理交互优化
- 表情动作:丰富的表情和肢体语言
- 触感反馈:适当的物理反馈增强体验
- 稳定性:设备物理稳定性和安全性
- 维护便利:易于清洁和基础维护
- 项目规划与里程碑 7.1 开发阶段规划 第一阶段:核心功能实现
- 基础架构:系统架构设计和核心框架搭建
- 关键算法:视觉识别和围棋AI算法实现
- 硬件集成:硬件选型和基础集成测试
- 接口开发:关键接口定义和实现 第二阶段:功能完善
- 交互优化:语音交互和表情控制完善
- 监考系统:反作弊监考功能实现
- 数据管理:数据存储和同步功能
- 安全加固:隐私保护和安全功能 第三阶段:产品化
- 用户体验:UI/UX设计和体验优化
- 性能调优:系统性能优化和稳定性提升
- 测试验证:全面测试和问题修复
- 文档准备:用户文档和技术文档 7.2 关键里程碑 技术里程碑
- 技术验证完成:核心技术可行性验证
- 原型机完成:功能原型机制作和测试
- 工程样机完成:工程化样机和功能验证
- 量产准备完成:量产工艺和品质验证 产品里程碑
- 需求确认完成:产品需求最终确认
- 设计确认完成:产品设计方案确认
- 开发完成:产品开发和功能实现
- 测试完成:产品测试和质量验证
附录 A. 术语定义
- GBM-19:Go Board Module 19×19,围棋功能模块
- Companion Core:陪伴主控机器人
- Module Dock:模块化底座接口
- SGF:Smart Game Format,围棋棋谱标准格式
- NPU:Neural Processing Unit,神经网络处理单元 B. 技术参考标准
- 围棋规则:中国围棋规则、日本围棋规则
- 通信协议:USB 3.2、Wi-Fi 6、BLE 5.2
- 音视频编码:H.264/H.265、AAC
- 数据安全:AES-256加密、TLS 1.3
- 隐私合规:GDPR、个人信息保护法
- 工业标准:IEC 61010、CE/FCC、UL认证 C. 工程方案决策预留事项
- 具体芯片pin脚定义:留待详细硬件设计阶段确定
- 电气波形参数:依据最终选型器件规格书制定
- 热设计分析:基于功耗测试结果优化散热方案
- 供应链备选:建立关键器件多供应商备选机制
- 软件架构细化:详细模块接口和服务编排设计