中国矿业大学应急管理学科大模型系统采购更正公告(第三次)
公告详情:
查看详情内容请先登录
一、项目基本情况
原公告的采购项目编号:HW*(采购代理机构内部编号:*-*HTT)
原公告的采购项目名称:应急管理学科大模型系统采购
首次公告日期:*年0*月*日
二、更正信息
更正事项:采购文件
更正内容:
提交投标文件截止时间、开标时间:*年*月*日0*点*分(北京时间)
以下更正针对分包*:
| 序号 | 更正事项 | 原内容 | 更正后的内容 |
| * | 第三部分:采购需求 *.*.*.* 总体要求 | (*)数据质量与版权:所有数据需经过严格的清洗、去重、格式化和质量审核,必须拥有合法版权或使用授权,确保项目合规合法进行。 | ★(*)数据质量与版权:所有数据需经过严格的“版权过滤”、清洗、去重、格式化和质量审核。供应商在项目执行过程中涉及的所有训练数据、语料库数据、基础模型及API调用数据等所有数据源,必须具有合法来源且具有给采购人本项目所有场景使用的权利,包括自有版权数据、已获得授权的公开数据集、公共领域数据、经授权使用的外部数据等,不得侵害他人依法享有的知识产权,确保不向最终用户输出侵犯权利人合法权益的内容。供应商承担因数据来源不合法引发的一切法律责任,配合采购方进行数据来源核查和合规审计。(提供承诺函原件并加盖供应商公章) |
| * | 第三部分:采购需求 *.*.*.*语料库规模与构成要求 | (*) 经典教材:不少于*本,需涵盖以上*个专业的专业基础理论、核心课程教材,数量均衡分布到该*个本科专业的专业课程和相关应急管理专业课程中,如每个专业涵盖不少于*门专业课程(含专业基础课程与专业主干课程)等;优先选择“国家级规划教材”“省部级优秀教材”、知名高校通用教材,需为完整版知识点,以提升知识准确度;进行PDF/TXT/DOCX结构化存储。 | (*) 经典教材:不少于*本,需涵盖以上*个专业的专业基础理论、核心课程教材,数量均衡分布到该*个本科专业的专业课程和相关应急管理专业课程中,如每个专业涵盖不少于*门专业课程(含专业基础课程与专业主干课程)等;优先选择“国家级规划教材”“省部级优秀教材”、高校通用教材,需为完整版知识点,以提升知识准确度;进行PDF/TXT/DOCX结构化存储。 |
| * | 第三部分:采购需求 *.*.*.*语料库规模与构成要求 | (*) 试题库:不少于 *万道,来源:职业资格考试(注册安全工程师、消防工程师)、应急救援员考试、研究生入学考试、高校专业课程考试试题等;题型全面:包含选择题、填空题、判断题、简答题、论述题、案例分析题;附答案与解析:需提供参考答案,简答/论述题需提供答题要点;JSON/XML(含题目、选项、答案、解析、知识点标签)。 | (*) 习题库:数量要求,不少于 *万道;内容多样,如模拟职业资格考试(注册安全工程师、消防工程师等)、模拟应急救援员考试、模拟研究生入学考试、模拟高校专业课程考试等习题;题型全面,包含选择题、填空题、判断题、简答题、论述题、案例分析题;附参考答案及解析要点;格式为JSON/XML(含题目、选项、答案、解析、知识点标签)。 |
| * | 第三部分:采购需求 *.*.*.*语料库规模与构成要求 | (*) 多模态数据,视频:安全教育片、事故录像、企业安全生产过程数据、应急处置演练视频、专家讲座等,配备字幕或文字,不少于 *万集,每集不少于*分钟;音频:等同视频要求;图片/图纸:安全标识、设备结构图、灾害现场图、应急疏散路线图等,需配备详细文字描述;要求格式(MP*, MP*, JPG, PNG, DWG等)及配套文本,不少于 *万张。能够生成不少于*万的精准、语义匹配的图文对数据集。 | (*)多模态数据规模:视频数据总量不少于*万集,每集不少于*分钟,总时长不少于*万分钟,主要覆盖安全教育片、应急处置演练视频、专家讲座、事故案例模拟等非敏感场景类型。音频数据总量不少于*万集,每集不少于*分钟,总时长不少于*万分钟,主要覆盖安全教育片、应急处置演练视频、专家讲座、事故案例模拟等非敏感场景类型。图片/图纸总量不少于*万张,主要覆盖安全标识、设备结构图、灾害现场图或模拟图、应急疏散路线图等非敏感类型数据,需配备详细文字描述。以上数据格式要求不限于MP*、 MP*、JPG、PNG等。能够生成不少于*万的精准、语义匹配的图文对数据集。多模态数据质量要求:图文对齐质量,CLIP Score≥0.*,不合格率≤*%等,复测 + 统计报告。视觉依赖性,仅文本可理解样本≤*%等,人工/模型盲测。重复率控制,图像重复≤*%,文本重复≤*%,完全重复≤*%等,聚类抽样校验。结构化与粒度,专业字段覆盖率≥*%,平均描述长度≥*词等,人工抽检。模态适配性,视频:时序对齐误差≤*秒、WER≤*%;音频:SNR≥*dB等,自动化评测/工具量化。 |
| * | 第三部分:采购需求 *.*.*.*语料库规模与构成要求 | (*) 行业领域数据:国家数据局发布的高质量数据集典型案例中应急管理领域的数据集不少于*项,需均衡覆盖应急管理相关的安全生产、防灾减灾救灾、应急救援、综合管理等不少于 * 个一级业务领域,及不少于 * 个二级业务场景(含危险化学品监管、矿山监督监察、森林草原火灾防治、防汛抗旱、安全生产执法和工贸监管等),所形成的SFT数据集不少于*万对。 | (*)行业领域数据:供应商提供覆盖应急管理相关的安全生产、防灾减灾救灾、应急救援、综合管理等不少于*个一级业务领域,及不少于*个二级业务场景(包括但不限于危险化学品监管、矿山监管监察、森林草原火灾防治、防汛抗旱、安全生产执法和工贸监管、消防监管、石油开采安全监管、调查评估和统计、安全生产综合协调、风险监测和综合减灾、地质灾害、防震减灾、救灾和物资保障、指挥调度、救援力量、预案管理等*个二级业务场景),所形成的SFT数据集不少于*万对。 |
| * | 第三部分:采购需求 *.*.*.* 语料处理与质量标准: | (*)文本处理指标,字符编码错误率:<0.0*%,格式转换准确率:>*.*%(保持原文结构与顺序),图片型文本(清晰度*DPI以上)中文识别准确率不低于*.*%,英文准确率不低于*%,表格结构及内容识别综合准确率不低于*%,整体公式识别准确率不低于*%。错别字、乱码、无关水印、页眉页脚残留率及格式错误率不高于*%。隐私与敏感信息脱敏:对个人信息、涉密内容脱敏率*%。 | (*)文本处理指标,字符编码错误率:<0.0*%,格式转换准确率:>*.*%(保持原文结构与顺序),图片型文本(清晰度*DPI以上)中文识别准确率不低于*.*%,英文准确率不低于*%,表格结构及内容识别综合准确率不低于*%,整体公式识别准确率不低于*%。错别字、乱码、无关水印、页眉页脚残留率及格式错误率不高于*%。隐私保护,PII检测覆盖率≥*%;检测出的PII进行去标识化处理(替换为类型标签或屏蔽),检测覆盖率≥*%;处理后残留可识别PII ≤0.*%,自动脚本扫描+人工抽检(每批次*%-*%)。涉密内容管控,涉密数据(国家秘密、企业商业秘密、未公开事故内部报告等)不得进入语料采集环节。 |
| * | 第三部分:采购需求 *.*.*.* 语料处理与质量标准: | (*)数据清洗与去重指标,重复数据去除率:*%(基于内容哈希或语义相似度),非相关噪声数据残留率:< *%。 | (*)精确去重,完全相同内容去除率*%(基于SHA-*),自动化哈希校验。模糊去重,所有数据经过语义去重处理(处理覆盖率*%)。最终交付数据集中,语义相似度(SimHash≥0.*)聚类后,每个聚类内保留一条代表性数据,语义重复残留率 ≤*%(即去重后仍有相似关系的条目占比不超过*%),语义重复残留率 ≤*%。验收时供应商提交SimHash聚类报告;采购方随机抽检*条,人工判定语义重复未合并的比例≤*%。噪声过滤,建立三层过滤机制(绝对噪声、低质量内容、领域不相关),质量评估采用公开可复现模型(如 GPT-* 困惑度 ≤ * 或 fasttext 文本质量分类器),阈值设定为高质量标准(换算为0.*分以上),评分≥0.*的样本占比 ≥*%,验收时供应商提交过滤规则文档及模型推理结果,采购方运行相同模型复测,偏差不超过*%。 |
| * | 第三部分:采购需求 *.*.* 技术规格 | ▲*.*.*.*. 引擎性能:为保证定制形象声音的可使用性,定制形象声音所用引擎性能要求如下:中文语音合成的读音和文本对比正确率≥*%,合成成功率不低于*%,视频合成成功率不低于*%;语音合成自然度MOS得分≥*.*,虚拟人合成MOS分不低于*.*分。(提供具有CMA或CNAS标识的检验报告盖章扫描件) | *.*.*.*. 引擎性能:为保证定制形象声音的可使用性,定制形象声音所用引擎性能要求如下:中文语音合成的读音和文本对比正确率≥*%,合成成功率不低于*%,视频合成成功率不低于*%;语音合成自然度MOS得分≥*.*,虚拟人合成MOS分不低于*.*分。 |
| * | 第三部分:采购需求 *.*.*.*硬件技术规格 | ▲(*)提供的GPU需在实现BF*或INT*精度下运行DeepSeek-V* *B或DeepSeek-R* *B模型推理服务,支持通过API和在线推理服务等方式对外提供调用。(提供产品测试证明复印件) | 删除此条。 |
| * | 第三部分:采购需求 *.*.* 云端计算资源服务 | ★(*)模型资源:在本地模型的基础上,提供云端模型服务资源,要求提供原厂性能支撑及调优服务。提供高并发服务能力,保障不少于*人的使用并发,使用用户不限;提供每年不低于*亿Tokens的主流大模型调用额度,提供*年免费服务。(提供承诺函原件并加盖供应商公章) | ★(*)模型资源:在本地模型的基础上,提供云端模型服务资源,要求提供原厂性能支撑及调优服务。提供高并发服务能力,保障不少于*人的使用并发,使用用户不限;提供每年不低于*亿Tokens的主流大模型调用额度,提供*年免费服务。(提供承诺函原件并加盖供应商公章) |
| * | 第五部分:评标办法 *综合评审因素及评审标准 技术响应 | 投标货物技术响应全部满足招标文件技术要求的得满分*分;在此基础上,招标文件中标注“★”的内容为实质性要求,有一项负偏离的,作无效投标处理;标注“▲”的为重要参数,对这些重要参数负偏离的,则每项扣*.*分,其他一般指标负偏离的,则每项扣0.0*分。 | 投标货物技术响应全部满足招标文件技术要求的得满分*分;在此基础上,招标文件中标注“★”的内容为实质性要求,有一项负偏离的,作无效投标处理;标注“▲”的为重要参数,对这些重要参数负偏离的,则每项扣*.*分,其他一般指标负偏离的,则每项扣0.0*分。 |
原招标文件中与此有冲突内容均以此为准。
更正日期:*年0*月*日
三、其他补充事宜
无
四、凡对本次公告内容提出询问,请按以下方式联系。
*.采购人信息
名 称:中国矿业大学(徐州)
地址:徐州市铜山区大学路*号
联系方式:龙老师0*-*
*.采购代理机构信息
名 称:江苏汉唐国际贸易集团有限公司
地 址:南京市玄武区北京东路*号和平大厦*室
联系方式:王梦珂、徐琳、苍盛、唐虹0*-*
*.项目联系方式
项目联系人:王梦珂、徐琳、苍盛、唐虹
电 话: 0*-*