财政部唯一指定政府采购信息网络发布媒体 国家级政府采购专业网站

服务热线:400-810-1996   |   服务投诉:010-63819289

当前位置:首页 »  政采公告 » 中央公告 » 更正公告

中国矿业大学应急管理学科大模型系统采购更正公告(第三次)

2026年05月15日 15:50 来源:打印

公告概要:
公告信息:
采购项目名称应急管理学科大模型系统采购
品目

货物/无形资产/信息数据类无形资产/计算机软件/应用软件

采购单位中国矿业大学(徐州)
行政区域江苏省公告时间2026年05月15日 15:50
首次公告日期2026年03月19日更正日期2026年05月15日
更正事项采购文件
联系人及联系方式:
项目联系人王梦珂、徐琳、苍盛、唐虹
项目联系电话025-86970301
采购单位中国矿业大学(徐州)
采购单位地址徐州市铜山区大学路1号
采购单位联系方式龙老师0516-83592010
代理机构名称江苏汉唐国际贸易集团有限公司
代理机构地址南京市玄武区北京东路22号和平大厦1810室
代理机构联系方式王梦珂、徐琳、苍盛、唐虹025-86970301

一、项目基本情况

原公告的采购项目编号:HW20260007(采购代理机构内部编号:1678-254111275HTT)      

原公告的采购项目名称:应急管理学科大模型系统采购      

首次公告日期:2026年03月19日      

二、更正信息

更正事项:采购文件

更正内容:

提交投标文件截止时间、开标时间:2026年6月2日09点30分(北京时间)

以下更正针对分包1:

序号

更正事项

原内容

更正后的内容

1

第三部分:采购需求

 1.1.2.1 总体要求

 

(4)数据质量与版权:所有数据需经过严格的清洗、去重、格式化和质量审核,必须拥有合法版权或使用授权,确保项目合规合法进行。

★(4)数据质量与版权:所有数据需经过严格的“版权过滤”、清洗、去重、格式化和质量审核。供应商在项目执行过程中涉及的所有训练数据、语料库数据、基础模型及API调用数据等所有数据源,必须具有合法来源且具有给采购人本项目所有场景使用的权利,包括自有版权数据、已获得授权的公开数据集、公共领域数据、经授权使用的外部数据等,不得侵害他人依法享有的知识产权,确保不向最终用户输出侵犯权利人合法权益的内容。供应商承担因数据来源不合法引发的一切法律责任,配合采购方进行数据来源核查和合规审计。(提供承诺函原件并加盖供应商公章

2

第三部分:采购需求

 1.1.2.2语料库规模与构成要求

(1) 经典教材:不少于2000本,需涵盖以上10个专业的专业基础理论、核心课程教材,数量均衡分布到该10个本科专业的专业课程和相关应急管理专业课程中,如每个专业涵盖不少于20门专业课程(含专业基础课程与专业主干课程)等;优先选择“国家级规划教材”“省部级优秀教材”、知名高校通用教材,需为完整版知识点,以提升知识准确度;进行PDF/TXT/DOCX结构化存储。

(1) 经典教材:不少于2000本,需涵盖以上10个专业的专业基础理论、核心课程教材,数量均衡分布到该10个本科专业的专业课程和相关应急管理专业课程中,如每个专业涵盖不少于20门专业课程(含专业基础课程与专业主干课程)等;优先选择“国家级规划教材”“省部级优秀教材”、高校通用教材,需为完整版知识点,以提升知识准确度;进行PDF/TXT/DOCX结构化存储。

3

第三部分:采购需求

 1.1.2.2语料库规模与构成要求

(5) 试题库:不少于 10万道,来源:职业资格考试(注册安全工程师、消防工程师)、应急救援员考试、研究生入学考试、高校专业课程考试试题等;题型全面:包含选择题、填空题、判断题、简答题、论述题、案例分析题;附答案与解析:需提供参考答案,简答/论述题需提供答题要点;JSON/XML(含题目、选项、答案、解析、知识点标签)。

(5) 习题库:数量要求,不少于 10万道;内容多样,如模拟职业资格考试(注册安全工程师、消防工程师等)、模拟应急救援员考试、模拟研究生入学考试、模拟高校专业课程考试等习题;题型全面,包含选择题、填空题、判断题、简答题、论述题、案例分析题;附参考答案及解析要点;格式为JSON/XML(含题目、选项、答案、解析、知识点标签)。

4

第三部分:采购需求

 1.1.2.2语料库规模与构成要求

(6) 多模态数据,视频:安全教育片、事故录像、企业安全生产过程数据、应急处置演练视频、专家讲座等,配备字幕或文字,不少于 1万集,每集不少于1分钟;音频:等同视频要求;图片/图纸:安全标识、设备结构图、灾害现场图、应急疏散路线图等,需配备详细文字描述;要求格式(MP4, MP3, JPG, PNG, DWG等)及配套文本,不少于 1万张。能够生成不少于100万的精准、语义匹配的图文对数据集。

(6)多模态数据规模:视频数据总量不少于1万集,每集不少于1分钟,总时长不少于1万分钟,主要覆盖安全教育片、应急处置演练视频、专家讲座、事故案例模拟等非敏感场景类型。音频数据总量不少于1万集,每集不少于1分钟,总时长不少于1万分钟,主要覆盖安全教育片、应急处置演练视频、专家讲座、事故案例模拟等非敏感场景类型。图片/图纸总量不少于1万张,主要覆盖安全标识、设备结构图、灾害现场图或模拟图、应急疏散路线图等非敏感类型数据,需配备详细文字描述。以上数据格式要求不限于MP4、 MP3、JPG、PNG等。能够生成不少于100万的精准、语义匹配的图文对数据集。多模态数据质量要求:图文对齐质量,CLIP Score≥0.85,不合格率≤5%等,复测 + 统计报告。视觉依赖性,仅文本可理解样本≤10%等,人工/模型盲测。重复率控制,图像重复≤10%,文本重复≤10%,完全重复≤2%等,聚类抽样校验。结构化与粒度,专业字段覆盖率≥80%,平均描述长度≥15词等,人工抽检。模态适配性,视频:时序对齐误差≤2秒、WER≤12%;音频:SNR≥15dB等,自动化评测/工具量化。

5

第三部分:采购需求

1.1.2.2语料库规模与构成要求

(7) 行业领域数据:国家数据局发布的高质量数据集典型案例中应急管理领域的数据集不少于1项,需均衡覆盖应急管理相关的安全生产、防灾减灾救灾、应急救援、综合管理等不少于 4 个一级业务领域,及不少于 16 个二级业务场景(含危险化学品监管、矿山监督监察、森林草原火灾防治、防汛抗旱、安全生产执法和工贸监管等),所形成的SFT数据集不少于10万对。

(7)行业领域数据:供应商提供覆盖应急管理相关的安全生产、防灾减灾救灾、应急救援、综合管理等不少于4个一级业务领域,及不少于16个二级业务场景(包括但不限于危险化学品监管、矿山监管监察、森林草原火灾防治、防汛抗旱、安全生产执法和工贸监管、消防监管、石油开采安全监管、调查评估和统计、安全生产综合协调、风险监测和综合减灾、地质灾害、防震减灾、救灾和物资保障、指挥调度、救援力量、预案管理等16个二级业务场景),所形成的SFT数据集不少于10万对。

6

第三部分:采购需求

1.1.2.3 语料处理与质量标准:

(1)文本处理指标,字符编码错误率:<0.01%,格式转换准确率:>99.5%(保持原文结构与顺序),图片型文本(清晰度300DPI以上)中文识别准确率不低于98.5%,英文准确率不低于97%,表格结构及内容识别综合准确率不低于95%,整体公式识别准确率不低于90%。错别字、乱码、无关水印、页眉页脚残留率及格式错误率不高于5%。隐私与敏感信息脱敏:对个人信息、涉密内容脱敏率100%。

(1)文本处理指标,字符编码错误率:<0.01%,格式转换准确率:>99.5%(保持原文结构与顺序),图片型文本(清晰度300DPI以上)中文识别准确率不低于98.5%,英文准确率不低于97%,表格结构及内容识别综合准确率不低于95%,整体公式识别准确率不低于90%。错别字、乱码、无关水印、页眉页脚残留率及格式错误率不高于5%。隐私保护,PII检测覆盖率≥99%;检测出的PII进行去标识化处理(替换为类型标签或屏蔽),检测覆盖率≥99%;处理后残留可识别PII ≤0.1%,自动脚本扫描+人工抽检(每批次3%-5%)。涉密内容管控,涉密数据(国家秘密、企业商业秘密、未公开事故内部报告等)不得进入语料采集环节。

7

第三部分:采购需求

1.1.2.3 语料处理与质量标准:

(2)数据清洗与去重指标,重复数据去除率:100%(基于内容哈希或语义相似度),非相关噪声数据残留率:< 1%。

 

(2)精确去重,完全相同内容去除率100%(基于SHA-256),自动化哈希校验。模糊去重,所有数据经过语义去重处理(处理覆盖率100%)。最终交付数据集中,语义相似度(SimHash≥0.8)聚类后,每个聚类内保留一条代表性数据,语义重复残留率 ≤5%(即去重后仍有相似关系的条目占比不超过5%),语义重复残留率 ≤5%。验收时供应商提交SimHash聚类报告;采购方随机抽检1000条,人工判定语义重复未合并的比例≤5%。噪声过滤,建立三层过滤机制(绝对噪声、低质量内容、领域不相关),质量评估采用公开可复现模型(如 GPT-2 困惑度 ≤ 50 或 fasttext 文本质量分类器),阈值设定为高质量标准(换算为0.85分以上),评分≥0.85的样本占比 ≥90%,验收时供应商提交过滤规则文档及模型推理结果,采购方运行相同模型复测,偏差不超过5%。

8

第三部分:采购需求

1.7.2 技术规格

▲1.7.2.3. 引擎性能:为保证定制形象声音的可使用性,定制形象声音所用引擎性能要求如下:中文语音合成的读音和文本对比正确率≥98%,合成成功率不低于99%,视频合成成功率不低于99%;语音合成自然度MOS得分≥4.2,虚拟人合成MOS分不低于4.8分。提供具有CMA或CNAS标识的检验报告盖章扫描件

1.7.2.3. 引擎性能:为保证定制形象声音的可使用性,定制形象声音所用引擎性能要求如下:中文语音合成的读音和文本对比正确率≥98%,合成成功率不低于99%,视频合成成功率不低于99%;语音合成自然度MOS得分≥4.2,虚拟人合成MOS分不低于4.6分。

9

第三部分:采购需求

1.8.1.1硬件技术规格

▲(10)提供的GPU需在实现BF16或INT8精度下运行DeepSeek-V3 671B或DeepSeek-R1 671B模型推理服务,支持通过API和在线推理服务等方式对外提供调用。(提供产品测试证明复印件

删除此条。

10

第三部分:采购需求

1.8.2 云端计算资源服务

★(1)模型资源:在本地模型的基础上,提供云端模型服务资源,要求提供原厂性能支撑及调优服务。提供高并发服务能力,保障不少于2000人的使用并发,使用用户不限;提供每年不低于1000亿Tokens的主流大模型调用额度,提供8年免费服务。(提供承诺函原件并加盖供应商公章

★(1)模型资源:在本地模型的基础上,提供云端模型服务资源,要求提供原厂性能支撑及调优服务。提供高并发服务能力,保障不少于2000人的使用并发,使用用户不限;提供每年不低于1000亿Tokens的主流大模型调用额度,提供10年免费服务。(提供承诺函原件并加盖供应商公章

11

第五部分:评标办法

3综合评审因素及评审标准

技术响应

投标货物技术响应全部满足招标文件技术要求的得满分31分;在此基础上,招标文件中标注“★”的内容为实质性要求,有一项负偏离的,作无效投标处理;标注“▲”的为重要参数,对这些重要参数负偏离的,则每项扣2.26分,其他一般指标负偏离的,则每项扣0.03分。

投标货物技术响应全部满足招标文件技术要求的得满分31分;在此基础上,招标文件中标注“★”的内容为实质性要求,有一项负偏离的,作无效投标处理;标注“▲”的为重要参数,对这些重要参数负偏离的,则每项扣2.31分,其他一般指标负偏离的,则每项扣0.04分。

 

原招标文件中与此有冲突内容均以此为准。

更正日期:2026年05月15日 

三、其他补充事宜

四、凡对本次公告内容提出询问,请按以下方式联系。

1.采购人信息

名 称:中国矿业大学(徐州)     

地址:徐州市铜山区大学路1号        

联系方式:龙老师0516-83592010      

2.采购代理机构信息

名 称:江苏汉唐国际贸易集团有限公司            

地 址:南京市玄武区北京东路22号和平大厦1810室            

联系方式:王梦珂、徐琳、苍盛、唐虹025-86970301            

3.项目联系方式

项目联系人:王梦珂、徐琳、苍盛、唐虹

电 话:  025-86970301

 

 

相关公告