[硕]基于深度学习的火灾事故因素关联关系研究---陈思如(2025届 应用统计专业)
基于深度学习的火灾事故因素关联关系研究
陈思如
2025届 应用统计专业
中文摘要:近年来, 火灾事故的频繁发生极大地影响了人们的生命和财产安全。在火灾事故发生后, 通常会形成调查报告, 从报告记录的历史事故中学习总结经验, 有利于制定或调整相应的预防措施和应急响应策略, 从而降低火灾发生频率并减少损失。对于通常以半结构化形式存在的火灾事故调查报告, 本文基于自然语言处理技术, 开展事故地点、事故原因、人员伤亡情况和直接经济损失 4 种火灾事故因素抽取的模型研究, 即将每种因素单独看作一类实体, 进行命名实体识别模型研究, 抽取出 4 种因素后进一步挖掘因素之间的关联关系, 将其用于安全管理。具体内容如下:
首先在各省市应急管理局网站和政府网站上收集了 606 份事故信息保存较为完整的火灾事故调查报告作为原始数据集, 经过清洗与筛选, 得到包含所需实体的语句, 并对部分语句进行手动实体标注以建立最终数据集。在建立良好数据集的基础上, 本文提出 RoBERTa-IDCNN-CRF 模型, 用以提取 4 种火灾事故因素。RoBERTa-IDCNN-CRF 模型首先利用预训练语言模型 RoBERTa 将文本转化为字符级向量表示, 有效捕捉文本中的语义和上下文信息, 接着采用 IDCNN 模型进一步提取文本的局部特征, 通过多层卷积操作, 增强了对局部上下文信息的敏感性, 最后 CRF 模型被应用于学习文本标签之间的依存关系, 从而精准地识别出文本中的 4 种火灾事故因素。在构建好的数据集上进行实验评估, 模型在事故因素实体识别任务中取得了 88.71% 的 F1 值, 优于传统方法, 验证了该模型在抽取报告中 4 种火灾事故因素时的有效性和优势。
在对每份事故调查报告完成因素抽取的基础上, 本文通过关联规则算法挖掘各因素之间的潜在关联关系。为了进行有效的关联规则挖掘, 首先需要对 4 种事故因素进行分类处理。具体来说, 本文采用文本分类模型对事故原因因素进行分类; 而对于事故地点、人员伤亡情况和直接经济损失因素, 则依据相关理论和专业经验进行人工分类。完成分类后, 本文进一步对这 4 种因素进行关联分析, 并成功挖掘出 197 条关联规则。这些关联规则揭示了各事故因素之间的潜在联系, 为火灾预防和损失控制提供了重要的参考依据, 进而能够有针对性地优化安全管理策略和提升火灾防控效果。
关键词:火灾事故,事故因素,命名实体识别,文本分类,关联关系