正在加载数据...
欢迎来到兰州大学应急管理研究中心!

[硕]基于可解释性机器学习的谣言检测研究---马子旭 (2024届 应用统计学专业)

文章来源: 作者: 发布时间:2024年09月07日 点击数: 字号:【

基于可解释性机器学习的谣言检测研究

马子旭

2024届 应用统计学专业

中文摘要随着社交媒体谣言的泛滥,谣言检测变得至关重要。传统基于机器学习和深度学习的谣言检测模型虽有效,它们的黑箱性质使得它们的分类决策难以解释,也难以保证模型的质量。

本研究提出了一种基于BERT的深度学习框架,并利用LIMESHAP模型进行可解释性测度。基于此,使用数据增强技术EDA和对抗训练方法FGM,改善模型对关键特征的识别能力,以提高谣言检测的准确性和可靠性。首先,采用BERT模型处理大规模社交媒体文本数据,以学习复杂的文本表示。随后,通过LIMESHAP技术揭示模型决策过程中的关键因素。这一步骤对于理解模型如何区分真实信息与谣言至关重要,有助于进一步优化模型。最后,为了强化模型对关键特征的学习能力,采用EDAFGM技术对训练数据进行了扩充和调整,增强了模型在复杂环境下的泛化能力和鲁棒性。实验结果表明,结合BERTLIMESHAP以及数据增强技术的方法,在突发公共事件网络谣言检测任务上取得了显著的性能提升。该方法在准确率、召回率和F1分数等关键性能指标上均有明显提高。

实验结果表明,这一方法在网络谣言检测任务上取得了显著的性能提升包括准确率、召回率和F1分数的提高。这一研究不仅证明了结合深度学习技术和可解释性方法的有效性,还为应对突发公共事件中的信息混乱提供了有力工具,增强了谣言检测的准确性和透明度。

关键词:谣言检测,机器学习,可解释人工智能,可解释的谣言检测