[硕]基于可解释性机器学习的谣言检测研究---马子旭 (2024届 应用统计学专业)
基于可解释性机器学习的谣言检测研究
马子旭
2024届 应用统计学专业
中文摘要:随着社交媒体谣言的泛滥,谣言检测变得至关重要。传统基于机器学习和深度学习的谣言检测模型虽有效,但它们的黑箱性质使得它们的分类决策难以解释,也难以保证模型的质量。
本研究提出了一种基于BERT的深度学习框架,并利用LIME和SHAP模型进行可解释性测度。基于此,使用数据增强技术EDA和对抗训练方法FGM,改善模型对关键特征的识别能力,以提高谣言检测的准确性和可靠性。首先,采用BERT模型处理大规模社交媒体文本数据,以学习复杂的文本表示。随后,通过LIME和SHAP技术揭示模型决策过程中的关键因素。这一步骤对于理解模型如何区分真实信息与谣言至关重要,有助于进一步优化模型。最后,为了强化模型对关键特征的学习能力,采用EDA和FGM技术对训练数据进行了扩充和调整,增强了模型在复杂环境下的泛化能力和鲁棒性。实验结果表明,结合BERT、LIME、SHAP以及数据增强技术的方法,在突发公共事件网络谣言检测任务上取得了显著的性能提升。该方法在准确率、召回率和F1分数等关键性能指标上均有明显提高。
实验结果表明,这一方法在网络谣言检测任务上取得了显著的性能提升,包括准确率、召回率和F1分数的提高。这一研究不仅证明了结合深度学习技术和可解释性方法的有效性,还为应对突发公共事件中的信息混乱提供了有力工具,增强了谣言检测的准确性和透明度。
关键词:谣言检测,机器学习,可解释人工智能,可解释的谣言检测
上一篇:[硕]基于 RoBERTa-DCNN 的电力新闻关系抽取---高心萌(2024届 …[ 09-07 ]
下一篇:[硕]数智赋能边疆地区城市韧性效应研究---黄成(2024届 公共管…[ 09-07 ]