所属栏目:公司金融/公司治理

DOI号:10.5281/zenodo.13957328

摘要

本研究开发了一种创新方法来预测中国上市公司的"漂绿"行为。通过将大型语言模型BERT整合到机器学习框架中,我们构建了一个先进的漂绿预测模型。这种方法能够捕捉企业社会责任报告和年度报告的环境披露中微妙的语言线索和语义细节,显著提高了识别漂绿的精确度。研究采用了多种机器学习模型,包括支持向量机(SVM)、随机森林(RandomForest)和随机欠采样算法(RUSBoost),并在三种不同的数据集上进行了测试:基础财务数据集、扩展的Word2Vec环境披露数据集,以及BERT优化的环境披露数据集。结果表明,RUSBoost算法结合BERT调整的环境披露数据在各项评估指标上表现最佳,凸显了先进自然语言处理技术在分析环境披露文本方面的优势。此外,我们的研究发现预测的漂绿指标与ESG评级机构间的评级分歧显著相关,验证了本研究所开发的漂绿变量。本研究为识别和预测企业漂绿行为提供了一个创新的、基于文本的方法。这一工具对投资者、监管者和政策制定者具有重要价值,有助于捕捉公司的欺骗性环境披露。
展开

张健; 王宁致; 朱薪予 使用机器学习方法预测中国上市公司“漂绿” (2024年10月20日) https://www.cfrn.com.cn/lw/16049.html

选择要认领的作者1
身份验证1
确认
取消