中国金融学术研究网

所属栏目：公司金融/公司治理

DOI号：10.5281/zenodo.13957328

使用机器学习方法预测中国上市公司“漂绿”

认领作者认领作者管理权限

发布日期：2024年10月20日上次修订日期：2024年10月20日

张健 jianzhang@shisu.edu.cn 上海外国语大学王宁致 eva.wang@shisu.edu.cn 上海外国语大学朱薪予 2021008@shisu.edu.cn 上海外国语大学

摘要

本研究开发了一种创新方法来预测中国上市公司的"漂绿"行为。通过将大型语言模型BERT整合到机器学习框架中，我们构建了一个先进的漂绿预测模型。这种方法能够捕捉企业社会责任报告和年度报告的环境披露中微妙的语言线索和语义细节，显著提高了识别漂绿的精确度。研究采用了多种机器学习模型，包括支持向量机（SVM）、随机森林（RandomForest）和随机欠采样算法（RUSBoost），并在三种不同的数据集上进行了测试：基础财务数据集、扩展的Word2Vec环境披露数据集，以及BERT优化的环境披露数据集。结果表明，RUSBoost算法结合BERT调整的环境披露数据在各项评估指标上表现最佳，凸显了先进自然语言处理技术在分析环境披露文本方面的优势。此外，我们的研究发现预测的漂绿指标与ESG评级机构间的评级分歧显著相关，验证了本研究所开发的漂绿变量。本研究为识别和预测企业漂绿行为提供了一个创新的、基于文本的方法。这一工具对投资者、监管者和政策制定者具有重要价值，有助于捕捉公司的欺骗性环境披露。

展开

关键词：

漂绿机器学习大语言模型环境披露

下载论文在线阅读

复制链接

新浪微博

微信扫一扫

论文统计数据

浏览次数：
3847
下载次数：
1

摘要

关键词：

论文统计数据

相关文献