大语言模型

  • 详情 绿色标准与企业创新——基于大语言模型的指标刻度与绿色金融机制探索
    2019年,国家发布《绿色产业指导目录》,首次明确绿色产业范围和技术标准,旨在为包括绿色金融体系在内经济社会绿色转型中一系列制度安排的重点支持方向提供技术上的参考目录,提高资源配置效率。本文以《目录》提供的技术文本为基础、运用前沿的大语言模型,构建了全新的基于专业技术角度的企业绿色技术指标,避免了传统企业环境效益评价指标(如ESG指标)存在的覆盖不足和漂绿高估问题。以该指标为基础,本文运用双重差分法考察《目录》对企业创新能力、投资行为及经营绩效的影响。实证结果表明,《目录》的颁布鼓励企业加大了研发投入、增加了绿色支出,提升了绿色企业的创新能力,尤其促进了企业的高质量创新产出。进一步地融资机制探索表明,明确绿色标准显著降低了相关企业的融资成本,尤其对企业信贷融资渠道的影响更为显著。最后,本文通过经济意义分析发现,《目录》提高了企业的经营绩效和节能减排。本文的研究结论为进一步健全绿色金融机制、实现绿色可持续发展提供了有益参考。
  • 详情 使用机器学习方法预测中国上市公司“漂绿”
    本研究开发了一种创新方法来预测中国上市公司的"漂绿"行为。通过将大型语言模型BERT整合到机器学习框架中,我们构建了一个先进的漂绿预测模型。这种方法能够捕捉企业社会责任报告和年度报告的环境披露中微妙的语言线索和语义细节,显著提高了识别漂绿的精确度。研究采用了多种机器学习模型,包括支持向量机(SVM)、随机森林(RandomForest)和随机欠采样算法(RUSBoost),并在三种不同的数据集上进行了测试:基础财务数据集、扩展的Word2Vec环境披露数据集,以及BERT优化的环境披露数据集。结果表明,RUSBoost算法结合BERT调整的环境披露数据在各项评估指标上表现最佳,凸显了先进自然语言处理技术在分析环境披露文本方面的优势。此外,我们的研究发现预测的漂绿指标与ESG评级机构间的评级分歧显著相关,验证了本研究所开发的漂绿变量。本研究为识别和预测企业漂绿行为提供了一个创新的、基于文本的方法。这一工具对投资者、监管者和政策制定者具有重要价值,有助于捕捉公司的欺骗性环境披露。
  • 详情 新闻叙事与资产定价——来自大语言模型的证据
    投资者对宏观经济风险的评估如何影响资产价格一直是实证资产定价的难点之一。已有研究指出新闻文本会改变投资者对宏观经济的判断和预期进而影响股价,但如何有效提取与宏观经济风险相关的文本叙事信息来解释或预测资产价格变动,尚未达成共识。本文基于2007-2021年中国七家专业财经媒体的新闻报道数据,首次结合人工智能前沿领域的BERT大语言模型来测度新闻叙事注意力信息,然后利用稀疏工具主成分(Sparse IPCA)估计影响基本面的状态变量和影响资产价格的叙事定价因子。基于A股市场的实证检验发现:第一,本文利用新闻文本估计的状态变量对于消费、产出、国债收益率等宏观经济指标具有显著的预测效果,这表明新闻叙事蕴含着影响经济运行的信息。第二,相比CAPM、三因子等基准模型,基于新闻文本构建的叙事因子模型能更好地解释资产错误定价现象,并对未来资产价格的变化有更强的预测能力。第三,与基于关键词的文本分析方法(如LDA主题模型)相比,利用BERT提取文本信息可在保证因子模型简约性的基础上获得更优异的定价效果。本文的研究结论对于解释资产横截面收益差异有新的启示,同时为应用大语言模型于经济金融学研究抛砖引玉。