文本分析

  • 详情 新闻叙事与资产定价——来自大语言模型的证据
    投资者对宏观经济风险的评估如何影响资产价格一直是实证资产定价的难点之一。已有研究指出新闻文本会改变投资者对宏观经济的判断和预期进而影响股价,但如何有效提取与宏观经济风险相关的文本叙事信息来解释或预测资产价格变动,尚未达成共识。本文基于2007-2021年中国七家专业财经媒体的新闻报道数据,首次结合人工智能前沿领域的BERT大语言模型来测度新闻叙事注意力信息,然后利用稀疏工具主成分(Sparse IPCA)估计影响基本面的状态变量和影响资产价格的叙事定价因子。基于A股市场的实证检验发现:第一,本文利用新闻文本估计的状态变量对于消费、产出、国债收益率等宏观经济指标具有显著的预测效果,这表明新闻叙事蕴含着影响经济运行的信息。第二,相比CAPM、三因子等基准模型,基于新闻文本构建的叙事因子模型能更好地解释资产错误定价现象,并对未来资产价格的变化有更强的预测能力。第三,与基于关键词的文本分析方法(如LDA主题模型)相比,利用BERT提取文本信息可在保证因子模型简约性的基础上获得更优异的定价效果。本文的研究结论对于解释资产横截面收益差异有新的启示,同时为应用大语言模型于经济金融学研究抛砖引玉。
  • 详情 公告溢价效应与资产定价:文本机器学习视角
    本文在中国股票市场中,针对上市公司公告文本数据,采用文本分析机器学习方法进行信息提取,研究了上市公司公告信息与资产预期回报之间的关系,并探讨其对资本市场的影响渠道。本文首先依据监督式训练方法构造了基于公告的文本情感词典,并以此为基础使用机器学习方法对公告效应进行实证分析。其次,本文探究了公告效应的预测来源,并进行了异质性分析。本文研究发现,基于机器学习的公告文本情感倾向能够显著正向预测股票收益,在全样本中多空投资组合的平均年化收益达到了 20.04%。公告效应在小规模、成长型公司中溢价显著;与国企相比,民营企业的公告效应更显著。在对公告效应的来源分析中,本文发现金融机构关注度和公司信息披露质量较高的公司,公告效应相对较弱,而散户投资者的关注度会加强公告效应。
  • 详情 网络安全治理与股价崩盘风险——基于上市公司年报文本分析的证据
    网络安全治理已经引起了政府决策部门和学术界的广泛关注。本文聚焦资本市场中的企业网络安全治理与金融风险,通过深度学习方法分析上市公司年报文本,构建企业网络安全治理指标,实证研究揭示了网络安全治理和股价崩盘风险之间的关系及其机制。研究发现,网络安全治理可以显著降低股价崩盘风险,这一结论在更换解释变量、增加控制变量和《网络安全法》的颁布作为准自然实验等稳健性检验后仍然成立。企业网络安全治理降低了外界的信息不对称、增加了企业社会责任,从而降低了股价崩盘风险。国有企业、规模较大、公司成长性较好、有形资产比例较低的公司更有可能重视网络安全治理。本文结论为企业网络安全治理对金融风险的影响提供了经验证据,为企业网络安全治理相关政策制定提供了建议参考。
  • 详情 企业创新会影响股权资本成本吗?——基于LDA主题模型分析的经验证据
    本文基于2009-2019年中国A股上市公司数据,采用潜在狄利克雷分配(LDA)主题模型分析,构建基于分析师报告的创新测度指标,实证检验企业创新对股权资本成本的影响及其作用机制。研究发现:企业创新显著降低了股权资本成本,并且在经过一系列稳健性检验后结论依旧成立;进一步研究结果显示,对于高研发支出、低专利授权、高组织冗余以及低媒体关注度的企业而言,创新对其股权资本成本的削弱效果更为显著;机制检验结果表明,企业创新能够通过增强竞争力以及提高信息透明度来降低股权资本成本,且能够缓解融资约束。本研究有助于更全面地观测企业创新行为,同时为企业降低股权资本成本提供了经验证据。
  • 详情 金融科技赋能下供应链金融对企业价值的影响研究:来自大数据文本分析的证据
    发展供应链金融对于深化金融供给侧结构性改革,增强金融服务实体经济具有不容忽视的重要战略意义。本文通过对 2007 年-2019 年中国 A 股上市公司全 部公告和全部网络财经新闻报道大数据信息的进行收集整理,实证检验了上市公司发展供应链金融业务以及参与金融科技的意愿对企业价值的影响。研究结果表明:上市公司发展供应链金融在短期可以促进企业股价的上涨,在长期可以促进企业价值的提升,并且上市公司采用的供应链金融业务越多,公告中提到供应链金融业务越频繁,这种提升效果越显著。已采用供应链金融业务的上市公司在新闻报道中提到大数据、区块链、人工智能等金融科技相关词汇越多,对上市公司企业价值提升的效果越强。上市公司在发展了供应链金融业务之后会通过提高风险承担水平,提高投资支出与投资收益,提高资金效率和全要素生产率的方式促进企业价值的提高。在进行一系列稳健性检验之后,上述结论依然成立。本文不仅为发展供应链金融提高企业价值提供了基于公开市场数据大样本的实证证据,也对于国家和地方政府支持供应链金融的发展具有现实启示。
  • 详情 高管简历是否提供了有用信息?——基于企业创新视角
    高质量的财务报告能够提升利益相关者的信息优势,高管简历作为重要的财务 报告文本,传递了高管背景特征这一私人信息,有利于利益相关者更加准确地评估企业创 新活动价值。基于此,本文以 2008-2018 年中国 A 股上市公司为样本,采用文本分析方 法,从完整性、详细性和可读性三个文本特征维度,探究高管简历信息披露是否以及如何 为企业创新提供信息。本文通过实证研究发现,高管简历信息披露能够促进企业创新。经 过工具变量回归和其他稳健性检验后,这一结论仍然成立。机制检验表明,高管简历信息 披露能够通过吸引高学历员工以及缓解融资约束两个渠道促进企业创新。本文拓展了财务 报告文本信息经济后果与企业创新影响因素的相关研究,揭示了高管简历在企业创新中的 重要作用,对监管部门完善信息披露政策提供了有力依据。
  • 详情 人口老龄化与企业劳动力成本粘性 ——基于自然语言和深度学习
    人口老龄化给劳动力市场带来了广泛而深远的影响。作为微观经济主体的企业在面 对人口老龄化带来的负面冲击会如何应对?本文采用自然语言和深度学习技术,使用中国上 市公司年报文本构建出企业层面对人口老龄化影响感知程度的指标,并基于理性经济人和社 会成本理论,从成本粘性视角探讨了人口老龄化对企业劳动力资源调整决策的影响及成因。 实证结果表明,人口老龄化会增加企业的劳动力成本粘性。原因在于企业对人口老龄化影响 的感知程度越高,越会出于承担社会责任的非经济动机使劳动力资源“易增难减”。且此效 应在国有企业和位于市场化程度较高地区的企业中更为显著。本文拓展了人口老龄化的经济 后果研究,为国家积极应对人口老龄化提供了微观层面的经验证据。此外,本文将文本分析 方法引入宏观环境与企业行为的研究,为未来该领域的研究提供了新思路。