由我院姜富伟教授和北京大学经济学院博士生孟令超(我院2019届卓越项目本科生)、湖南大学金融与统计学院助理教授唐国豪(我校博士生毕业)合作撰写的论文《媒体文本情绪与股票回报预测》被《经济学(季刊)》正式接受。
本文探究了财经媒体文本情绪与股票市场资产价格之间的预测关系。本文综合使用了Loughran and MacDonald(2011)词典、word2vec算法和人工筛选等方法构建了一个全新的中文金融文本情感词典(可以在https://github.com/MengLingchao/Chinese_financial_sentiment_dictionary下载),然后用该词典提取了股票市场的媒体文本情绪。本文发现媒体文本情绪可以很好地衡量我国股票市场投资者情绪的变化,该指标在样本内和样本外都对股票回报具有显著的预测能力。这一指标的预测能力强于常用的宏观经济指标或历史均值预测。此外,媒体文本情绪指标对一些宏观经济指标也有显著的预测能力。
本文的主要创新点是构建了中文金融情感词典。金融领域的文本分析大多使用情感词典,但是当前的中文情感词典均为通用情感词典,在金融语境下适用程度有限,目前仍缺乏一个广泛接受的、专业的、开源的金融情感词典。本文通过将英文的LM词典转化为中文版本,从现有的中文通用情感词典中筛选出适合金融语境的词语,以及利用word2vec算法从文本语料中挖掘情感词语等三种方法构建了最终的中文金融情感词典。随后,本文利用多种方法将其与现有情感词典进行对比,证明了本文所构建的词典具有更强的适用性与优良性。
本文接下来应用本文构建的金融情感词典与文本分析技术构建了我国股票市场媒体文本情绪指数。文本情绪指数与文本情绪分析技术具有以下四个突出优点:(1)相较于可公开获得的金融市场交易数据,文本情绪信息互补性强,在以往的资产定价研究中往往被忽视。因此,使用文本分析方法研究情绪对资产定价的影响有发现新结论的潜在可能。(2)文本数据规模极大,从这一海量数据来源中聚合情绪信息有利于减少以往的情绪测量误差。(3)文本情绪属于直接情绪测度。(4)考虑到文本数据更新的高频性,我们有机会构建日频甚至分钟频率等更高频的情绪指数。
随后,本文检验了该情绪指数对股票市场的预测能力。结果显示,文本情绪指标在样本内与样本外都可以显著地正向预测股票市场回报,并且预测能力不弱于常见的经济指标。此外,文本情绪指标对于资产配置也有着重要作用。这些结果都表明文本情绪指标在现实投资实践中有着较强的应用的价值。
本文最后还探究了文本情绪预测能力的来源与作用机制。本文首先发现媒体文本情绪可以显著地影响投资者对宏观经济的预期,而投资者会根据预期调整金融市场参与程度,从而让市场回报产生相应的反应。接下来本文还发现基于风险补偿的理论并不能很好地解释文本情绪的预测能力,说明这一指标对股票产生影响的方式更加符合De Long, Shleifer, Summers, and Waldmann(1990)噪音交易者模型中的非理性传播渠道。