[读论文]懒价格

COHEN, L., MALLOY, C. and NGUYEN, Q. (2020), Lazy Prices. The Journal of Finance. Accepted Author Manuscript. doi:10.1111/jofi.12885

哈佛商学院Lauren Cohen的这篇Lazy Prices,2018年放在NBER上,现在已经被Journal of Finance接收了。这篇文章的题目就挺吸引人的,故事也是蛮精彩。

文章的核心故事是说,公司会对会计文本信息进行更改,包括高管对企业经营状况描述的措辞方式会发生转变,而这些变化与公司股价和未来经营情况都是显著相关的。甚至于,如果在Fama-French五因子的基础上,卖出信息变化的股票并买入信息不变的股票,构建的这一投资组合可产生年化22%的alpha收益!

从三个方面简单总结一下这篇文章的主要工作:

度量披露信息的变化

作者从SEC的EDGAR系统中提取了1995年到2014年所有的常规季度披露信息(10-K,10-Q等)的电子文件。将其中数字字符数量占比大于15%的段落去除,留下文本内容。作者使用了四种自然语言处理(NLP)领域的常见方法来度量季度披露信息之间的相似度:

(1)余弦相似度(cosine similarity),即文本的单词向量之间的夹角,夹角越小表示文本相似度越高。

(2)Jaccard similarity,即文本单词向量的交集的长度除以文本向量集合的并集的长度,如果两段文本全无相同单词,其交集长度为0,相似度即也为0。

(3)MED(minimum edit distance)度量,即将一段文本编辑为另外一段所需要的最少编辑次数,次数越少则相似度越高。

(4)简易相似度(simple similarity),即将第一段文本改写为第二段文本所需要的单词增加、单词删减以及单词改写的次数相加,除以两段文本的长度的和,再将以上度量标准化。

相似度越高,则披露信息的变化越少,代表公司是“懒”的。

此外文章中还用到了文本情绪(sentiment)的分类,代理变量的构建是通过Loughran and McDonald’s (2011) Master Dictionary(https://sraf.nd.edu/textual-analysis/resources/)统计出具有“负面”、“正面”、“不确定”、“有争议”、“强烈情绪”、“弱项情绪”以及“拘束”等情绪的单词的数目。

信息披露行为变化导致的价格变化

按照相邻时间季报的相似程度,作者将股票池分为了5份,其中Q1是相似度最低的,Q5是相似度最高的,检验Q5资产收益与Q1的差值,显著为正。且作者控制了Fama-French的三因子与五因子,投资组合仍保有超额收益。

尤其当采用Fama-French三因子作为控制变量,用Jaccard similarity作为相似度的度量,得到的超额收益高达年化22%。

作者在该部分也按照学术惯例做了特征分析以及Fama-MacBeth。

信息披露的影响机制

进一步探究信息披露行为的变化是如何影响到股价的。

通过固定效应模型(固定了公司和时间),作者研究文本相似度与文本情绪之间的关系,发现信息披露的变化与如下情绪指标相关:负面情绪,高不确定性,更多争议,更常提及CEO或CFO变化。

由于美国SEC的披露公告是分为几个section的,作者进一步研究了每个section信息披露变化的股价预测能力。

本文还有个大招,就是向SEC申请获得了下载报表的所有行为的时间戳以及部分IP地址,以此构建了一个“对企业公告的关注程度”的代理变量。通过这个代理变量构建交叉项,作者指出获得更多关注的年报,其披露行为的变化带来的股价预测能力将被削弱。这和本文的故事是一致的。

此外的细节就不赘述了。

一点启示

本文所研究的是一种模糊的信息,其对资产价格的影响也就有很长的滞后性,对市场的影响却是潜移默化且显著的。可见零碎信息中蕴含的潜力。

posted @ 2020-02-03 14:51  谢寻星  阅读(204)  评论(0编辑  收藏  举报