多潜在变点主题模型下的社交媒体内容变化捕捉 Innocentius | PhD Candidate In Management Science

先上参考文献:

Zhong N, Schweidel DA (2020) Capturing Changes in Social Media Content: A Multiple Latent Changepoint Topic Model. Marketing Science 39(4):827–846.

UTD-24的Marketing Science文章,文章写的非常的华丽,但同时也亲民易懂,这可能就是UTD和其他期刊的不同之处吧。

第一稿提交是2016年,距离目前已经有些距离了,但是至今为止对于这个领域的研究并不算是特别充分。这篇文章的主要贡献点是设计出了可以检测社交媒体中的关键事件转折点,并基于自己设计的LDA-MLC方法对社交媒体的相关信息进行动态建模,从而得知转折点发生了什么。文章的绝大部分文笔都在于案例研究(超过65%),举了大众汽车2015年丑闻事件的例子,另外又有两个偏小的案例,进而证明方法的可用性。

我看这篇文章主要的关注点在于,为什么不用DTM?我们知道Dynamic Topic Modeling能够起到很类似的作用,但是文章认为尽管DTM能起到相类似的作用,多个潜在变点使用更简单,并能捕捉更长时间的变化信息。作者认为在一个customer relationship的角度,基于连续变化的DTM可能不如基于discrete state的Latent timepoint好用。这一点我认为作者说的没错,但是仅限于customer relationship。信息疫情这个问题和customer relationship完全不同,可能一天之内会产生数个变化点,而且变化十分迅速,这样的情况下,DTM的连续变化更合适。实际实验当中,DTM在短期的forecast task的表现仍然优于LDA-MLC,也进一步的说明了DTM连续变化的优越性。