华南理工大学学报(自然科学版) ›› 2012, Vol. 40 ›› Issue (8): 82-87.
周亦鹏1 杜军平2
Zhou Yi-peng1 Du Jun-ping2
摘要: 针对现有的主题模型不能随时空情境准确反映主题的周期变化和空间分布的问题,根据互联网信息通常包含发布时间地点等情境数据的特点,提出一种用于主题跟踪的时空情境主题模型. 首先将数据集的多主题分布与时空信息关联起来建立时空情境主题模型,对主题周期和强度进行描述; 然后通过EM 算法估计模型参数,利用该参数分别计算主题快照和主题周期; 最后利用时序相似度计算判断后续主题信息,实现主题跟踪. 食品安全事件主题跟踪的实验表明: 与单纯依赖文本特征的主题跟踪方法相比,文中提出的方法能够明显提高跟踪效率和多个主题的跟踪准确性,这有助于进一步实现精准的主题信息检索.