首页  -  成果展示  -  详细
基于语义扩展的微博突发事件检测技术  
我有意向    2021-07-14    浏览:256  
技术简介
评估价值
技术图片
成熟度证明
成果水平评价图片
微博的社会化特性及其可以被迅速、及时的传播,吸引了大量对信息实时性有高需求的网民。尤其是在突发事件的信息传播上,微博更是超越了传统媒体,成为了信息快速传播的渠道。微博上的信息不仅发布及时,而且也是现实社会生活的缩影,挖掘微博上的信息有利于从不同角度分析现实世界的情况。因此,从海量的微博数据检测事件具有十分重要的意义。
现有技术中的微博事件检测的方法可以分为两类,一类是针对特定事件的微博事件检测方法,一类是通用的微博事件检测方法。对于特定事件的微博事件检测方法,通常需要对事件一定的先验知识,比如针对地震事件,通过地震相关的关键词找出相关微博,对这部分微博进行分析,但是对于突发事件很难具有先验的信息,因此,该种微博事件检测方法具有很强的局限性。对于通用的微博事件检测方法不需要事件的先验知识,主要包括基于突发特征检测、主题模型、聚类或者图的方法,但是这些方法普遍需要离线检测,不能处理流式数据。本成果提供一种基于语义扩展的微博突发事件检测技术,以解决上述问题。
本成果提供的基于语义扩展的微博突发事件检测技术包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度。本技术的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测。



客服一
客服二
客服三
客服四
扫一扫

扫一扫
关注中索微信号

全国免费服务热线
400-8768-599

顶部
CopyRight 2017-2021 版权所有     北京中索知识产权代理有限公司     鲁ICP备18054588号-1    技术支持:山东中索鼎峰知识产权服务有限公司