International Alliance for COVID-19 Community Response
社  区  应  对  新  冠  肺  炎  国  际  网  络

基于自然语言处理技术的CoViD-2019事件中的公众情感分析

Issuing time:2020-04-02 20:42Author:李雪娇Source:陈安看世界Link:https://mp.weixin.qq.com/s/RWPKKni_5ZNRLrIC6u2inw

社会新闻总是随着突发事件的变化而层出不穷,尤其是那些容易引发公众情感的新闻。2019年底到2020年初的CoViD-19疫情中出现了大量新闻,引起了公众的持续关注。

  以“李文亮”、“火神山医院”、“钟南山”、“封城”、“唐志红”为关键词的百度搜索趋势对比,可以看出,蓝色曲线的峰值点为以“李文亮”为关键词的最高搜索指数,该点出现在2020年2月7日(如图1),在这一点上公众在百度网页的搜索频次达到了5007063次。搜索行为反应公众的关注。那么什么类型的事件容易引起关注,在引发强烈关注的热点新闻中,公众的情感态度又是怎样的呢?这是本文试图探讨的问题。

4.1.jpg

图1. 以“李文亮”、“火神山医院”、“钟南山”、“封城”、“唐志红”为关键词的百度搜索趋势对比. 2020年1月19日-2020年3月3日(来源:百度指数)

  本文选取的研究对象为微博上的热点新闻。首先收集月热搜榜上的热门话题,然后查阅2020年1月19日及之后的微博周热搜榜,接着从微博关键词热搜榜中选取近期受到强烈关注的热点新闻,并删除与新冠肺炎不相关的内容。最后通过对以上事件的筛选和整理,选出了人们热切关注的10个关键词,并逐一搜索这10个关键词,从每个关键词所代表的多条新闻中,按照评论、转发、点赞数量选出关注度最高的新闻,整理如下表。

4.2.jpg

选择每条热点新闻下热度为前20以内的评论作为分析文本。这是因为评论的热度是按照读者的点赞数来评判的,热度越高的评论在读者中的认可度越高,越能代表公众情感。接着用自然语言处理技术进行句子级情感分析,对每个评论语句逐一分析,判断其情感极性及强度,然后求得期望值,获得整个评论文本的情感强度。最后为了了解公众在评论中主要谈论的内容是什么,对所选的评论文本进行关键词提取。将得到的结果按情感极性和情感强度排序,呈现在表2中。

4.3.jpg

可以看出,公众情感极性为正向,情感强度由强到弱的新闻关键词依次为:李文亮、火神山医院、请战书、封城、钟南山;情感为负向,情感强度由强到弱的新闻关键词依次为:武汉红十字会、居家隔离、湖北防控工作、不戴口罩、唐志红。表2中从1至10的排名,体现了公众情感从积极到消极的变化。

  从以上的数据可以发现,此次疫情事件中:

  (1)公众对非官方的典型人物(钟南山、李文亮)和普通个体(建筑工人、请战医生)表现出了极强的正向情感。

  (2)公众对封城行为表示理解和支持,但对于被限制出行,无法正常生活、工作的情况依然表现出不满。

  (3)公众对湖北省此次疫情防控工作、典型人物(唐志红)和典型机构(武汉红十字会)均表现出消极评论,由于典型人物与机构均在湖北省管辖范围内,对这三者的负面情绪可能相互影响。

  (4)年轻群体对长辈不戴口罩的行为产生负面情绪,且该负面情绪是普遍的,体现两代人而非个体之间的意识和行为方式的冲突。