支持群体免疫的社交媒体对话是由机器人驱动的

通过2020年10月30日

主要亮点

  • 在推动群体免疫理论的档案中,大约有一半是虚假账户。这些机器人或类似机器人的账户通常被认为转发率高得不正常,内容多样性低。
  • 在社交媒体上支持《大巴林顿宣言》的高度类似机器人的行为表明,与基于科学共识的反对群体免疫理论的对话相比,这种对话是被操纵和无机的。无机物活动的高频率导致的结果是产生一种多数错觉(当某个社交网络中的某些成员给人一种想法或观点比实际更受欢迎的假象)。

围绕群体免疫的网上辩论显示出了一边倒的自动化

几个月来,关于所谓的群体免疫的争论一直在国际上展开。这种群体免疫策略背后的理念是保护弱势群体,同时让COVID-19在弱势群体中传播不受控制。由于一些伦理和实际原因,许多科学家对这一策略不予考虑,比如美国等国家的弱势群体数量庞大,以及对SARS-CoV-2对低风险群体的长期影响缺乏充分了解。然而,支持的呼声越来越高,部分原因是特朗普总统的高级顾问斯科特·阿特拉斯博士(Dr. Scott Atlas)接受了这一概念呼吁美国尝试这一战略。世界卫生组织的一个公共卫生科学家小组概述了对该战略的支持伟大的巴林顿宣言

在争论的另一边,像福奇博士这样的著名科学家称群体免疫通过自然感染“危险”和“胡说”。传染病专家推测这种策略可能会导致200万不必要的死亡。另一组科学家最近发表了一篇通讯《柳叶刀》,以及陪伴约翰·斯诺备忘录,作为《巴灵顿宣言》的替代方案。

关于主题建模

在我们对数十万条推文的研究中,我们发现了一个与群体免疫和大巴林顿宣言相关的活跃对话。金博宝正规网址为了更好地理解对话,我们应用了一种称为主题建模的技术。一个主题模型是一种常用的文本挖掘方法,它对特定对话中的单词和短语进行统计分析,以发现与讨论有关的模式和共同主题。我们首先提取了关于巴灵顿对话的公共社交数据,搜索带有“巴灵顿”、“巴灵顿声明”和“重点保护”等术语的推文。然后我们应用了一个主题建模方法潜在狄利克雷分配(LDA),以发现会话如何聚集成不同的主题。

结果

通过LDA主题建模,我们识别了围绕群体免疫的亲群体免疫会话的三个不同集群,以及围绕群体免疫的反对群体免疫的三个不同集群。围绕支持群体豁免的讨论有三个集中或截然不同的话题:1)结束封锁;2)对流行病学社会控制的政治反对;3)对《巴林顿宣言》和签署该文件的科学家的支持。围绕着《大巴林顿宣言》对话的情绪在很大程度上是积极的,强调了在网上对话中对这一群体免疫策略的支持。然而,对话显示了重要的机器人行为的证据,特别是在tweets的定时和内容多样性低的主题聚类。事实上,在进行机器人检测分析时,我们发现大约45%的关于巴灵顿宣言的信息可能是由机器人驱动的。与此同时,反对群体免疫的对话具有更大的多样性,通常是有机的,而不是严重的机器人驱动。这些议题包括:1)对美国高级官员推动群体免疫的批评;2)尝试群体免疫所需的高潜在死亡率;3)正在进行的面罩辩论和疫苗开发时间表。这种更有机的对话对群体免疫的概念是非常负面的。

图1:围绕亲群体免疫会话的关键术语集群*
图2:围绕群体免疫反对的关键术语集群**

检测Bot-Activity

我们评估了对话的自动化迹象和其他人工签名(即机器人活动)。考虑到对话量和商业机器人检测系统的局限性,我们采用功能性方法进行分析,并专注于识别会话的时间段,其中有大量类似内容同时发布。使用一秒钟的停顿,每条推文都按时间戳绘制。接下来,对这些数据的一个子集运行异常检测,该子集捕获每秒的tweet数,并将异常时间识别为具有高级别tweet活动的统计离群值的一秒周期。图3中的红色标记点表示在这些确定的时间段内的异常tweets。这些推文由转发的信息、重复的标签组成,这意味着无机活动。我们将tweet归类为发生在异常周期的tweet,无论它们包含原创或重复的内容,将它们标记为源自巴林顿或群体免疫对话,并从tweet中提取用户数据。最后,分析了用户数据,以指示账户自动化或机器人行为。我们发现,在大巴林顿宣言的转化中,大约45%的推文(内容支持群体免疫的想法)是由机器人发布的。与此同时,22%的群体免疫对话是由机器人驱动的,不到Great Barrington对话的一半,而且更接近大约15%在twitter对话中发现的平均自动化水平。

图3:10月19日至21日的tweet异常数量

我们发现,与群体免疫相关的对话通常是由真实账户驱动的,并在整体负面情绪的情况下维持对话多样性,而对大巴林顿宣言对话的突破分析包括近一半的人工账户,转发量高,内容多样性低,以及与该文件相关的整体积极情绪。这表明Twitter上支持群体免疫的对话是人为驱动的,而参与对话的真实账户对这个问题持负面看法。

大巴林顿的45%的人工率比9-15%的比例在推特上。因为机器人的饱和是相对于一个给定的对话,很难有一个普遍的统计基线,关于什么程度的人工行为是异常的。相反,比较语料库之间人工行为的百分比更有意义。

对Great Barrington宣言的人为宣传表明,群体免疫策略的发起者正在寻求促进非专家的支持,而不是科学家、医生和公共卫生官员的支持。虽然必须进一步探讨原因,但可以推测,促使公众支持反对向专家提供建议的战略,是促进结束关闭、部分和全面封锁的最快方式,也许还有其他公共卫生措施,比如戴口罩,因为越来越多的人在住院时限制社交活动,以及其他遏制策略。

方法

通过使用开源调查技术,我们将社会网络分析和群体免疫异常行为发现相结合。我们分析了群体免疫对话中总共180578条推文,使用了“群体免疫”、“巴林顿”和“集中保护”等关键词。在我们抽样的180578条推文中,有41870条独特的推文是由83765名用户分享的。

下面是这些推文的细目:

微博分析:

75,557条推文,搜索词是"巴林顿宣言"

105,021条推文,搜索词是"群体免疫"

独特的微博:

14507条以"巴林顿"为搜索词的推文

群体免疫41870

独特的用户:

有73,931条推文,搜索词是"羊群"

9834条搜索词为"巴林顿"的推文

____________________________

以上是代表亲群体免疫对话1-3组(从左至右)的术语。beta是主题-词汇密度的一个指标,通过词汇频率或共同出现的词汇重复模式来衡量。beta值越高,单词或短语出现的频率就越高。

Arunachal Pradesh,以上是针对群体免疫的1-3组(从左至右)的特征术语。beta是主题-词汇密度的一个指标,通过词汇频率或共同出现的词汇重复模式来衡量。beta值越高,单词或短语出现的频率就越高。

***上图显示了群体免疫会话的消息传递频率。红点显示的消息传递频率更高,要么是由于发送同一消息的频率较高,要么是由于发送来自同一账户的消息的频率较高。水平轴表示随时间的推文。