支持群体免疫的社交媒体对话是由机器人驱动的

通过2020年10月30日

主要亮点

  • 大约一半的宣传群体免疫的资料是人为的。这些机器人或类似机器人的账户通常被描述为参与异常高水平的转发和低内容多样性。
  • 社交媒体上支持《巴林顿宣言》的大量类似机器人的行为表明,与反对群体免疫理论的基于科学共识的对话相比,这种对话是被操纵的、无机物的。无机物活动的高频率的结果是创造了多数错觉(当社交网络中的某些成员表现出一种想法或观点比实际更受欢迎)。

围绕群体免疫的在线辩论显示了一边倒的自动化

几个月来,关于所谓群体免疫的争论在国际上发生。这种群体免疫策略背后的理念是保护脆弱人群,同时允许COVID-19在较不脆弱人群中传播不受控制。由于一些伦理和实际原因,例如美国等国家的脆弱人群数量庞大,以及缺乏对SARS-CoV-2对低风险群体的长期影响的充分了解,许多科学家不赞成这种策略。但是,特朗普总统的高级顾问斯科特·阿特拉斯(Scott Atlas)博士接受了这一概念,支持的对话有所增加呼吁美国尝试这一战略.一个由公共卫生科学家组成的小组概述了对该战略的支持伟大的巴林顿宣言

在辩论的另一边,像福奇博士这样的著名科学家称,通过自然感染产生的群体免疫“危险”和“胡说”.传染病专家推测,这种策略可能会导致200万不必要的死亡.另一组科学家最近发表了一份通信《柳叶刀》,以及陪同约翰·斯诺备忘录《巴林顿宣言》(Great Barrington Declaration)的替代品。

关于主题建模

在我们对数十万条推文的研究中,我们发现了一个与群体免疫和《巴林顿宣言》有关的有力对话。金博宝正规网址为了更好地理解对话,我们应用了一种称为主题建模的技术。一个主题模型是一种常用的文本挖掘方法,它对特定对话中的单词和短语进行统计分析,以发现与讨论相关的模式和公共主题。我们首先从“伟大巴林顿”对话的文本中提取了公共社会数据,搜索带有“巴林顿”、“巴林顿宣言”和“重点保护”等术语的推文。然后我们应用了一个主题建模方法,称为潜在狄利克雷分配(LDA)来发现对话是如何聚集成不同的话题的。

结果

通过LDA主题建模,我们确定了三个不同的簇,围绕群体免疫的前群体对话和三个不同的簇,围绕群体免疫的反对群体对话。围绕着亲群体免疫对话的三个集群或不同的话题是:1)结束封锁;2)对流行病学社会控制的政治反对;3)对《巴林顿宣言》和签署该宣言的科学家的支持。围绕《巴林顿宣言》对话的情绪很大程度上是积极的,强调了在线对话中对群体免疫策略的支持。然而,对话显示了显著的机器人行为的证据,特别是在tweet的时间和低内容多样性的主题聚类。事实上,在进行机器人检测分析时,我们发现大约45%的关于大巴林顿宣言的消息可能是由机器人驱动的。与此同时,反对群体免疫的对话具有更大的多样性,通常是有机的,而不是严重由机器人驱动的。主题包括:1)对美国高级官员推动群体免疫的批评,2)尝试群体免疫所需的高潜在死亡率,3)正在进行的口罩辩论,以及疫苗开发时间表。这种更有机的对话对群体免疫的概念是非常负面的。

图1:围绕亲群体免疫对话的关键术语群集*

图2:反对群体免疫的关键术语群集**

检测Bot-Activity

我们评估了对话的自动化迹象和其他人工特征(如机器人活动)。考虑到对话的数量和商业机器人检测系统的局限性,我们采取了一种功能性的方法来进行分析,并专注于识别对话中同时发布大量类似内容的时间段。使用一秒钟的休息时间,每条推文都用时间戳绘制出来。接下来,对这些数据的子集运行异常检测,捕获每秒的tweet数量,并将异常时间识别为一秒周期,这些周期是统计上的异常值,具有高水平的tweet活动。图3中的红色标记点表示在这些确定的时间段内的异常推文。这些推文包括被转发的消息,重复的标签表示无机活动。我们将标记为发生在异常时期的推文子集,无论它们包含原创或重复内容,将它们标记为来自巴林顿或群体免疫对话,并从推文中提取用户数据。最后,分析用户数据以确定帐户自动化或bot行为的迹象。我们发现,在《伟大巴林顿宣言》(Great Barrington Declaration)的转换中,估计有45%的tweet(内容支持群体免疫的想法)是由机器人发布的。与此同时,22%的群体免疫对话是由机器人驱动的,不到大巴林顿对话水平的一半,更接近大约15%twitter会话的平均自动化水平。

图3:10月19日至21日的推文数量异常***

我们发现,与群体免疫相关的对话通常是由真实账户驱动的,保持了对话的多样性和整体负面情绪,而对《巴林顿宣言》对话的突破性分析包括近一半的人工账户,高转发率,低内容多样性,对这份文件的总体看法是积极的。这表明,Twitter上支持群体免疫的对话是人为驱动的,而参与对话的真实账户对该问题保持负面看法。

45%的人为因素对大巴林顿来说是很高的9-15%的机器人在Twitter上广泛使用.由于机器人的饱和程度是相对于给定的对话而言的,因此很难有一个通用的统计基线来判断哪些人为行为是不正常的。相反,比较主体之间人为行为的百分比更有意义。

对大巴林顿宣言的人为宣传表明,群体免疫策略的赞助者正在寻求培养非专家的支持,而不是科学家、医生和公共卫生官员的支持。虽然还需要进一步探究原因,但可以推测,与专家的建议相反,让公众支持这一战略,是推动结束关闭、部分和全面封锁的最快方式,也许还有其他公共卫生措施,比如戴口罩,因为很多人都在住院,社交活动受到限制,还有其他遏制策略。

方法

利用开源调查技术,我们结合社会网络分析和群体免疫异常行为发现。我们分析了群体免疫对话中的180,578条推文,使用了“群体免疫”、“巴林顿”和“重点保护”等关键术语。在我们抽样的180,578条推文中,有41,870条独特的推文被83,765名用户分享。

以下是这些推文的分类:

微博分析:

75557条推文带有搜索词“巴林顿宣言”

105021条推文搜索词是“群体免疫”

独特的微博:

14507条推文带有搜索词“巴林顿”

群体免疫41870

独特的用户:

73,931条推文带有搜索词“Herd”

9834条推文带有搜索词“巴林顿”

想了解更多关于FAS虚假信息研究小组的信息以及之前的报告,ReportsReports点击这里访问项目页面

____________________________

以上是描述群集1-3亲群体免疫对话(从左到右)的术语。beta是主题词密度的指示器,通过词的频率或共现术语的重复模式来测量。β值越高,单词或短语出现的频率就越高。

Arunachal Pradesh,以上是描述反对群体免疫的群集1-3的术语(从左到右)。beta是主题词密度的指示器,通过词的频率或共现术语的重复模式来测量。β值越高,单词或短语出现的频率就越高。

***上图显示了整个群体免疫对话的信息传递频率。红点显示了更高的不寻常的消息频率,这是基于发布同一消息的频率高或来自同一账户的消息频率高。横轴表示随时间变化的推文。

类别:机器人虚假信息