厦门免费医学论文发表-网络仇恨言论、错误信息和一般心理健康的拓扑数据映射:基于大型语言模型的研究

2025-07-31

厦门免费医学论文发表-网络仇恨言论、错误信息和一般心理健康的拓扑数据映射:基于大型语言模型的研究

安德鲁·威廉·亚历山大 ,王洪斌


抽象

社交媒体的出现导致人们越来越担心其传播仇恨言论和错误信息的可能性,除了助长偏见和歧视外,还被怀疑在美国增加社会暴力和犯罪方面发挥了作用。虽然文献表明,在网上发布仇恨言论和错误信息与海报的某些性格特征之间存在关联,但在线仇恨言论/错误信息在海报整体心理健康背景下的一般关系和相关性仍然难以捉摸。一个困难在于找到能够充分分析大量社交媒体帖子以发现潜在隐藏链接的数据分析工具。机器学习和 ChatGPT 等大型语言模型使这种分析成为可能。在这项研究中,我们从社交媒体网站 Reddit 上精心挑选的社区收集了数千条帖子。然后,我们利用 OpenAI 的 GPT3 来推导出这些帖子的嵌入,这些帖子是高维实数向量,可能代表帖子的隐藏语义。然后,我们根据这些嵌入执行了各种机器学习分类,以确定仇恨言论/错误信息言语模式与不同社区的言语模式之间的潜在相似性。最后,将拓扑数据分析(TDA)应用于嵌入,以获得连接在线仇恨言论、错误信息、各种精神疾病和一般心理健康的可视化地图。


作者总结

社交媒体的出现导致人们越来越担心其传播仇恨言论和错误信息的可能性,除了助长偏见和歧视外,还被怀疑在美国增加社会暴力和犯罪方面发挥了作用。虽然文献表明在网上发布仇恨言论和错误信息与发帖者的某些性格特征之间存在关联,但在线仇恨言论、错误信息和一般心理健康之间的一般关系仍不清楚。在这项研究中,我们收集了社交媒体网站 Reddit 上来自错误信息、仇恨言论和精神疾病社区的数千条帖子。然后,我们使用机器学习方法分析每个社区帖子的言语模式,然后确定哪些精神疾病社区的言语模式与仇恨言论或错误信息的言语模式最相似。我们发现,仇恨言论社区的言语模式与反社会人格障碍、边缘性人格障碍、自恋型人格障碍、精神分裂样人格障碍和复杂创伤后应激障碍社区中的言语模式最相似。对于错误信息社区,他们最相似的社区是我们的对照社区,尽管与焦虑症社区有一定程度的相似性。


数字

Fig 11表1表2表3表4图1图2表5Fig 3Fig 4Fig 5Fig 6Fig 7Fig 8Fig 9Fig 10图11表1表2表3

     

引文: Alexander AW, Wang H (2025) 在线仇恨言论、错误信息和一般心理健康的拓扑数据映射:一项基于大型语言模型的研究。PLOS 数字健康 4(7): e0000935。 https://doi.org/10.1371/journal.pdig.0000935


编辑 器: Amara Tariq,妙佑医疗国际,亚利桑那州,美利坚合众国


收到: 2024 年 5 月 31 日;接受: 2025 年 6 月 24 日;发表: 7月 29, 2025


版权所有: © 2025 Alexander, Wang.这是一篇根据知识共享署名许可条款分发的开放获取文章,允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。


数据可用性: 本研究中使用的数据集和代码可在以下网址获得:www.github.com/Andrew7178/TopologicalDataMappingOnlineHateSpeechMisinformationGeneralMentalHealth。


资金: AWA 是巴勒斯惠康基金学者,并获得了德克萨斯 A&M 大学医师科学家学院 (https://www.bwfund.org/funding-opportunities/biomedical-sciences/physician-scientist-institutional-award/grant-recipients/) 的巴勒斯惠康基金医师科学家机构奖 (G-1020069) 的支持。资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用。HW 没有获得这项工作的具体资金。


利益争夺: 提交人声明不存在竞争利益。


介绍

社交媒体的出现导致人们越来越担心社交媒体论坛可能助长仇恨言论,文献中将仇恨言论定义为“使用攻击性语言,专注于共享共同财产的特定人群”[1]。在线仇恨言论在线下会助长社会的偏见和歧视,更严重的是,社交媒体对仇恨言论的允许导致Facebook等公司被联合国指控助长种族灭绝[2,3]。社交媒体上的仇恨言论也被怀疑在美国的社会暴力和犯罪中发挥了作用。暴力政治言论与大规模枪击事件之间已建立正相关关系[4]。


同样,社交媒体已被证明是错误信息的有力载体。错误信息被定义为与科学界共识相反的信息,被认为是社交媒体上仇恨言论的一个促成因素[5,6]。此外,它还导致了疫苗、药物、流行病、饮食失调和医疗等多个医学领域的混乱和不信任,从而产生了另一种可能对社会产生负面影响的媒介[6]。


仇恨言论可以说部分是由于缺乏对他人的同理心造成的,在某些情况下的错误信息也是如此。考虑到这一点,已经有研究调查了仇恨言论/错误信息与黑暗三合会人格特征之间潜在关系,并建立了正相关关系[7,8]。自恋、马基雅维利主义和精神病的黑暗三合会人格特征与《精神疾病诊断和统计手册》定义的 B 类人格障碍有很大程度的重叠 5th DSM-5版,提示这些疾病也可能与仇恨言论/错误信息有关[9,10]。


然而,网络仇恨言论和错误信息与精神疾病和/或个人整体心理健康的一般关系肯定是错综复杂的,并且仍然难以捉摸。虽然黑暗三合会人格特征与B类人格障碍有实质性相关性,但它们不一定是完全相同的结构[9]。因此,他们最终可能与仇恨言论和错误信息有不同的关系。此外,B类人格障碍仅涵盖DSM-5中列出的一小部分疾病,这意味着可能还有其他可能与仇恨言论或错误信息有关的精神疾病[10]。最后,仇恨言论和错误信息与单个发帖者的总体精神状态和心理健康有何关系?如果能够在心理健康的整体背景下识别隐藏的精神疾病或带有错误信息或仇恨言论的特征,那么所获得的知识可用于实施更普遍和更有效的反击策略来打击仇恨言论或错误信息。


人工智能(AI)和机器学习(ML)提供了解决这些问题的工具[11\u201213]。特别是,以GPT3和ChatGPT[14\u201216]为代表的大型语言模型(LLM)已被证明在理解自然语言和执行各种自然语言处理任务方面特别强大。LLM的主要特征之一是通过大规模预训练Transformer神经网络[17\u201218]来学习任何文本输入的上下文相关表示,称为嵌入。在 GPT3 的情况下,这样的嵌入是一个 1536 维实值向量。这些嵌入近似于文本输入语义的计算机友好表示,因此可用于下游任务,例如文本分类、摘要和问答。例如,在所谓的零样本分类[19]中,LLM可用于通过简单地计算和比较输入的矢量距离和预先指定的类标签来对任何输入进行分类。


这项工作的目的是利用法学硕士研究在线仇恨言论和错误信息在海报一般心理健康背景下的相关性。特别是,我们从 Reddit 中精心挑选的一组社区收集了数千个在线帖子。然后,我们使用 GPT3 推导出这些帖子的嵌入。我们使用零样本分类探索仇恨和错误信息与特定精神疾病的相关性。最后,为了更深入地了解心理健康背景下的仇恨言论和错误信息,我们对这些嵌入进行了拓扑数据分析(TDA),以获得数据集的总体拓扑映射[20\u201222]。该地图提供了心理健康空间形状的快照,以及该空间内精神疾病、仇恨言论和错误信息之间的关系。


方法论

社交媒体选择

我们选择利用社交媒体网站 Reddit 作为我们从中获取嵌入内容的来源。Reddit 在过去和现在都有大量与错误信息和仇恨言论相关的社区,这使其成为我们目的中这些数据的绝佳存储库 [23]。此外,Reddit 被拆分为“subreddits”,这些子版块实际上是专门针对特定主题的社区 [24]。这对我们的研究是有益的,因为它允许存在专门针对特定精神疾病的社区,这些社区通常会自我选择患有相应疾病的成员。此外,Reddit 具有匿名的优势;Reddit 用户名与个人姓名无关,只有当用户希望泄露身份信息时,他们才会在 Reddit 上泄露身份信息 [24]。这在收集精神疾病数据时具有重要价值,因为如果无法匿名,污名化可能会阻止个体进行公开讨论[25]。


社区选择

总共选择了 54 个社区,这些社区可能与四个不同的类别相关:仇恨言论、错误信息、精神疾病(由我们从中获得嵌入的社区代表的每种精神疾病都有子类)和对照组(表 1)。Reddit 上的仇恨言论和错误信息社区是根据其在先前文献中的指定或 Reddit 管理部门因仇恨、暴力或错误信息而被禁止或隔离的记录来选择的 [26\u201242]。如果一个社区可以被视为同时传播仇恨言论和错误信息,我们会根据个人评估对其进行分类,以确定哪个是该社区更主要的主题。被确定为代表精神疾病的社区主要基于他们自己的声明本身和对帖子的个人评估,以确定这是社区的真正目标。如果社区不符合任何其他类别的标准,则被视为对照社区。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

表 1. 用于嵌入创作的 Reddit 社区。

https://doi.org/10.1371/journal.pdig.0000935.t001


嵌入类型:单个用户帖子嵌入和蒸馏嵌入

我们区分了两种类型的嵌入:“个人用户帖子”(IUP)嵌入,基于每个单独的帖子创建,以及“提炼”嵌入,基于单个社区内多个用户的帖子聚合创建。推导提炼嵌入的原因是为了获得社区的平均表示,从而稀释个人独特语音模式的影响。单个用户的独特语音模式是唯一的,在聚合后无法脱颖而出,而社区的特征语音模式会因其存在于大量用户中而变得更具影响力。从这个意义上说,我们正试图创建比 IUP 嵌入所能提供的更能代表精神疾病和仇恨言论/错误信息社区的嵌入。


嵌入生成

从“Reddit 子版块评论/提交 2005-06 至 2022-12”学术洪流中选择的 54 个社区中,每个社区总共提取了 1000 个帖子 [43]。具体来说,我们从 2022 年 9 月 15 日开始撤下帖子,并向后工作,直到收集到 1000 个最旧的帖子。为了尽量减少偏见的引入,职位的年龄是确定收集哪些职位的唯一标准。帖子的受欢迎程度或知名度没有被考虑在内。每个帖子使用的文本数据由用于标题的文本和作者在帖子本身中使用的文本组成。


来自社区的单个帖子被串联起来以得出蒸馏的嵌入。仇恨言论/错误信息社区收到了蒸馏嵌入,但没有收到 IUP 嵌入,因为这两个嵌入类仅在零样本分类分析中稍后使用,它们作为完全由蒸馏嵌入组成的测试数据。对于精神障碍社区,我们选择尽可能获得多个社区的蒸馏嵌入,而不是每个疾病一个社区。这背后的理由有三个:首先,声称代表某种疾病的社区总是有可能实际上并不代表它。其次,一个社区可以发展自己的行话和言语模式,这些行话和言语模式将独立于精神疾病本身。引入可能具有不同社区特定特征的其他社区可能会减轻这种影响。虽然我们创建了精神疾病社区的IUP嵌入,但我们没有将这种多社区治疗应用于精神疾病的IUP嵌入,因为我们认为它们本质上已经为个体特有的言语模式赋予了额外的权重(因此,使其他消除独特言语模式影响的尝试相当无效)。


许多基于 Transformer 的 LLM 可用于生成文本嵌入,包括 GPT、BERT 和 LLAMA。我们选择了OpenAI的GPT3嵌入模型[44],因为它的简单性和稳健性。具体来说,使用名为text-embedding-ada-002 [44]的嵌入引擎为每个文本输入生成嵌入,作为1536维的向量。鉴于引擎对最大允许令牌长度的限制 (<8192),如果社区的 1000 个帖子集对于单个蒸馏嵌入来说太大,则将其拆分为多个蒸馏嵌入。我们努力确保在发生这种情况时,单个帖子的内容不会被拆分到多个提炼嵌入中。由于不同的社区和帖子的文本复杂性不同,因此标记数量也不同,这导致社区具有不同数量的蒸馏嵌入(表 1)。对于 IUP 嵌入,从选定的社区收集了一组 50 个帖子,从 2022 年 9 月 15 日开始像以前一样倒推。


零样本分类

零样本分类是指要求机器学习模型将数据准确分类为训练过程中从未遇到过的类。这种方法依赖于利用有关看不见的类的语义知识,通常通过自然语言描述或其他上下文线索。零样本分类在获取每个类的标记数据不切实际的情况下特别有价值,允许模型泛化到其初始训练集之外。


零样本分类是一种分类任务形式,其中模型首先在包含一组标签(或在本例中为嵌入)的数据上进行训练,而不是作为分析目标的标签。相反,在训练模型以识别这些其他标签后,然后要求模型对包含目标标签的数据进行分类,而不知道该标签的存在。这会强制模型将排除标签中的数据分类为属于与它最相似的训练标签。


出于本研究的目的,训练了逻辑回归模型,以根据嵌入对控制和精神疾病社区进行分类。然后将训练好的模型应用于来自仇恨言论和错误信息社区的嵌入,然后将其分类为属于言语模式最相似的精神疾病或对照社区。


执行了四个零样本分类任务,以探索不同嵌入类型和仇恨言论/错误信息与障碍的相互作用(表 2)。这些零样本分类任务背后的目标是双重的:首先,来自仇恨言论和错误信息社区的嵌入和言语模式与对照社区或精神疾病社区的嵌入和言语模式更相似。其次,并非所有精神疾病都是一样的,因此,在这些零样本分类中,精神疾病嵌入被分成单独的标签,以更好地识别哪些与仇恨言论和错误信息最相似。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

表 2. 零样本分类任务。

https://doi.org/10.1371/journal.pdig.0000935.t002


执行分类任务 1 和 2 的目的是评估 IUP 和蒸馏嵌入的最佳组合,以便在对仇恨言论/错误信息进行零样本分类时使用。具体来说,分类任务 1 是使用 IUP 嵌入作为训练数据和蒸馏嵌入作为测试数据的精神疾病嵌入的分类,分类任务 2 反之亦然。


根据分类任务 1 和 2 的结果,分类任务 3 和 4 被设置为总共 14 个仇恨言论和错误信息社区的提炼嵌入的零样本分类。使用零样本分类时,模型不会获得来自仇恨言论或错误信息社区的任何嵌入作为训练数据,并且这些嵌入构成了模型的全部测试数据;因此,它被迫将仇恨言论和错误信息嵌入归类为更接近精神疾病蒸馏嵌入或对照蒸馏嵌入。由于担心两者之间精神疾病的分类可能不同,似乎只致力于错误信息而不是错误信息和仇恨言论组合的社区与仇恨言论社区分开分类。


拓扑数据分析

从 LLM 派生的文本嵌入通常是非常高维的(在我们的例子中为 1536 维)。虽然这种高维度有助于捕获任何给定文本输入的复杂隐藏语义,但它也降低了传统统计方法(例如多变量线性回归)和数据可视化的有效性。为了进一步查明仇恨言论/错误信息与心理健康一般背景下精神疾病之间的关系,我们进行了 TDA 以探索派生嵌入的全局形状。一般来说,TDA 是一种无监督机器学习方法,擅长处理高维数据 (20,21,22)。与主成分分析等线性模型难以保留高维数据集的形状不同,TDA 可以通过系统且合理的方式将高维数据集投影到低维空间来捕获非线性。例如,在Mapper[45]中,高维数据集首先通过过滤函数投影到低维空间中。在较低的维度中,数据被分割成几个重叠的部分,称为覆盖物。然后在每个覆盖物中执行聚类,然后共享数据点的生成聚类(称为节点)通过边连接。通过这样做,Mapper 能够在不牺牲非线性的情况下生成数据全局形状的可视化表示。


我们使用Mapper Interactive生成了蒸馏嵌入的TDA映射[46]。首先,进行主成分分析,提取前两个主成分作为Mapper的二维滤波函数。两个维度都使用了 10 个封面,每个封面有 50% 的重叠度。对于我们的聚类算法,我们以 0.5 eps 和 2 个最小样本使用 DBSCAN。


结果

分类 1 和 2:将单个用户帖子和蒸馏嵌入作为训练和测试数据进行交叉比较

在这里,我们试图评估在 IUP 嵌入上训练的模型将如何对蒸馏嵌入进行分类,反之亦然。当使用IUP嵌入进行训练时,对精神疾病嵌入的评估显示出极好的准确性(86%的准确率),而蒸馏嵌入则难以充分分类单个帖子,准确率为45%(表3-4,图1-2)。检查表明,在蒸馏嵌入上训练的模型对 IUP 嵌入进行分类时发现的许多不准确之处归因于经常将嵌入错误分类为物质使用障碍。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

表 3. 使用使用单个用户后嵌入训练的模型分类的蒸馏嵌入的分类报告。在这种情况下,精度相当于阳性预测值。召回相当于敏感性。f1 分数是精度和召回率的谐波平均值。支持是属于某个类别的提交分类的嵌入数。f1 分数小于 0.8 的类别(模型分类最不准确的类别)用 * 表示。

https://doi.org/10.1371/journal.pdig.0000935.t003


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

表 4. 使用使用蒸馏后嵌入训练的模型分类的单个用户帖子嵌入的分类报告。在这种情况下,精度相当于阳性预测值。召回相当于敏感性。f1 分数是精度和召回率的谐波平均值。支持是属于某个类别的提交分类的嵌入数。f1 分数大于 0.6 的类别(模型最准确分类的类别)用 * 表示。

https://doi.org/10.1371/journal.pdig.0000935.t004


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图1. 使用使用单个用户后嵌入训练的模型分类的蒸馏嵌入的混淆矩阵。


每个框中的数字表示来自特定社区的嵌入数量被归类为属于某个标签。


https://doi.org/10.1371/journal.pdig.0000935.g001


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图2. 使用使用蒸馏后嵌入训练的模型对单个用户后嵌入进行分类的混淆矩阵。


每个框中的数字表示来自特定社区的嵌入数量被归类为属于某个标签。


https://doi.org/10.1371/journal.pdig.0000935.g002


使用由 IUP 嵌入训练的模型对蒸馏嵌入进行分类获得的结果中似乎存在一些不准确之处。错误分类程度最大的3种疾病群落类型为抑郁症、CPTSD和分裂情感障碍/精神分裂症。然而,合并症的存在表明,其中一些不准确之处很可能根本不是不准确,或者至少非常接近正确的分类。抑郁症的嵌入错误分类分为4类:ADHD、双相障碍、焦虑和自杀倾向,这些疾病均与抑郁共病,或者对于双相情感障碍,其诊断标准中包含抑郁发作[10,47,48]。


CPTSD 的错误分类是 PTSD 和边缘性人格障碍。BPD和CPTSD之间存在高度的特征重叠,关于CPTSD与PTSD是否足够不同,以致在DSM-5中进行诊断的争论表明,这两种疾病之间也存在大量相似性[49,50]。


最后,精神分裂症和分裂情感障碍被错误地归类为另外两种疾病:双相情感障碍和分裂型人格障碍。这两种疾病都具有精神分裂症和分裂情感障碍中存在的精神病特征,为这种错误分类提供了合理的解释[10,51]。总体而言,正确的分类和错误分类以与目标疾病共病或彻头彻尾的疾病为中心,这表明一个非常小的 IUP 嵌入数据集足以训练一个模型,该模型可以根据它们所代表的疾病对蒸馏嵌入进行准确分类。


Classifications 3 and 4: Classification of misinformation/hate communities by disorder

根据之前的分析结果,我们得出结论,对仇恨言论和错误信息进行分类的最佳设计是利用 IUP 嵌入作为我们的训练数据,并使用蒸馏嵌入作为我们的测试数据。仇恨言论社区的蒸馏嵌入的零样本分类在对照分类(20.18%)和精神疾病分类(79.82%)之间存在分歧(表5,S18图,S19图)。 最常被归类为错误信息/仇恨社区的四种疾病是精神分裂样人格障碍和研究中包含的三种 B 类人格障碍:自恋型人格障碍、边缘性人格障碍和反社会人格障碍。在这些疾病中,精神分裂样人格障碍占所有 218 种仇恨言论嵌入的 24.31% 和归类为属于精神障碍社区的仇恨言论嵌入的 30.46%,而 B 类人格障碍占所有仇恨言论嵌入的 49.54% 和归类为与精神疾病社区有关的仇恨言论嵌入的 62.07%。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

表 5. 使用单个用户帖子嵌入作为训练数据,对仇恨言论和错误信息进行零样本分类,提炼嵌入。训练数据中包含但未在此表中列出的任何障碍既没有仇恨言论嵌入,也没有归类为属于它们的错误信息嵌入。

https://doi.org/10.1371/journal.pdig.0000935.t005


在更纯粹是错误信息而不是错误信息和仇恨言论组合的社区中,主要的精神疾病分类是焦虑症 (13.85%),尽管 65 种错误信息嵌入分类中的绝大多数倾向于控制 (73.85%),只有 26.15% 的嵌入被归类为与精神疾病社区有关。


拓扑数据分析

我们嵌入集合的拓扑映射产生了几个有趣的观察结果。首先,所有精神疾病嵌入彼此之间都有直接或间接的边缘,都在映射中占据自己的空间部分(图3)。其次,这个包含精神疾病的空间直接连接到一个包含所有仇恨言论嵌入(图 4)和几乎所有错误信息嵌入(图 5)的空间。值得注意的是,几乎所有的控制嵌入都与这部分空间没有联系;这种缺乏联系表明,这种仇恨言论/错误信息/精神疾病空间在其言语模式中具有某些特征,而这些特征在控制嵌入中通常看不到(图 6)。


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图3. 按类别着色的所有蒸馏嵌入的 TDA 映射。


空间内标记为精神疾病节点的黄色节点表示由精神疾病嵌入组成的节点。


https://doi.org/10.1371/journal.pdig.0000935.g003


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图4. 所有按仇恨言论百分比着色的蒸馏嵌入的 TDA 映射 嵌入。


黄色 = 没有仇恨言论嵌入,红色 = 完全由仇恨言论嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g004


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图5. 所有蒸馏嵌入的 TDA 映射,按错误信息嵌入百分比着色。


黄色 = 没有错误信息嵌入,红色 = 完全由错误信息嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g005


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图6. 所有蒸馏包埋的 TDA 映射,按百分比对照包埋着色。


黄色 = 无对照嵌入,红色 = 完全由对照嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g006


虽然这些观察结果本身就足够引人注目,但结合我们的零样本分类分析结果进行进一步检查表明,在 TDA 映射中看到的模式可以被视为零样本分类结果的预测。与错误信息所占据的空间相比,仇恨言论所占据的空间更接近、更直接地与精神疾病相关。这对应于与错误信息嵌入相比,被归类为精神疾病的仇恨言论嵌入要多得多;仇恨言论嵌入与精神疾病嵌入有更多相似之处。归类为控制的仇恨言论/错误信息嵌入可以通过空间中仇恨言论和错误信息部分中包含一些控制嵌入的节点来解释。此外,占据自己空间的错误信息嵌入部分与精神疾病没有任何联系;按理说,这些嵌入将被归类为控制。


更精细地查看空间的精神疾病部分,可以进一步证明与我们的零样本分类结果更加一致。每种类型的精神疾病社区都占据了自己的空间子部分。如果说一个精神障碍群体占据的空间更靠近精神疾病空间和仇恨言论空间之间的连接点,那么它的言语模式与仇恨言论中的言语模式更相似。检查表明,占据连接点的精神障碍群落为B类人格障碍群落和精神分裂样人格障碍群落,其中自恋型人格障碍和精神分裂样人格障碍群落联系最直接(图7-10)。


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图7. 所有蒸馏嵌入的 TDA 映射,按自恋型人格障碍嵌入百分比着色。


黄色 = 没有自恋型人格障碍嵌入,红色 = 完全由自恋型人格障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g007


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图8. 所有蒸馏嵌入的 TDA 映射,按分裂样人格障碍嵌入百分比着色。


黄色 = 没有精神分裂样人格障碍嵌入,红色 = 完全由精神分裂样人格障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g008


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图9. 所有蒸馏嵌入的 TDA 映射,按反社会人格障碍嵌入百分比着色。


黄色 = 没有反社会人格障碍嵌入,红色 = 完全由反社会人格障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g009


thumbnail下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图10. 所有蒸馏嵌入的 TDA 映射,按边缘性人格障碍嵌入百分比着色。


黄色 = 没有边缘性人格障碍嵌入,红色 = 完全由边缘性人格障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g010


这两个人格障碍社区也是仇恨言论嵌入最多的社区,这证实了这种观点,即这种 TDA 映射说明了一种趋势,即精神疾病社区的提炼嵌入与空间的仇恨言论部分的距离越来越近,这表明它有更高的可能性将仇恨言论嵌入归类到它。


此外,r/CPTSD 的社区嵌入在该地区也很突出,与其分类的少量仇恨言论嵌入相对应(图 11)。


缩略图下载:

PPT的PowerPoint 幻灯片

巴布亚新几内亚大图

蒂夫原图

图11. 所有蒸馏嵌入的 TDA 映射,按复杂的创伤后应激障碍嵌入百分比着色。


黄色 = 没有复杂的创伤后应激障碍嵌入,红色 = 完全由复杂的创伤后应激障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.g011


几乎没有仇恨言论分类的精神疾病社区离连接点更远;这些疾病的数字可以在支持信息中看到。


根据TDA映射,我们决定检查如果从训练数据中排除精神分裂样人格障碍和自恋型人格障碍社区,零样本分类结果会是什么样子(S14图,S15图,S16图)。这样做导致他们分配的仇恨言论嵌入被重新分配给 CPTSD、BPD 和 ASPD。除CPTSD外,排除上述疾病的额外零样本分类表明,分配给CPTSD的嵌入被转移到BPD和ASPD(S17图)。


讨论

我们的分类模型产生了关于 Reddit 上的仇恨言论社区的有趣分类模式:他们的言语模式与 Reddit 社区中看到的 B 类人格障碍的言语模式足够接近,因此可以在零样本分类下将其归类为此类。从某种意义上说,这一结果并不奇怪,因为它与将黑暗三合会与仇恨言论相关的研究一致,并且这些障碍与缺乏对他人的同理心和对他人的暴力密切相关,这些特征可以被视为仇恨言论的产物[52\u201256]。尽管我们的零样本分类结果最初似乎表明唯一重要的 B 类人格障碍是自恋型人格障碍,但我们的 TDA 映射表明 CPTSD 和其他 B 类人格障碍也可以被认为接近与仇恨言论区域的连接点。这表明他们也可以接受仇恨言论分类,自恋型人格障碍和精神分裂样人格障碍只是言语模式与仇恨言论最相似的疾病,而不是唯一具有相似性的疾病。当我们将自恋型人格障碍和精神分裂型人格障碍排除在零样本分类之外时(S14 图、S15 图、S16 图),这种怀疑被证明是正确的;虽然一些仇恨言论嵌入被重新归类为对照,但许多被归类为其他 B 类障碍和 CPTSD。因此,通过利用 TDA,我们能够将零样本分类的结果从仅将两种疾病描述为与仇恨言论有实质性联系到五种疾病,即反社会人格障碍、自恋型人格障碍、边缘性人格障碍、复杂创伤后应激障碍和精神分裂样人格障碍。虽然这表明 TDA 能够增强零样本分类,但我们能够使用它来做到这一点的方法也表明,精神疾病的映射可以被视为与仇恨言论的相似性范围;精神疾病越接近空间的仇恨言论区域,它就越相似,反之亦然。


精神分裂样人格障碍作为仇恨言论的第二大分类的存在令人惊讶。精神分裂样人格障碍的情绪表达受限和脱离社会关系似乎不利于仇恨言论,仇恨言论可能源于情绪化以及将自己视为群体内的一部分,以与仇恨言论的目标进行比较[10,55]。虽然这种分类并非不可能正确,但我们也注意到,在这种情况下,使用来自精神疾病社区的文本嵌入而不是确诊的个人的弱点可能会变得明显。特别是,患有反社会人格障碍的人可能将他们缺乏同理心误解为对社交互动缺乏兴趣。在 TDA 地图上比较两个社区占用的空间部分显示出惊人的重叠程度;精神分裂样人格障碍涵盖了反社会人格障碍的所有空间,尽管它也涵盖了一些额外的空间。这也可以解释为什么反社会人格障碍的仇恨言论分类计数可以被认为低得惊人;精神分裂样人格障碍和自恋型人格障碍的嵌入与其空间重叠,模型最终选择了这两者而不是反社会人格障碍,从S14图、S15图和S16图的趋势可以看出。但是,不能保证情况一定如此;这确实可能是精神分裂样人格障碍偏爱仇恨言论。对另一种 A 类人格障碍,即分裂型人格障碍的观察表明,其空间区域与精神分裂样人格障碍的空间区域保持了一定程度的连续性(图 8、S11 图),这提供了一个论点,即 Reddit 上的精神分裂样人格障碍社区实际上可以代表他们的同名。确定精神分裂样人格障碍和仇恨言论之间是否存在像我们的零样本分类结果所描述的那样的强烈联系,可能需要从确诊为精神分裂样人格障碍的个体那里收集文本嵌入。


复杂创伤后应激障碍与创伤后应激障碍并列时效果显着。一旦占据仇恨言论连接点的其他障碍社区被排除在零样本分类之外,CPTSD 被分配了大量的仇恨言论嵌入,但 PTSD 没有收到任何仇恨言论嵌入(S16 图)。在随后排除 CPTSD 后,分配给 CPTSD 的仇恨言论嵌入并没有转移到 PTSD,而是转移到边缘性人格障碍(S17 图)。这允许进行多次观察。首先,边缘性人格障碍的言语模式与分配给 CPTSD 的仇恨言论嵌入中看到的言语模式比 PTSD 更相似。其次,CPTSD 中的言语模式比 PTSD 中的言语模式更类似于仇恨言论。第三,CPTSD所占的空间部分与精神分裂样人格障碍和B类人格障碍所占据的空间有更多的重叠(图7-11)。所有这些似乎都表明,就这组嵌入而言,Reddit 上的 CPTSD 社区表现出的模式比 PTSD 更让人联想到集群 B,以至于没有一个分配给 CPTSD 的嵌入被重新分配给 PTSD。就围绕CPTSD作为一种结构是否独特的争论而言,这表明CPTSD与PTSD不同,但与B类人格障碍不同,尤其是边缘性人格障碍,这是另一种被认为与CPTSD相同的结构[49,50]。然而,我们只有一个针对 CPTSD 和 PTSD 的社区;更多的社区会更好地在 CPTSD、PTSD 和边缘性人格障碍之间建立适当的空间关系。


错误信息社区的零样本分类表明,在某些情况下,他们的言语模式可能与焦虑症相似。我们认为,这种影响至少部分受到我们使用与COVID相关的社区的影响,COVID是一个容易引发焦虑的话题[57]。未来对错误信息和精神疾病的研究可能最好通过嵌入与更多样化的错误信息主题相关的社区以及更大的社区来进行。总体而言,与致力于仇恨言论及其相关错误信息的社区相比,我们纯粹的错误信息社区的精神疾病分类似乎要少得多,并且它们表现出焦虑症的特征,而不是在仇恨言论社区中看到的精神分裂样人格障碍或 B 类人格障碍的特征。尽管如此,大多数错误信息嵌入仍与空间的仇恨言论区域以及精神疾病空间保持联系。这表明精神疾病和错误信息之间存在联系,尽管我们这项研究的数据集不足以正确理解它。


我们研究的最大局限性是必须注意,我们的结果不是基于确诊;首先,我们对包含在线用户聚合的嵌入进行了分类,精神病学诊断归因于个人,而不是人群。其次,我们对精神疾病的训练数据来自声称患有特定精神疾病的个人;我们没有证据证明他们是否说的是真话。然而,我们研究结果的几个部分表明,这些精神疾病社区充当了有效的代理。首先,当使用蒸馏嵌入作为测试数据时,我们的模型的高精度表明,该模型确实将 Reddit 上精神疾病社区的嵌入识别为与我们对照社区的嵌入不同。结合图 1 中最突出的不准确之处,即精神疾病社区被错误地归类为与其有密切联系的精神疾病社区,这似乎表明这些精神社区的嵌入是各自精神疾病的实质性有效代理。其次,对我们的 TDA 映射的观察表明,我们所有的精神疾病社区共享相同的空间区域;也就是说,分析了来自 34 个不同精神疾病社区的 866 个嵌入,包括超过 800,000 个帖子,其中没有一个被认为与其他嵌入有如此大的差异,以至于它们缺乏将它们与映射的精神疾病区域联系起来的边缘。将此与控制嵌入占据自己个性化空间区域的一般模式并置表明,这组精神疾病嵌入不太可能涉及至少不代表某种形式的精神疾病的社区。进一步考虑这些障碍社区如何表现出与人们预期的合并症相似的重叠(例如,多动症在空间中具有广泛的范围,表明与许多疾病重叠,B 类障碍共享同一空间区域,抑郁症与大部分自杀空间重叠),很明显,即使这些社区是这些疾病的代理人, 他们的服务相当好,除了精神分裂样人格障碍的潜在例外。


We had several other limitations in this study; time/cost limitations meant that our sample size of posts for our embeddings were somewhat smaller than ideal. Additionally, we do not have every psychiatric disorder represented here; notably, we do not have Histrionic Personality Disorder, one of the Cluster B personality disorders. Furthermore, Reddit was the only social media site we drew from; other sites may have different user demographics, and potentially different results.


在使用分类进行假图像检测时,存在“下沉”问题,即模型训练自身识别特定模式以表明图像是假的,这可能导致模型无法识别不具有这些特定模式的假图像[58]。可以说,上述担忧也可以应用于用于检测的其他分类模型。然而,众所周知,“汇”问题发生在二元分类(例如,真与假)的设置中,我们的分类器不进行二元分类,而是决定分类为一系列类之一。这降低了这种“水槽”问题的风险。此外,我们的 TDA 映射的结果不会受到“汇”问题的影响,与我们的分类中看到的结果相当一致(例如,映射上与仇恨言论最密切相关的疾病是 B 类障碍,与在零样本任务中获得最多分类的疾病相同)。这进一步表明,我们的分类结果并没有被这个“汇”问题扭曲。


我们使用我们定义的蒸馏嵌入作为分类任务的训练数据产生了意想不到的结果。虽然在对同类嵌入进行分类时,它们被证明优于 IUP 嵌入,但在零样本分类或测试数据由 IUP 嵌入组成时,它们的性能较差。我们将多个帖子聚合在一起的方法可能会导致社区语音模式的某些组成部分在聚合嵌入中被有效地抵消,从而损害了它们正确分类的能力。然而,在 IUP 嵌入上训练的模型比由 IUP 嵌入组成的模型更准确地对蒸馏嵌入测试数据集进行分类,这表明即使丢失了一些语音模式,蒸馏嵌入也比 IUP 嵌入更能代表他们的社区(因此他们提出的精神疾病或其他一些结构)。因此,我们认为,如果在使用 IUP 嵌入训练的模型时用作测试数据集中结构的代表,则蒸馏嵌入具有一定的价值。


应该指出的是,用于每个社区的 IUP 嵌入的 50 个职位也包括在用于提炼嵌入的 1000 个职位中。虽然这可以被视为一个限制,但零样本分类任务 1 和 2 的结果与人们预期的这种包含会导致的结果相反。具体来说,尽管 100% 的帖子在技术上通过成为蒸馏嵌入的一部分包含在训练数据中,但在蒸馏嵌入上训练的模型的准确率不到在 IUP 帖子上训练的模型的一半,后者仅占测试数据中使用的帖子的 5%。人们通常会假设训练数据和测试数据之间有 50 个帖子的重叠会发生相反的情况,这进一步强化了这样一种观点,即这些结果表明将帖子组合在一起以创建蒸馏嵌入的过程影响了语音模式在蒸馏嵌入与 IUP 嵌入中呈现的方式。


对目睹的不准确性的另一个解释可能在于对物质使用障碍的过度分类。被归类为代表物质使用障碍社区的蒸馏嵌入总数为 111 个,这是迄今为止分配给任何精神疾病类别的最高嵌入数量。这可能导致模型在检测物质使用障碍时变得过于敏感;未来对每种精神疾病的蒸馏嵌入数量进行更平衡的研究可能能够避免这种敏感性问题。


精神疾病经常被污名化,对与心理健康和仇恨言论等敏感话题相关的数据进行不当或粗心的解释和分析可能会导致耻辱感恶化。因此,应该明确的是,这项研究的结果并不表明患有精神疾病的人会参与或倾向于仇恨言论或错误信息。事实上,它们肯定没有表明它们是仇恨言论的主要来源,甚至是仇恨言论的重要来源。必须注意尽量减少污名化,并仔细检查仇恨言论、错误信息和精神疾病之间可能存在的复杂关系。


精神疾病中的言语模式与仇恨言论之间关系的方向性问题还远未确定:这种关系是因为患有精神疾病的人更容易受到仇恨言论的影响,还是仇恨言论群体在发展过程中呈现出类似于精神疾病的言语模式和其他可能的特征?需要进一步的研究来更好地回答这些重要问题。


结论

总之,我们的结果表明,Reddit 上的仇恨言论社区与 Reddit 社区在精神分裂样人格障碍、三种 B 类人格障碍(边缘性、自恋和反社会)和复杂创伤后应激障碍方面具有相同的言语模式。虽然由于之前对黑暗三合会和仇恨言论的研究,B 类疾病是可以预料的,但这仍然证实了他们在仇恨言论方面的行为与黑暗三合会同行相似。此外,据我们所知,这两种非 B 类疾病尚未在仇恨言论或错误信息文献中讨论过,并提供了新的调查途径。


某些精神疾病与仇恨言论(以及较小程度的错误信息)之间言语模式的关联表明,尽管仇恨言论和错误信息是一种社会现象,但将仇恨言论/错误信息视为精神疾病来构建和处理它们可能有助于对抗它们。例如,针对这些问题设计反信息可以利用用于与仇恨言论和错误信息最相似的精神疾病的治疗元素。尽管由于这些疾病对治疗的历史耐药性,最常被归类为B类人格障碍的仇恨言论嵌入可能被视为有问题,但通过辩证行为疗法治疗边缘性人格障碍的成功表明,这些障碍的治疗并非不可能,可以应用于此[59,60].此外,尽管仇恨言论与 B 类人格障碍有相似之处,但这并不意味着它实际上是 B 类人格障碍;它很可能比人格障碍更不耐变化。


事实证明,错误信息与精神疾病社区的关系仍然难以捉摸;在 TDA 映射中可以看到明显的联系,零样本分类有超过 25% 的错误信息嵌入分配给精神疾病,但很难用手头的数据集阐明明确的模式。更强大的数据集可能能够识别更清晰的趋势。


虽然拓扑数据分析可能会遇到大量 IUP 嵌入的计算挑战,但使用蒸馏嵌入允许 TDA 在单个分析中处理超过一百万个帖子。虽然它们的使用目前实际上仅限于测试数据,但可以改进它们,使它们也可用于训练数据。


事实证明,零样本分类是识别哪些精神疾病社区与仇恨言论和错误信息社区最相似的有效工具。然而,TDA 的添加允许空间的可视化,并最终允许观察到精神疾病在仇恨言论方面实际上具有一系列相似性。它还表明,我们所有的精神疾病社区嵌入都是相互关联和相似的,进而导致仇恨言论和错误信息,这是绝大多数控制嵌入都未能做到的。到目前为止,TDA 在精神病学研究中相对没有被考虑;我们建议利用它来可视化用于分类任务的空间,因为它可以识别可能被忽视的调查路线。


支持信息

所有蒸馏包埋的 TDA 映射,按注意力缺陷多动障碍社区着色。


显示 1/19: pdig.0000935.s001.tiff


跳至图分享导航

抱歉,我们无法加载您的数据。

1 / 19



下载

无花果分享

S1 图。 所有蒸馏包埋的 TDA 映射,按注意力缺陷多动障碍社区着色。

黄色 = 没有注意力缺陷多动障碍嵌入,红色 = 完全由注意力缺陷多动障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s001


(TIFF)


S2 图。 所有蒸馏嵌入的 TDA 映射,按焦虑症社区着色。

黄色 = 没有焦虑症嵌入,红色 = 完全由焦虑症嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s002


(TIFF)


S3 图。 所有蒸馏嵌入的 TDA 映射,按自闭症谱系障碍社区着色。

黄色 = 没有自闭症谱系障碍嵌入,红色 = 完全由自闭症谱系障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s003


(TIFF)


S4 图。 所有蒸馏包埋的 TDA 映射,按双相情感障碍群落着色。

黄色 = 没有双相情感障碍嵌入,红色 = 完全由双相情感障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s004


(TIFF)


S5 图。 所有蒸馏包埋的 TDA 映射,按抑郁症群落着色。

黄色 = 无凹陷嵌入,红色 = 完全由凹陷嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s005


(TIFF)


S6 图。 所有蒸馏包埋的 TDA 映射,按饮食失调社区着色。

黄色 = 没有饮食失调嵌入,红色 = 完全由饮食失调嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s006


(TIFF)


S7 图。 所有蒸馏包埋的 TDA 映射,由强迫症社区着色。

黄色 = 没有强迫症嵌入,红色 = 完全由强迫症嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s007


(TIFF)


S8 图。 所有蒸馏包埋的 TDA 映射,按创伤后应激障碍群落着色。

黄色 = 没有创伤后应激障碍嵌入,红色 = 完全由创伤后应激障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s008


(TIFF)


S9 图。 所有蒸馏嵌入的 TDA 映射,按分裂情感障碍群落着色。

黄色 = 没有分裂情感障碍嵌入,红色 = 完全由分裂情感障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s009


(TIFF)


S10 图。 所有蒸馏包埋的 TDA 映射,按精神分裂症群落着色。

黄色 = 没有精神分裂症嵌入,红色 = 完全由精神分裂症嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s010


(TIFF)


S11 图。 由分裂型人格障碍社区着色的拓扑映射。

黄色 = 没有精神分裂型人格障碍嵌入,红色 = 完全由精神分裂型人格障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s011


(TIFF)


S12 图。 按物质使用障碍社区着色的拓扑映射。

黄色 = 无物质使用障碍嵌入,红色 = 完全由物质使用障碍嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s012


(TIFF)


S13 图。 与自杀有关的自杀社区的 TDA 映射。

黄色 = 没有自杀嵌入,红色 = 完全由自杀嵌入组成。


https://doi.org/10.1371/journal.pdig.0000935.s013


(TIFF)


S14 图。 仇恨言论的零样本分类,精神分裂样人格障碍被排除在分析之外。

https://doi.org/10.1371/journal.pdig.0000935.s014


(TIFF)


S15 图。 仇恨言论的零样本分类,自恋型人格障碍被排除在分析之外。

https://doi.org/10.1371/journal.pdig.0000935.s015


(TIFF)


S16 图。 仇恨言论的零样本分类,将精神分裂型人格障碍和自恋型人格障碍排除在分析之外。

https://doi.org/10.1371/journal.pdig.0000935.s016


(TIFF)


S17 图。 仇恨言论的零样本分类,将精神分裂样人格障碍、自恋型人格障碍和复杂创伤后应激障碍排除在分析之外。

https://doi.org/10.1371/journal.pdig.0000935.s017


(TIFF)


S18 图。 使用单个用户帖子嵌入作为训练数据的仇恨言论提炼嵌入的零样本分类的混淆矩阵。

https://doi.org/10.1371/journal.pdig.0000935.s018


(TIF)


S19 图。 使用单个用户帖子嵌入作为训练数据的错误信息提炼嵌入的零样本分类的混淆矩阵。

https://doi.org/10.1371/journal.pdig.0000935.s019


(TIF)


确认

我们感谢 TAMU 医师科学家学院向第一作者提供巴勒斯惠康基金奖学金。


引用

1.Mathew B、Dutt R、Goyal P、Mukherjee A. 在线社交媒体中仇恨言论的传播。第十届 ACM 网络科学会议论文集;美国马萨诸塞州波士顿:计算机协会;2019;173–82.

2.Castaño-Pulgarín SA, Suárez-Betancur N, Vega LMT, López HMH.互联网、社交媒体和网络仇恨言论。系统评价。攻击性和暴力行为。2021;58:101608.

查看文章谷歌学术

3.斯特克洛 S.为什么 Facebook 在缅甸的仇恨言论战争中失败。路透社。2018. https://www.reuters.com/investigates/special-report/myanmar-facebook-hate

查看文章谷歌学术

4.WR 纽金特、TE 艾布拉姆斯、AA 约瑟夫。暴力政治言论与大规模枪击事件之间的关系。社会服务研究杂志 2022;48(2):246–58.

查看文章谷歌学术

5.Ferrara E、Cresci S、Luceri L. COVID-19 时代社交媒体上的错误信息、纵和滥用。计算社会科学杂志 2020;3(2):271–7.PMID:33251373

查看文章考研/NCBI谷歌学术

6.Suarez-Lledo V, Alvarez-Galvez J. 社交媒体上健康错误信息的普遍性:系统评价。J Med 互联网研究 2021;23(1):e17187。PMID:33470931

查看文章考研/NCBI谷歌学术

7.威瑟斯 KL、帕里什 JL、特雷尔 S、埃利斯 TJ。“黑暗三合会”人格特征与社交网站上的越轨行为之间的关系。见:AMCIS 2017 会议记录,2017 年。

8.社交媒体对 COVID-19 阴谋论的怀疑和信念:黑暗三合会的调节作用。2023 年;42(11):8874–86.PMID:34393466

查看文章考研/NCBI谷歌学术

9.J. Vossen T、L. Coolidge F、L. Segal D、J. Muehlenkamp J. 探索阴暗面:黑暗三合会特征与 B 类人格障碍特征之间的关系。J 精神病学精神病学疾病。2017;01(06):317–26.

查看文章谷歌学术

10.美国精神病学协会。精神障碍诊断和统计手册。第 5 版,2013 年。

11.Djuric N、周 J、Morris R、Grbovic M、Radosavljevic V、Bhamidipati N,编辑。通过评论嵌入进行仇恨言论检测。第 24 届万维网国际会议论文集;2015.

12.Ilie V-I、Truica C-O、Apostol E-S、Paschke A. 上下文感知错误信息检测:使用词嵌入的深度学习架构基准。IEEE 访问。2021;9:162122–46.

查看文章谷歌学术

13.使用多模式方法预测社交媒体假新闻的图像可信度。神经计算应用 2022;34(24):21503–17.PMID:34054227

查看文章考研/NCBI谷歌学术

14.布朗 T、曼恩 B、莱德 N、苏比亚 M、卡普兰 JD、达里瓦尔 P 等。语言模型是少数样本的学习者。神经信息处理系统的进展。2020;33:1877–901.

查看文章谷歌学术

15.Ouyang L, Wu J, 江 X, Almeida D, Wainwright C, Mishkin P. 训练语言模型遵循人类反馈的指令。神经信息处理系统的进展。2022;35:27730–44.

查看文章谷歌学术

16.Achiam J、Adler S、Agarwal S、Ahmad L、Akkaya I、Aleman FL 等。Gpt-4 技术报告。2023. https://arxiv.org/abs/2303.08774

17.Vaswani A、Shazeer N、Parmar N、Uszkoreit J、Jones L、Gomez AN。你只需要关注。神经信息处理系统的进展。2017;30.

查看文章谷歌学术

18.Devlin J、Chang MW、Lee K、Toutanova K. Bert:用于语言理解的深度双向转换器的预训练。arXiv.2018. https://arxiv.org/abs/1810.04805

查看文章谷歌学术

19.Wei J, Bosma M, Zhao VY, Guu K, Yu AW, Lester B. 微调的语言模型是零样本学习器。arXiv.2021. https://arxiv.org/abs/2109.01652

查看文章谷歌学术

20.拉巴丹 R,布伦伯格 AJ。基因组学和进化的拓扑数据分析:生物学中的拓扑学。剑桥大学出版社,2019 年。

21.查扎尔 F,米歇尔 B.拓扑数据分析简介:数据科学家的基本和实践方面。前 Artif Intell。2021;4:667963.PMID:34661095

查看文章考研/NCBI谷歌学术

22.Carlsson G. 拓扑和数据。Bull Amer 数学社会 2009 年;46(2):255–308.

查看文章谷歌学术

23.Reddit的。Reddit 帮助。https://support.reddithelp.com/hc/en-us。2023. 2023 年 6 月 20 日。

24.Gaudette T、Scrivens R、Davies G、Frank R. 赞成极端主义:Reddit 上的集体身份形成和极右翼。新媒体与社会。2021;23(12).

查看文章谷歌学术

25.Lawlor A, Kirakowski J. 心理健康在线支持小组:挑战自我耻辱的空间还是社会回避的手段?人类行为中的计算机。2014;32:152–61.

查看文章谷歌学术

26.Melton C、Olusanya OA、Shaban-Nejad A. 社交媒体上 COVID-19 疫苗错误信息的网络分析。种马健康技术公司通知。2021;287:165–6.PMID:34795104

查看文章考研/NCBI谷歌学术

27.Reddit .r/伊维菌素。https://www.reddit.com/r/ivermectin。2023. 2023 年 6 月 20 日。

28.Reddit.r/vaccinelonghaulers。https://www.reddit.com/r/vaccinelonghaulers。2023. 2023 年 6 月 20 日。

29.克莱因 C、克鲁顿 P、邓恩 AG。阴谋论的途径:参与 Reddit 阴谋论论坛的社会和语言先兆。公共科学图书馆一号。2019;14(11):e0225098。PMID:31738787

查看文章考研/NCBI谷歌学术

30.Zadrozny B、Collins B. Reddit 在经历了数月的暴力威胁后禁止了 Qanon Reddit 子版块。NBC 新闻。2018;:12。

查看文章谷歌学术

31.林JL.网上的反女权主义。MGTOW(男人走自己的路):成绩单。2017.

32.Reddit的。r/MGTOW。https://www.reddit.com/r/MGTOW。2023 年 6 月 20 日。

33.Reddit的。r/incels 的。https://www.reddit.com/r/incels。2023. 2023 年 6 月 20 日。

34.Solon O. Incel“:Reddit 禁止厌恶女性的男性团体将独身归咎于女性。卫报。2017. https://web.archive.org/web/20171108214200/ https://www.theguardian.com/technology/2017/nov/08/reddit-incel-involuntary-celibate-men-ban

查看文章谷歌学术

35.r/TruFemcels。https://www.reddit.com/r/TruFemcels。2023. 2023 年 6 月 20 日。

36.Reddit的。r/GenderCritical。https://www.reddit.com/r/GenderCritical/.2023 六月 20

37.贾弗 S、陈 L、布鲁克曼 A.另一边的观点:Kotaku in Action 上有争议的言论和骚扰之间的边界。2017 年。

查看文章谷歌学术

38.佩克福德 A.电子游戏社区中的右翼极端主义?探索 Reddit GamerGate 社区话语的定性内容分析 r/KotakuInAction。在不寻常的时代仔细观察:犯罪学视角,来自犯罪。2020;862:65–81.

查看文章谷歌学术

39.库西诺 LS.男性的积极身份?:通过 reddit 的/r/MensRights 和/r/TheRedPill 参与极右翼的途径。极右翼的崛起:招募和动员技术。2021;127–46.

40.卡尔森 CR,库西诺 LS。您确定要查看这个社区吗?探索 Reddit 隔离实践的道德规范。媒体伦理杂志。2020;35(4):202–13.

查看文章谷歌学术

41.Khan A, Golab L. Reddit 挖掘以了解性别运动。在:2020 年。

42.Chow A. Reddit 在两个论坛上采取行动控制仇恨言论和错误信息。时间。2022. https://time.com/6160519/reddit-international-hate-speech-ban/

查看文章谷歌学术

43.警惕 1.Reddit 子版块评论/提交 2005-06 至 2022-12。学术种子。https://academictorrents.com/details/c398a571976c78d346c325bd75c47b82edf6124e

44.开放人工智能。嵌入。https://platform.openai.com/docs/guides/embeddings。2023 年 6 月 20 日。

45.辛格 G、梅莫利 F、卡尔森 GE。用于高维数据集分析和三维物体识别的拓扑方法。见:PBG@ Eurographics,2007 年。091–100.

46.周Y、查拉帕蒂N、拉索尔A、赵Y、王B. Mapper Interactive:用于高维数据可视化探索的可扩展、可扩展和交互式工具箱。2021 IEEE 第 14 届太平洋可视化研讨会 (PacificVis);2021.

47.Thaipisuttikul P、Ittasakul P、Waleeprakhon P、Wisajun P、Jullagate S. 重度抑郁症患者的精神合并症。神经精神疾病和治疗。2014;:2097–103.

查看文章谷歌学术

48.卡茨曼 MA、比尔基 TS、乔卡 PR、法卢 A、克拉森 LJ。成人多动症和合并症:维度方法的临床意义。BMC 精神病学。2017;17(1):302.PMID:28830387

查看文章考研/NCBI谷歌学术

49.Resick PA、Bovin MJ、Calloway AL、Dick AM、King MW、Mitchell KS 等。对复杂 PTSD 文献的批判性评估:对 DSM-5 的影响。J 创伤应激。2012;25(3):241–51.PMID:22729974

查看文章考研/NCBI谷歌学术

50.Jowett S、Karatzias T、Shevlin M、Albert I. 区分 ICD-11 PTSD、复杂 PTSD 和边缘性人格障碍的症状特征:多重创伤样本中的潜在类别分析。个人的不适。2020;11(1):36–45.PMID:31259603

查看文章考研/NCBI谷歌学术

51.范卑尔根 AH、Verkooijen S、Vreeker A、Abramovic L、Hillegers MH、Spijker AT 等。双相情感障碍中精神病特征的特征。心理学医学 2019;49(12):2036–48.PMID:30303059

查看文章考研/NCBI谷歌学术

52.克劳斯 G,雷诺兹 DJ。B 组的“A-B-C”:识别、理解和治疗 B 组人格障碍。临床心理学修订版 2001 年;21(3):345–73.PMID:11288605

查看文章考研/NCBI谷歌学术

53.Ritter K、Dziobek I、Preissler S、Rüter A、Vater A、Fydrich T 等。自恋型人格障碍患者缺乏同理心。精神病学研究 2011 年;187(1–2):241–7.PMID:21055831

查看文章考研/NCBI谷歌学术

54.萨尔加多 RM、佩德罗萨 R、巴斯托斯-莱特 AJ。边缘性人格障碍的同理心功能障碍和相关过程:系统评价。哈夫牧师精神病学。2020;28(4):238–54.PMID:32692088

查看文章考研/NCBI谷歌学术

55.Pluta A, Mazurek J, Wojciechowski J, Wolak T, Soral W, Bilewicz M. 接触仇恨言论会恶化理解他人痛苦的能力的神经认知机制。科学代表 2023;13(1):4127.PMID:36914701

查看文章考研/NCBI谷歌学术

56.Bilewicz M, Soral W. 仇恨言论流行。贬义语言对群体间关系和政治激进化的动态影响。政治心理学。2020;41:3–33.

查看文章谷歌学术

57.Leichsenring F、Leibing E、Kruse J、New AS、Leweke F. 边缘性人格障碍。柳叶 刀。2011;377(9759):74–84.PMID:21195251

查看文章考研/NCBI谷歌学术

58.奥贾乌、李Y、李YJ。走向跨生成模型泛化的通用假图像检测器。在:2023 年 IEEE/CVF 计算机视觉和模式识别 (CVPR) 会议,2023 年。24480–9.

查看文章谷歌学术

59.Choi-Kain LW、Finch EF、Masland SR、Jenkins JA、Unruh BT。什么对边缘性人格障碍的治疗有效。Curr Behav 神经科学代表 2017 年;4(1):21–30.PMID:28331780

查看文章考研/NCBI谷歌学术

60.低 DM、Rumker L、Talkar T、Torous J、Cecchi G、Ghosh SS。自然语言处理揭示了 COVID-19 期间 Reddit 上脆弱的心理健康支持群体和健康焦虑的加剧:观察性研究。J Med 互联网研究 2020;22(10):e22635。PMID:32936777

查看文章考研/NCBI谷歌学术


阅读0
分享
写下您的评论吧