前言:纵观多次网上热门事件,每次事件或多或少都能出现网暴者的身影。有段时间就一直好奇网暴这个群体是怎么的一群人?分布在哪个年龄段?他们出于什么心态会做出如此发言?
免责说明:本次数据分析因为样本量少,分析模型简单,存在个主观臆断等多重原因结论仅供参考。
1.数据来源
事件主线:唐山打人事件
详细支线:对烧烤摊主的网暴行为,如下图误伤的也算
数据来源:知乎,微博,微信公众号,UC头条,百度头条
取样内容:评论昵称,评论头像,评论内容
数量:50W+(已于2022年6月11日销毁)
2.评论取样和分词(除杂)
取样
首先我们需要对评论进行取样,取样可随机按比例取样。本次分析抽取了2000条评论。为样本数据的4‰
分词
因为我们要分析的是网暴者,所以这边进行主观选取分词了。抽取比较有戾气的词语:死,户口本,***,*****(不枚举了,自己脑补)
因为有主观臆断,所以背后又做了一组分析,先分词然后再根据分词进行排序。根据排序选top20内比较有戾气的词语。(可能样本不够多,结果大致相同)
3.昵称的分析
3.1拉取昵称
根据前面取得的分词结果,拉取对应评论的昵称
昵称样本数量:27363
3.2昵称分析
因为样本量不大,对于昵称的分析就不再取样和分词了,直接打成流,然后计数最后排序TOP。
TOP如下:(剔除了系统默认用户名)
山
舟
远
画
光
水
阳
4.其他分析
其他分析步骤大同小异,直接输出结果
性别:男76.3%,女17.3%,无性别:6.4%
头像(这个是靠目测,没上图像识别):山水画>明星
写在最后:一直以为网暴者的主要群体是青少年和未成年,结果往往出人意料,会用山舟远画阳光之类的用户名个人推测为中年男性,普遍年龄大于40,出生早于1980年。
注:以上全为本人胡说八道,不作任何参考。另莫图一时之快,网暴终害人害己
:.゚ヽ(。◕‿◕。)ノ゚.:。+゚防盗专用。:.゚ヽ(。◕‿◕。)ノ゚.:。+゚
^_^文章来源:微信公众号(边界骇客) ^_^ ^_^