对网暴者的一次小数据分析/人物画像
2023-6-3 12:51:54 Author: 边界骇客(查看原文) 阅读量:33 收藏

前言:纵观多次网上热门事件,每次事件或多或少都能出现网暴者的身影。有段时间就一直好奇网暴这个群体是怎么的一群人分布在哪个年龄段?他们出于什么心态会做出如此发言?

免责说明:本次数据分析因为样本量少,分析模型简单,存在个主观臆断等多重原因结论仅供参考。

1.数据来源

事件主线:唐山打人事件

详细支线对烧烤摊主的网暴行为,如下图误伤的也算

数据来源:知乎,微博,微信公众号,UC头条,百度头条

取样内容:评论昵称,评论头像,评论内容

数量:50W+(已于2022年6月11日销毁

2.评论取样和分词(除杂)

取样

首先我们需要对评论进行取样,取样可随机按比例取样。本次分析抽取了2000条评论。为样本数据的4‰

分词

因为我们要分析的是网暴者,所以这边进行主观选取分词了。抽取比较有戾气的词语:,户口本,***,*****(不枚举了,自己脑补

因为有主观臆断,所以背后又做了一组分析,先分词然后再根据分词进行排序。根据排序选top20内比较有戾气的词语。(可能样本不够多,结果大致相同)

3.昵称的分析

3.1拉取昵称

根据前面取得的分词结果,拉取对应评论的昵称

昵称样本数量:27363

3.2昵称分析

因为样本量不大,对于昵称的分析就不再取样和分词了,直接打成流,然后计数最后排序TOP。

TOP如下:(剔除了系统默认用户名)



4.其他分析

其他分析步骤大同小异,直接输出结果

性别:男76.3%,女17.3%,无性别:6.4%

头像(这个是靠目测,没上图像识别):山水画>明星

写在最后:一直以为网暴者的主要群体是青少年和未成年,结果往往出人意料,会用山舟远画阳光之类的用户名个人推测为中年男性,普遍年龄大于40,出生早于1980年。

注:以上全为本人胡说八道,不作任何参考。另莫图一时之快,网暴终害人害己

:.゚ヽ(。◕‿◕。)ノ゚.:。+゚防盗专用。:.゚ヽ(。◕‿◕。)ノ゚.:。+゚

 ^_^文章来源:微信公众号(边界骇客) ^_^ ^_^


文章来源: http://mp.weixin.qq.com/s?__biz=MzU1NTkzMTYxOQ==&mid=2247485531&idx=1&sn=95f30ab06f3a11bd5b785af23f81849d&chksm=fbcd8ad7ccba03c1ebead3cadc5c89788be4a5b4dc2bf2236e4399b7d7de925c489cec8cc0fb#rd
如有侵权请联系:admin#unsafe.sh