鉴黄师,暗网,来源,科技
2023-2-3 08:3:56 Author: 奶牛安全(查看原文) 阅读量:36 收藏

鉴黄师,暗网一直是一种神秘的存在,它们面纱背后的真相却让人不寒而栗。

写这篇文章的动机源于一幅图

这张图在一个群里引起一堆男人热烈的讨论,都认为鉴黄师是男人梦想的职业,唯一的担心是怕身体受不住。结果,我说了一些东西之后,他们开始吐了,立马对这个职业完全拔草,不得不刷屏转移话题。

看了一下网上的文章,还是不少人对这个职业向往,但也有不少文章持有我同样的观点,但由于语焉不详,讳莫如深,闪烁其词,让很多人看完之后,还是没消除那种神秘感和向往。

鉴黄师这个职业是对个人身心伤害很大的职业。你们以为的情景是“兄弟,你能不能休息一下?”, 实际情况是“兄弟,你能不能醒醒? 兄弟,兄弟,兄弟!呜~~~“。

那么鉴黄师的工作内容是怎样的?为什么会造成这么大的伤害?得先从这个职业的角色来看。

角色

外界有传言说,成人内容全靠鉴黄师来审核。这种说法纯粹是对这个工种和信息技术毫无所知。如果鉴黄师一秒钟可以按九宫格排列9张图片,按照摄像头一秒30张图片的速度来算,一天不眠不休,最多也只能审核7.2小时视频片段产生的照片。真的这样下去,人不猝死,眼睛也直接废了。

其实,鉴黄师,其实是“内容审核员”或“信息审核员”这个岗位的一种,只是内容偏向成人而已。他们只是内容审核流程中的一环。整体链路如下:

  1. 数据采集环节从数据采集人员或用户投诉内容里获取内容样本
  2. 鉴黄师审核内容,并对内容进行标注,产生的标注数据和内容分发给AI训练人员
  3. AI训练人员把鉴黄师产生的内容分成两组,一组为训练集,一组为测试集,通过在训练集里来调试算法。算法调试完毕,就对测试集应用算法,对测试结果进行检查,如果是算法问题,AI训练人员会继续调整算法。如果是标注问题,会把内容重新打回鉴黄师,重新标注。
  4. 训练结果完成,把AI算法进行投产,对线上内容进行检测。

可见,鉴黄师的内容来源主要如下:

  1. 用户投诉
  2. 数据采集人员的数据,主要来源为外网数据爬取,暗网数据,线上系统数据抽样

从审核内容的表现形式来分,鉴黄师大致分为几类:

  1. 成人小说审核员。
  2. 成人音频审核员
  3. 成人图片审核员
  4. 成人视频审核员

成人小说审核员,随着时间推移人数会越来越少,主要是得益于NLP(自然语言处理)技术的成熟,再加上各种搜索引擎,如百度,搜狗之类不断地爬取分析,这一块的工作大多被人工智能替代了。同时成人小说引流效果不如图片和视频,赚不了什么钱,成人网站一般也不用这种形式。不过,由于审核人员的古文水平大多一般,所以人工智能审核对古代成人小说的鉴别能力基本为零,特别是一些诗词方面。所以,在网上还是可以找到不少古代成人小说。

成人音频审核员,应该是最小众了。毕竟,对成人内容大家都是一目十行,或快进的,谁还愿意花时间耐心地听音频。所以成人音频的受众是最少的,而且由于语音识别技术的成熟,如科大讯飞,腾讯翻译君之类(它们基本上都可以干倒一批同声传译人员),直接可以把音频变成文字,再通过NLP来处理,基本上让人参与的比例越来越低。当然,也有漏网之言,比如用潮汕话的成人音频,语音识别技术不一定识别得了,也同时是这样,这种内容的受众就更加小了,造成影响就更低了。

成人图片审核员,应该是从业人员最多的。这里用到的识别技术,主要是文件指纹识别,DRM特征识别,图像识别。文件指纹识别是对文件md5,sha之类进行识别,类似黑名单。DRM特征识别是通过正版出品的图片和文档,提取DRM特征,确定是否来自某家成人公司出品。图像识别就有OCR识别,Logo识别,人脸识别和物体识别。OCR就是对图像上的文字提取,而Logo一般是固定位置,识别提取也比较方便,基本这两项可以干掉了大部分成人图片,再加人脸识别技术,能够把老师们都找出来,又干掉剩余的大部分。所以,目前审核员的工作主要是集中在物体识别这一块,对物体鉴别后产生标注数据。

成人视频审核员,随着直播和短视频兴起,这一块的人员越来越多。由于视频是可以抽成一桢桢的图片,所以,在成人图片应用的识别技术同样可以应用在成人视频上。

内容

终于到大家一直期待,让人激动人心的部分了。鉴黄师天天都是看什么内容呢?

大家都以为鉴黄师会看到这些女神的美图

anna sbitnaya
janelle b

现实中,鉴黄师可能会看到他们男上加男,左右为男的图片,甚至有更恶心的照片,这种只是起步级。

male

因为我们正常人平时看到的资源,都是我们出于娱乐的目的有意识去收集和过滤的,看到恶心的都会关掉,其实,我们所看到的资源在整个总量上是占非常少数。并且这些资源,都是由专业公司出品,有各种各样的特征(如logo,名字,知识女优的脸,经过技术处理的画面),很容易被文件指纹识别, DRM识别图像识别等技术识别出来,所以剩下的,都是一些未分类,各种来源的资源,需要有人做鉴定和做标注。

你说,如果一个钢铁直男天天对着百晓生兵器谱上排名第一的“天机棒”进行多角度不同光照环境的研究,寻找特征,认真标注,哪怕毫无兴趣,不能够关掉,如果标注出来的数据在训练效果不佳,还得打回重做,要更加仔细地研究,你觉得这个钢铁直男心里会好受吗?

上面场景只能算九牛一毛,小巫见大巫,有更恶心的,各种屎尿,虐待,慕残,慕老,冰恋,动物爱好者之类更加颠倒三观。

我第一次看到这些,我也是差点吐了。当时在某家人工智能公司上班,办公位附近有个小黑屋,里面的人很神秘,有次门没交好,我打水经过,看到一张女人的某器官图片。对于我这种老司机来说,这应该不算什么,但那明显是病变了的。后来,有次在公交站遇到小黑屋的人,聊了一下,才知道他们是做什么的。

后来在某互联网大厂,某次加班,大家吹水,也聊起这个神秘的职业,某总监说,谁有兴趣,那个团队的总监和他很熟,他可以帮忙调过去体验一个月。因为那个部门是从我们部门拆分出来的。某总监也说了一些这个神秘职业的工作内容,并提到,那个团队的人时不时需要去看心理医生。

暗网

上面提到这些数据有部分是来自暗网,那么暗网是什么呢?

暗网和深网不一样。深网只是指搜索引擎无法触及的地方,比如微信对于百度来说,就算是一个深网。暗网则是法外之地,很多只能通过特定浏览器或app才能够进入,里面十个人有九个是骗子,都是黄赌毒之类的东西。

以前是没有暗网,出现光明之后,才有了暗网。为什么这么说呢?

读大学时,FTP,网络快车,网络蚂蚁非常火,各种FTP,HTTP资源站点特别多,无论是校内还是校外,经常在谷歌和百度能够搜索出一大堆,这些资源有一些非常反三观的东西。比如有一个小视频,两个男的把一个东欧少女luo身绑着,架在火上烤。还有一部,太反人性了,就不说了,反正比《一部塞尔维亚的电影》还要恶心。直到我从他人口中知道鉴黄师的工作内容,我才知道以前读大学时网络上到处都是暗网,看到慕残,冰恋这些字眼,再联想到微博之前“随手拍照解救被拐儿童”的活动,  更加不敢想背后的真相,更加不敢面对人性。

最近出现的新闻,如韩国素媛案,广西百香果女孩案,让人觉得这个世界正如《都市妖奇谈》所描述那样,有不少妖魔鬼怪,幻化成人形混迹在人类社会里。而暗网里,正是有不少妖魔鬼怪把他们的劣行放在上面,如前段时间的“N号房间”。试问,一个正常人当鉴黄师,整天凝视着这种深渊,内心会怎样的,怎么可能会不去看心理医生呢?有时候,真的想不明白为什么那些废死族是不是出生时把人扔了,把胎盘养大了。或许让他们去当半年鉴黄师,他们的想法会改变吧。

不少人都在骂GFW,他们不知道GFW挡住了多少黑暗的东西。GFW之前,国内已经在开始侦查取缔这些东西,GFW之后,境内就基本绝迹,再随着NLP,图像识别和人工智能兴起和成熟,这些更加少之更少。直至今天,暗网变成一个神秘的东西,如克苏鲁一样。

来源

她那时候还太年轻,不知道所有命运赠予的礼物,早已在暗中标好了价格.

——茨威格《断头王后》

暗网这些数据来源哪里呢?

在我国,一般都是来自债奴。比如前段时间上海某奶茶店主为交店租开色情直播,更加不要说之前P2P火热时的裸贷。在现在社会上太多人容易被消费主义洗脑,以为拥有一些外在的商品,就是投资自己,从而去背上远超自己能力和收入的债务。当无力偿还时,除了身体和生命之外,还有什么用来偿还的?对那些想过精致生活又不努力充电的人,我只能说,可能过段时间在暗网上就可以找到你的视频。到那时,就不要说自己太傻太天真了。

在欧美发达国家和地区,也是债奴居多,虽然有些是黑帮胁迫的,起因也是由于欠债。

上面这两类的数据产量,在总量上占的比例非常低。那么大量的来源在哪呢?

网上有一句话很经典:我们不是生活在一个和平的年代,只是很幸运地生活在一个和平的国家。 东欧剧变可能对于大多数人来说,只是轻描淡写四个字,但如果去深究,恐怕不是这么简单。在前面提到的被绑在火上烤的少女,从肤色和相貌来看,是东欧人。不知道大家还记得2020年为台毒站台的捷克外长不?捷克在东欧剧变后,西欧的成人女星原来以意大利/西班牙籍为主,立马变成以匈牙利/捷克籍为主。某art network集团,在08年经济危机后,乌克兰美女开始占大多数,同时从人体艺术扩充到影视,在14年乌克兰橙色革命后,乌克兰美女人数进一步扩充,同时俄罗斯由于失去了屏障和贸易伙伴,经济变差,俄罗斯美女人数都在上升;同时这些高加索美女的薪水应该是在下降。因为之前只能在一家公司的出品看到她们身影,而且尺度都是在唯美,最多是百合。14年后,在不少公司出品可以看到她们身影,尺度已经是正常人看到的最大尺度了。

上面都是天生拥有女神级容貌的人的境地,那普通的呢?乌克兰之前代孕价格是30万人民币,橙色革命后,逐年下降,现在是20来万。看到这个,大家是不是想起这幅图。

xxx

以这个女生的容貌,香港真的变成乌克兰那样,她连代孕的资格都没有,极可能被做成海豚人。(这个大家不要搜索,会疯的)。

在这些战乱国家,女人的待遇是这样,那么男人呢,叙利亚雇佣兵被曝插手亚阿战争 月薪6000元 ,看到这个,不知道还有多少人敢说生命是无价的。生命一直都是有价的,只是大家生活在一个和平强大的国家,才有生命是无价的幻觉。想当初,我们弱小时,鬼子以士兵走失为由,发动战争,屠杀我们万千同胞,那时,一个鬼子的生命比我们几千同胞生命还要贵。

前段时间在quora看到一个回答,是回答”乌克兰橙色革命谁得益了“。回答者是乌克兰男人,他在说,乌克兰人得益最多。

只能说,本来翻个墙出去看个黄网,想不到变成小粉红了。

科技

在知乎上,我关注了这些问题。

史书中有哪些看似轻描淡写实则很残酷的话?

史书中有哪些细思恐极的细节?

不生孩子,靠养老院养老靠谱么?

第一二个问题的解决,很多时候,还是要靠科技,只有科技发展了,把蛋糕做大,才能够避免人相食的黑暗面。也只有科技,才可能更好地追踪罪犯,维持治安。AI独角兽公司商汤的展厅,有一个很震撼的展示,一个在十字路口的片段,任何人一经过,立马显示出他/她的性别,大致年龄,穿着,如果和系统相连,可以立马显示出他/她的身份。这样的技术,用在智慧治安方面,对警察的帮助是非常大的。

第三个问题和职场上的性别歧视,应该是当今社会大家都面临的问题。在科幻小说大师阿西莫夫的《机器人系列》里,描述了机器人在人类社会广泛的使用,在第一个人类开拓的外星球Aurora上,一个人可以拥有4-5个机器人,另外一个外星球Solaria上,一个人可以拥有1万个机器人。在这些外星球上,人类都是非常开心地活着,可以选择自己想从事的职业,生育已经不再是痛苦,人都非常长寿,都是几百岁,可以维持年青的状态。在这个系列里,全息投影技术和机器人驾驶,出现在1957年出版的《裸阳》。机器人自主挖矿这些,出现在这个系列第一部《我,机器人》。

设想一下,如果生育是一种痛苦的过程,科技发展了,有AI孵育,AI教育,这种痛苦也不存在了,生育加在女性身上的负担自然就不存在了,更加不用说性别歧视。那么养老呢,如果人均拥有3-5个机器人,你需要担心吗?如果都有AI挖矿之类,还会有尘肺病之类的问题吗?

在凝视了暗网这个深渊后,更加要明白怎么把光明带来,努力搞好科技,变得更加发达。科技上任何一个新的突破,都可以带来数以百万计的工作机会,而且会更加安全。

暗号:f36cf

请点赞,在看,转发一键三连,谢谢


文章来源: http://mp.weixin.qq.com/s?__biz=MzU4NjY0NTExNA==&mid=2247488160&idx=1&sn=3abcde4297b57392eb8f49631c85305c&chksm=fdf979b5ca8ef0a3fff23527bb9ba2a00783bb40f689dbb3c648e259066ea031882b45a37d2f#rd
如有侵权请联系:admin#unsafe.sh