浅论侵公案件中公民信息统计方法
2025-1-7 16:1:0 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

背景

在数字化时代,个人信息的保护显得尤为重要。非法获取和滥用公民个人信息的行为,如通过网络攻击、黑客入侵、社会工程学手段或企业内部数据泄露等,不仅侵犯了个人隐私,还可能构成刑事犯罪。

非法获取、出售或者提供公民个人信息,具有下列情形之一的,应当认定为刑法第二百五十三条之一规定的“情节严重”:

(一)出售或者提供行踪轨迹信息,被他人用于犯罪的;

(二)知道或者应当知道他人利用公民个人信息实施犯罪,向其出售或者提供的;

(三)非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的;

(四)非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的;

(五)非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的;

(六)数量未达到第三项至第五项规定标准,但是按相应比例合计达到有关数量标准的;

(七)违法所得五千元以上的;

(八)将在履行职责或者提供服务过程中获得的公民个人信息出售或者提供给他人,数量或者数额达到第三项至第七项规定标准一半以上的;

(九)曾因侵犯公民个人信息受过刑事处罚或者二年内受过行政处罚,又非法获取、出售或者提供公民个人信息的;

(十)其他情节严重的情形。

公安机关在打击此类犯罪时,需要对犯罪嫌疑人的电子设备进行仔细检查,统计其中存储的公民个人信息数量。然而,如何准确统计这些信息条数,却是一个技术挑战。本文将探讨几种有效的统计方法,帮助执法部门更高效地进行公民信息的统计和管理。

01

常见公民信息统计方法

使用SQL查询语句统计公民信息

如果含有公民信息的表格文件较少,字段信息比较统一,可手工将文件导入到数据库中,使用SQL语句进行统计,其好处是能通过SQL语句进行灵活地查询统计,可支持大数据量的记录条数,效率较高。 

编写脚本统计公民信息

如果表格文件较多,格式不统一,用手工导入数据库则不现实,也无法仅仅手工合并表格进行统计,此时需要编写脚本进行处理。一般这种情况下的表格字段命名都不会统一,甚至没有字段名,需要通过一些特征方法进行处理,比如身份证号、手机号、姓名都会有特定的规则。

02

公民信息统计案例

案例一

案例背景:受害者袁某的个人信息被泄露,导致犯罪团伙通过打诈骗电话的方式诈骗其财物数万元。据办案机关调查,该犯罪团伙的电话号码在厦门某通信科技有限公司(下文简称“某公司”)开过户,通过对该公司后台服务器调证,得到该犯罪团伙拨打电话的记录表格并将表格制作成光盘交送至我单位。

委托需求:分别统计表格中犯罪嫌疑人拨打的电话号码次数和去重后的拨打电话个数。

简单分析

制作检材光盘的iso镜像,查看光盘内容,发现存在一个表格文件。查看表格内容,寻找表格内容的规律。

从表格内容可以发现,犯罪嫌疑人分别为“李某”、“唐某”、“曾某”和“胡某”。分析发现表格中每列都有对应的标题,可以尝试将这几个sheet导入到数据库中使用联表查询。

根据委托方需求,需对“机主信息”和“通话详单”中内容进行分析。将“机主信息”和“通话详单”导入到本地数据库中。操作步骤如下:

在数据库中选择导入excel文件。

选择文件所在路径和需要导入的表。

导入完成的界面如下图所示:

统计思路

通过观察表“通话详单”和“机主信息”发现,表“通话详情”中“号码”字段为嫌疑人在某公司的开户号码,且大多为重复项。

首先,需要对号码列进行去重,然后统计去重后每个号码所对应拨打的电话的次数,最后匹配表“通话详单”中“号码”字段在表“机主信息”的“机主姓名”字段。

编写SQL语句:

“SELECT

t.号码,

COUNT( t.号码 ) AS 拨打个数,

b.机主姓名

FROM

通话详单 t

JOIN 机主信息 b ON t.号码 = b.号码

GROUP BY

t.号码,

b.机主姓名;”

这段SQL查询语句是对“号码”列进行去重统计并对每个号码拨打的电话次数和统计机主信息进行统计。

查询结果如下图所示:

这样我们就匹配到每个电话号码所对应的机主姓名和每个号码所拨打的电话个数。

观察表“通话详单”中的“对方号码”字段,发现拨出的电话也有重复项,于是我们还需要对该字段所在列的号码进行去重。

编写SQL语句:

“SELECT

a.机主姓名 '姓名',

count( a.对方号码 ) '拨打次数',

count( DISTINCT ( a.对方号码 ) ) '拨打电话个数'

FROM

( SELECT `机主信息`.机主姓名, `通话详单`.号码, `通话详单`.对方号码 FROM `通话详单` LEFT JOIN `机主信息` ON `机主信息`.号码 = `通话详单`.号码 ) a

GROUP BY

机主姓名”;

SQL语句查询每个嫌疑人拨打电话总次数和总个数进行统计汇总,运行结果如下图所示:

经过表格内容整理后得到以下数据表格:

至此,我们就完成了委托方的需求,精准统计了每个嫌疑人侵犯公民信息的条数。

案例二

案例背景:某知名保险公司的分支机构遭遇了一起客户信息泄露事件。据调查,该事件涉及一个由某销售团队领导的非法获取客户信息的行为,他们利用这些信息进行不正当的商业活动。

委托需求

统计检材指定目录下表格文件中去重后统计各类公民信息数量。公民信息中含有“姓名”、“身份证号”和“保险”的为特殊公民信息,其它情况为普通公民信息。(表格文件以文件扩展名为“xls”或者“xlsx”的文件)。

简单分析

查看U盘下指定目录文件,如下图所示:

随机打开一个表格文件,查看表格中公民信息内容:

发现表格的格式比较混乱,内容也比较繁杂,此时无法通过SQL语句去查询,对于这种含有数千个表格,数十万条公民信息的存储介质来说,使用人工去判断需要耗费很大的人力,且统计结果没有说服力,无法得到办案机关的认可。

统计思路

对于这种数量较多且没有规律性的公民信息的统计,我们可以尝试写脚本去实现统计公民信息条数。

从上文可知,需要统计两种公民信息即特殊公民信息和普通公民信息。特殊公民信息的要素为“姓名”、“身份证号”、“保险”。同时不满足这三个要素且有身份证号视为普通公民信息。

脚本的思路为首先遍历指定目录下所有以xls和xlsx结尾的表格文件,其次对表格内容进行遍历,统计公民信息。

难点在于“姓名”要素的判断,经与委托方沟通,决定以百家姓为字典,每行的单元格的中文字符在2-4之间,且第一个或前两个中文字符属于百家姓的字典中,我们就认为这个单元格内容是姓名,如果一行中有一个单元格匹配到了姓名,后续单元格不做匹配,即一行中只存在一个姓名。身份证号就使用正则匹配去判断,保险只需要精准匹配即可。

编写python脚本check_user_info.py,脚本内容如下图所示;

该脚本读取指定目录下所有表格文件,首先使用正则表达式匹配身份证号,然后判断匹配到记录中整行内容是否含有“保险”两字,最后判断该行是否存在内容为2至4个中文字符且第一个字符或者前两个字符在百家姓里面的单元格,即判断该行中是否有单元格内容为姓名。若上述三个条件都符合,则认为该行记录为特殊公民信息;若含有身份证号,其余两个条件未同时满足,认为该行记录为普通公民信息。

打开命令提示符,输入“python check_user_info.py”运行脚本的过程如下图所示:

运行结果如下图所示:

至此,我们就完成了委托方的需求,统计了去重后检材中特殊公民信息和普通公民信息的条数。

小结

在当今数字化时代,公民信息的保护与统计处理显得尤为重要。面对海量且复杂的个人信息数据,我们需要采取创新且高效的方法来进行管理和分析。对于数据量较小的情况,我们可以通过手工操作和使用MySQL查询语句来实现精确的统计。然而,当面对庞大且复杂的数据集时,编写自动化脚本则显得尤为关键。

统计公民信息不仅是技术活,更是一项需要高度责任感和专业技能的任务。近年来,侵犯公民信息的犯罪行为日益猖獗,数据泄露和黑市交易成为社会关注的焦点。因此,掌握先进的公民信息统计方法,不仅是鉴定工程师必备的技能,更是维护社会安全和公民权益的重要手段。

在这个过程中,我们不仅要注重技术的实现,更要重视数据的安全性和隐私保护。通过不断优化和创新统计方法,我们能够更有效地保护公民的个人信息,同时为社会治理和决策提供有力的数据支持。

奇安信集团旗下有北京、上海、西安三家司法鉴定所:北京网神洞鉴科技有限公司司法鉴定所、盘石软件(上海)有限公司计算机司法鉴定所与陕西洞鉴云侦科技有限公司司法鉴定所。其中,上海所是上海第一家通过 CNAS 认证认可的民营计算机类司法鉴定机构。三所均通过了CMA资质认定,是目前国内少数能够通过自主研发软件进行取证与分析的电子数据司法鉴定机构,具有独立的实验室场所,其中包括:案件受理区、数据恢复区、手机取证区、计算机取证区、屏蔽室、无尘工作间和物证室,并配备多种国内外先进的技术设备检验及辅助设备。经过多年的时间积累和发展,现拥有一批胜任鉴定工作的专业技术人员,以专业的技能和丰富的经验,来开展电子数据司法鉴定工作。开展的鉴定服务范围包括:电子数据司法鉴定、计算机证据固定和获取、手机终端取证与分析、数据恢复、密码破解以及涉及电子设备的民事调查等。


鉴定热线&地址:

010-56509288(北京)

北京市西城区西直门外南路26号院1号-奇安信安全中心B1

021-52658848(上海)

上海市闵行区合川路2555号科技绿洲三期五-3号楼4层

029-86196688(西安)

陕西省西安市经济技术开发区凤城二路1幢经发大厦B座10607室


文章来源: https://mp.weixin.qq.com/s?__biz=MzAwNDcwMDgzMA==&mid=2651048236&idx=2&sn=a3991afc72074d42328529f8a97561ed&chksm=80d086ddb7a70fcb51d10af64226a543a1559fd17761f376fa6cb7025349f89b23a81ec30a5b&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh