首页 理论教育 监狱智能化安全防范技术实现

监狱智能化安全防范技术实现

时间:2023-08-06 理论教育 版权反馈
【摘要】:设计的罪犯矫正证据强关联规则挖掘策略为:通过建立罪犯犯罪行为因素分析模型和罪犯再犯行为因素分析模型,对数据关联挖掘算法Apriori 算法和FP-Growth 算法进行业务实现,将算法处理结果和罪犯犯罪行为因素分析模型及罪犯再犯行为因素分析模型进行反复相互验证,最终完成模型和算法的修正。

监狱智能化安全防范技术实现

设计的罪犯矫正证据强关联规则挖掘策略为:通过建立罪犯犯罪行为因素分析模型和罪犯再犯行为因素分析模型,对数据关联挖掘算法Apriori 算法和FP-Growth 算法进行业务实现,将算法处理结果和罪犯犯罪行为因素分析模型及罪犯再犯行为因素分析模型进行反复相互验证,最终完成模型和算法的修正。

为了实现数据关联规则智能挖掘,对罪犯问卷调查结果采用了复杂定量分析、交叉制表、卡方检验等手段进行综合性评估,评估过程中仅考虑单个因素对罪犯犯罪、再犯罪的影响。评估结果表明:罪犯的年龄因素、罪犯的家庭状况及家庭关系因素、罪犯的文化程度、罪犯的婚姻状况、社交习惯、意见接纳程度、解决问题的方式、犯罪类型、刑期、居住状况、家人中有无违法犯罪人员、就业、收入状况及收入支配情况、不良生活习惯(如酗酒、网瘾等)等均会诱发罪犯犯罪行为。其中:吸毒、酗酒容易诱发再犯,由于生活需要诱发再犯比例下降,但仍然很高;由于冲动诱发再犯比例下降,但仍然很高;由于报复他人再犯比例下降明显;社会地位等社会因素易诱发再犯行为;经济因素,快速赚钱再犯比例上升明显;对被害人的愧疚心理越高再犯率越低;此次刑罚执行期间有无违法违纪,违纪状况出现越多再犯比例越高;有过脱逃行为的罪犯更容易再犯。

根据评估结果,建立罪犯犯罪行为因素数据分析模型和罪犯再犯行为因素数据分析模型。

建立的罪犯犯罪行为因素分析模型如图3-7所示,罪犯犯罪可能性因子(P)=(Ai×FA+Fi×FF+FRi×FFR+MRi×FMR+SCi×FSC+OSi×FOS+SMi×FSM+CTi×FCT+Si×FS+HSi×FHS+FCi×FFC+INi×FIN+LSi×FLS)。

建立的罪犯再犯行为因素分析模型如图3-8所示,罪犯再犯可能性因子(P)=(LSi×FLS+INi×FIN+IMi×FIM+SLi×FSL+GUi×FGU+DSi×FDS+ESi×FES+REi×FRE)。

图3-8 罪犯再犯行为因素分析模型

采用关联规则分析挖掘技术,融合罪犯原始基础数据和服刑期间的狱内实时数据管控,基于两种循证矫正数据设计分析模型,设计数据关联规则智能挖掘算法,找出数据库中隐藏的关联网,有助于发现罪犯犯罪行为与罪犯基本属性及客观属性间的关系、罪犯再犯与初犯间的关联关系,以及再犯与罪犯基本属性及客观属性间的关系。

(1)关联规则的发现过程。

①迭代识别所有的频繁项目集。

此过程要求频繁项目集的支持度不低于用户设定的最低值。

从原始资料集合中,找出所有高频项目组。高频的意思是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。以一个包含A 与B 两个项目的2-itemset 为例,我们可以求得包含{A,B}项目组的支持度,若支持度大于或等于所设定的最小支持度(Minimum Support)门槛值时,则{A,B}称为高频项目组。一个满足最小支持度的k-itemset,则称为高频k-项目组,一般表示为Largek 或Frequentk。从Largek 的项目组中再试图产生长度超过k的项目集Largek+ 1,直到无法再找到更长的高频项目组为止。

②关联规则数据挖掘。

从频繁项目集中构造置信度不低于用户设定的最低值的规则,产生关联规则。识别或发现所有频繁项目集是关联规则发现算法的核心,也是计算量最大的部分。

支持度和置信度两个阈值是描述关联规则的两个最重要的概念。一项目组出现的频率称为支持度,反映关联规则在数据库中的重要性。而置信度衡量关联规则的可信程度。如果某条规则同时满足最小支持度(min-support)和最小置信度(min-confidence),则称它为强关联规则。

就“酗酒+婚姻不稳定”对再犯行为造成的影响这个案例而言,使用关联规则挖掘技术,对数据库中的记录进行信息挖掘,首先必须要设定最小支持度与最小可信度两个门槛值,在此假设最小支持度min-support =5%,最小可信度min-confidence =65%。因此符合需求的关联规则将必须同时满足以上两个条件。若经过挖掘所找到的关联规则{酗酒,婚姻不稳定}满足下列条件,将可接受{酗酒,婚姻不稳定}的关联规则。用公式可以描述为:

Support(酗酒,婚姻不稳定)≥5% and Confidence(酗酒,婚姻不稳定)≥65%。(www.xing528.com)

其中,Support(酗酒,婚姻不稳定)≥5%于此应用范例中的意义为:在所有再犯记录中,至少有5%的罪犯具备酗酒和婚姻不稳定这两项因素。Confidence (酗酒,婚姻不稳定)≥ 65%于此应用范例中的意义为:在所有再犯记录中,至少有65%的罪犯在酗酒的同时具备不稳定的婚姻。

因此,今后如果有罪犯出现曾经有酗酒和婚姻不稳定等因素,我们将该罪犯定义为再犯高发对象。这个定义是根据{酗酒,婚姻不稳定}关联规则而定,因为普遍犯罪规律支持了这种定义。

(2)关联规则算法。

本课题内置两种关联规则算法,Apriori 算法和FP-Growth算法。

①Apriori 算法。

Apriori 算法流程如图3-9所示。找出频繁“1 项集”的集合,该集合记作L1。L1 用于找频繁“2 项集”的集合L2,而L2 用于找L3。如此下去,直到不能找到“K 项集”。随后,产生关联规则,对于每个频繁项集L,产生L 的所有非空子集,对于L 的每个非空子集S,如果P (L)/P (S)≧min_conf,则输出规则“S àL-S”。

图3-9 Apriori 算法流程

②FP-Growth 算法。

FP-Growth 算法的基本思路是:不断地迭代FP-tree 的构造和投影过程。对于每个频繁项,构造它的条件投影数据库和投影FPtree。对每个新构建的FP-tree 重复这个过程,直到构造的新FPtree 为空,或者只包含一条路径。当构造的FP-tree 为空时,其前缀即为频繁模式;当只包含一条路径时,通过列举所有可能组合并与此树的前缀连接即可得到频繁模式。

a.FP-tree 的生成。FP-tree 的生成方法如图3-10所示。第二步根据支持度对频繁项进行排序是FP-tree 的生成的关键。通过将支持度高的项排在前面,使得生成的FP-tree 中,出现频繁的项更可能被共享,从而有效节省算法运行所需要的空间。

图3-10 FP-tree 生成方法

b.FP-tree 子集分割。FP-tree 子集分割方法如图3-11所示,求p 为前缀的投影数据库:根据头表的指针找到FP-tree 的两个p节点,搜索出从这两个节点到树的根节点路径的节点信息(包含支持度)。然后累加路径节点信息的支持度,删除非频繁项,对剩下的频繁项按照前文的方法构建FP-tree。

采用关联规则分析挖掘技术,融合罪犯原始基础数据和服刑期间的狱内实时数据管控,建立罪犯犯罪行为因素数据分析模型和罪犯再犯行为因素数据分析模型,设计2 种数据关联规则智能挖掘算法,找出数据库中隐藏的关联网。通过数据关联规则智能挖掘算法研究,能够对调查问卷的结果分析提供理论和工具支撑,保证罪犯矫正证据集合确定的准确性,并能够支持矫正证据集合的动态监测和变更,另外关联规则智能挖掘算法对业务关联规则(罪犯基本信息关联规则及量表自测得分关联规则)提供底层支撑。

图3-11 FP-tree 子集分割方法

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈