首页 理论教育 数据选取与预处理:成果

数据选取与预处理:成果

时间:2023-07-28 理论教育 版权反馈
【摘要】:要由上述原始数据得到所需的样本数据,还需经过下述步骤对其进行处理。由此,分别得到内部欺诈损失样本数据1 541个和外部欺诈损失样本数据681个。

数据选取与预处理:成果

本章所采用的数据是由通过各种渠道收集到的1987~2014年间银行保险证券、非银行金融机构等多个金融行业共计3 341条操作风险事件中整理而来的,这些原始事件具有时间跨度大、包含内容多、样本数据量大等特点。所有操作风险事件均由金融机构名称及其所属省份和机构级别、案发地点、涉案金额、损失金额、事件类型、业务部门、案件描述、来源文件、新闻链接以及人员身份等基本因素组成,每个组成因素所包含的具体内容如下。其中,操作风险事件中各金融机构所属的机构性质包括中央银行、合资银行、政策性银行、国有商业银行、国有专业银行、股份制商业银行、邮政储蓄银行、外资银行、城市商业银行、农村商业银行、农村合作银行、农村信用合作社、三类新型农村金融机构(包括镇银行(股份)有限公司、镇银行、农村资金互助社)、信用卡公司、支付平台、信托投资公司、企业集团财务公司、金融租赁公司、证券公司、保险公司、其他股份有限公司证券交易所汽车金融公司、货币经纪公司、消费金融公司等;金融机构所属省份包括中国几乎所有的省份及直辖市;金融机构的级别对于银行类金融机构来说包括总行、一级分行、二级分行(省一级分行下市级分行)、一级支行(直辖市或计划单列市一级分行下支行)、支行、二级支行、营业部(业务部、业务处)、分理处((筹划中的)办事处、办理处、管理处、代理处、营业处、网点)、储蓄所(营业室、营业所、营业点、外币兑换所、营业厅、自助银行、ATM机、服务店)、网上银行、信用合作社、互助合作社、邮政储蓄等,对于其他金融机构来说主要包括总公司和子公司等;案发地点指的是操作风险事件发生的具体地点,即事件发生所在的省、市、区县、街道、级别以及部门等;涉案金额指的是操作风险事件中所涉及到的金额大小;损失金额指的是操作风险事件中损失掉的金额大小;事件类型主要指的是引起操作风险事件发生的原因或者说操作风险事件发生时所处的金融系统环节,主要包括内部欺诈、外部欺诈、就业政策和工作场所安全性、客户、产品以及业务操作、实体资产损失、业务中断和系统失败、执行、交割以及流程管理等;业务部门主要指的是操作风险事件发生所处的金融机构下属部门,如某公司的交易与销售部门等;案件描述主要是对操作风险事件的整个过程的详细描述;来源文件和新闻链接主要指的是操作风险事件的出处,如新闻报道、已有的案例分析等,若出自于新闻报道,则附有对应的新闻链接;人员身份指的是操作风险事件所涉及到的人员的身份信息,一般主要是指该人员的职位等。当然,除了金融机构名称、涉案金额、损失金额等主要因素以外,并不是每个操作风险事件均能找到其他各个因素对应的内容。该部分所使用的原始数据来源于科德操作风险数据库

要由上述原始数据得到所需的样本数据,还需经过下述步骤对其进行处理。首先,根据事件类型这一因素,选择出所有事件类型为内部欺诈和外部欺诈的操作风险事件,并提取这些事件中的损失金额数据作为样本数据,得到可用的数据共计2 222个;其次,将部分以美元或者港币等其他币种为单位的损失金额根据当年的汇率转换成人民币,并均以万元为单位;最后,由于样本数据的时间跨度比较大,因此为了使得所有的这些损失金额数据具有可比性,将上述金额按照每一年的居民消费价格指数进行调整,并将调整后的数据按照操作风险事件所属的事件类型分为内部欺诈损失数据和外部欺诈损失数据。由此,分别得到内部欺诈损失样本数据1 541个和外部欺诈损失样本数据681个。(www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈