首页 理论教育 SAS数据集变量名和观测值改进方法

SAS数据集变量名和观测值改进方法

时间:2023-08-10 理论教育 版权反馈
【摘要】:在SAS数据集中,变量名和变量观测值的字符应当简单,以使程序简单,计算速度提高。例如商业调查数据中,变量y的观测值取1、2、3和4表示被调查者对某商品的评价。例如SAS只允许变量名是英文字符,如果通过label语句在英文字符后加一个字符串,其中用一些中文字符作为解释,变量名的含义就明确易懂了。label语句只能在建立数据集时写进去,每当调用该数据集时变量名的信息都得到加强。

SAS数据集变量名和观测值改进方法

在SAS数据集中,变量名和变量观测值的字符应当简单,以使程序简单,计算速度提高。但是输出的变量名和变量观测值应当具有丰富信息,以使阅读者更好理解有关含义。例如商业调查数据中,变量y的观测值取1、2、3和4表示被调查者对某商品的评价。如果在输出时把1、2、3、4转换为很好、好、中和差就更易理解了。同样,也希望把变量名转换得更富有信息,例如把变量名x、y、z改为名字、地址、邮箱就便于理解输出的含义。

label语句对于每个输出的变量名增加1个字符串,它比变量名具有更丰富的信息。format语句常常配合format过程通过把原来的观测值替换成字符串,使得输出的变量观测值具有更丰富的信息。单独的format语句也能增加变量值输出的信息,但是功能有限,只是按几种固定的格式替换。如果format语句配合format过程,则能把原来的观测值替换成你需要的各种各样的字符串。这种用format语句增加信息量的方式可以在数据步实施(在建立数据集时使用format语句),也可以在加工步实施(在加工步中使用format语句)。在数据步增加信息的好处是只要在建立数据集时使用format语句,每当调用数据集时,就能在对该数据集的分析中得到较多的信息输出。在加工步增加信息的好处是只在具体某个加工步的输出中增加信息,缺点是这些信息的增加仅对某一加工过程适用,每调用一次新加工过程,就要添加一次format语句。例如,如果不在数据步增加信息,那么每画一次图要使用format语句,每输出一次表又要再添加format语句。而在数据步增加信息则不同,只要在建立数据集时使用一次format语句,在作图和制表过程中无需再使用format语句,无论画多少次图,输出多少数表,这些图和数表中变量值的信息都增加了。这儿仅介绍在数据步增加信息的做法,在加工步增加信息的做法以后介绍。

label语句能够用来增加输出变量名的信息,从而使变量名更便于理解和使用,其作用是在变量名后加一个label(标签)规定的字符串,该字符串可以很长,可以是中文,可以有空格。例如SAS只允许变量名是英文字符,如果通过label语句在英文字符后加一个字符串,其中用一些中文字符作为解释,变量名的含义就明确易懂了。label语句只能在建立数据集时写进去,每当调用该数据集时变量名的信息都得到加强。(www.xing528.com)

单独使用一条format语句,不调用format过程可以用固定的两种格式加强对输出变量值的描述,见5.2.1节;format过程能够根据需要自行创建替换格式,再结合format语句加强对输出变量值的描述,见5.2.2和5.2.3节;单独使用一条label语句就能加强对输出变量名的描述,见5.2.4节。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈