2024年4月30日发(作者:)
中国卫生统计2009年12月第26卷第6期
659·
计算机应用·
利用SPSS产生随机数字的常用方法
徐州医学院公共卫生学院流行病与卫生统计学教研室(2210o2) 金英良 黄水平 赵华硕
在医学研究中,科研工作者常常需要把研究对象
Variables子对话框下的Rv.Normal,点击l▲I按钮,在
进行随机分组,实现不同处理因素实验顺序的随机化
或在总体中随机抽取部分样本作为研究。以上问题均
涉及到统计学中随机化的问题,其目的主要是减少偏
性,提高均衡性,是统计学能够得出客观推断的前提。
实现随机化的主要方法有两种,即随机数字表和计算
机的随机数发生器。所谓的随机数发生器就是通过一
定的算法,对事先选定的随机种子做复杂运算,用产生
的结果来近似地模拟完全随机数,这种随机数被称作
伪随机数…。一些医学文献或书籍常常只是简单提
及SPSS产生随机数字的菜单操作命令,没有作为重
要知识点进行讲解。.笔者主要介绍如何利用SPSS
13.0统计分析软件产生随机数字的常用方法。
利用随机数生成函数生成随机数字
在SPSS统计软件中,利用随机数生成函数生成
列随机数字的方法是调用Transform菜单下的com—
pute子菜单,如图1所示。在Function group列表中列
出了可以实现各种功能的函数,这里我们选择Ran-
dom Numbers,立刻会在其下面的Functions and Spe—
cial Variables子对话框中会提供了一系列随机数生成
函数列表。不同函数表示各自所产生的随机数字符合
特定的分布,如t分布、F分布和Poisson分布等函数,
当我们选取相应函数时,其左侧对话框内会有相应的
函数功能英文介绍说明。
图1 SPSS 13.0统计软件Compu ̄Variable对话框
这里我们以常用的正态分布函数为例进行讲解。
软件所生成的随机数个数与数据库中的记录数相同,
这里我们事先建立NO变量,并输人从1到l0作为要
进行随机化的记录编号。在Compute Variable对话框
下的Target Variable框中输入随机数的变量名,这里
我们定义为rnadom,然后选取Functions and Specila
Numeric Expression表达式框内会出现Rv.NORMAL
(?,?)函数表达式,如图1所示。在Rv.NORMAL
(?,?)中两个问号分别代表我们要定义的正态分布均数
和标准差,这里我们以输人均数=100,标准差=10为
例,最后点击OK按钮提交,结果在SPSS 13.0数据窗
口中的random变量一列会产生一组随机数字,见图2。
矍t 遵 皇 曼嫩= ! 里 一 7 r y. ̄I 一
蠢 蔫l 鬟 掣 ll-'一 薹…
∞||
一 试 蔷卜^ 。 f…1 0 i、
加J7
6。~ ∞ 105 7.…… … ’…‘~
~一' 酊一一1 … ………~…一一’
6一 qig3 ̄…洒86’ :~ ~
i一…自1j…… ………… 。一 ’…~一
{E 硒’ 1¨J0 。一 ~ …
图2利用SPSS13.0软件生成随机数字结果
利用随机数生成器生成随机数字
首先,调用Transform菜单下的Random Number
Generators子菜单。该对话框主要包括Active Genera-
tor和Active Generator Initialization两部分内容。其中
Active Generator部分,SPSS 13.0软件主要提供了两
种随机数字生成器SPSS 12 Compatible和Mersenne
Twister。SPSS 12 Compatible:SPSS 12及之前版本的
随机数字生成器,这里为软件默认选项,一般可以不做
修改。Mersenne Twister:基于马特赛特旋转的随机数
字生成器。在Active Generator Initialization部分,其
功能为随机数生成器初始值设置。Random选项为随
机选定随机数种子。在利用计算机产生随机数字的过
程中,随机数的产生依赖于随机数种子,随机数字种子
不同,会产生一列不同的随机数。如果每次输人同样
的种子,就会得到完全相同的一列随机数。Fixed Val—
ue选项为由操作者设定随机数种子,可选择1—
2 000 000 000之间的正整数 。
利用具体随机数种子生成随机数字的基本步骤:
1.在Fixed Value选项中填入任意一数字,这里我
们以填入50为例,点击Paste按钮,这时会自动弹出
SPSS语句编辑窗口(Syntax Editor),使该窗口最小化。
2.选择Transform菜单下的compute子菜单,在
Target Variable输入新的变量名,这里输入randoml,
在Numeric Expression中,我们重复上面利用正态分
660·
Chinese Journal of Health Statistics.Dec 2009.Vo1.26.No.6
布函数生成随机数字的过程,这里仍然选择以100为
均数,l0为标准差。
3.点击Paste按钮,在上面弹出的SPSS语句编辑
窗口中会增加一些利用正态分布函数产生随机数字的
接生成随机数的简便方法,此外还可以利用他人事先
编辑好的宏程序来实现随机数的生成。
参考文献
语句。选择菜单Run下面的 l,便会利用语句产生
1.陈卫中,张丽蓉.SPSS13.0中随机抽样的实现.现代预防医学,2007,
34(23):4_4854486.
列新的随机数字。结果见图2的randoml变量一
以上两种方法均是研究者利用SPSS统计软件直
列。
2.陈平雁,主编.SPSS13.0统计软件应用教程.北京:人民卫生出版社,
2005:54.
趋势季节模型在医院门诊诊疗人数预测中的应用
中国中医科学院广安门医院统计信息科(100053)黄 娟
门诊诊疗人次是衡量医院运营状况的一个重要指标,运
用统计方法预测医院未来某个时间段的门诊诊疗人次,可以为
,=Y ±to
os(,-1)S。=多 ±32 929
对该院2009年各季度的门诊诊疗人数预测结果见表3。
医院现代化管理提供参考依据。本文采用趋势季节模型来预
测医院门诊诊疗人次,是考虑到在该医院门诊诊疗人次的时间
序列中,除长期趋势外还存在明显的季节因素的影响。
资料来源
表2 2004—2008年门诊诊疗人数季节比率(%)计算表
资料来源于某医院2004—2008年度统计报表(表1)。
表1某医院2004—2008年各季度门诊诊疗人次数
年份
2oo4
季序
1
2
3
4
门诊人次
184 405
2l1 035
246 6l8
242 566
年份
2Oo7
季序
13
14
15
16
门诊人次
256 377
294 983
325 654
3l6 902
表3 2009年各季度门诊诊疗人数预测结果
2oo5 5 215 469 2o08 17 301 864
6
7
238 582
265 755
l8
19
349 l20
434 700
8 26l 652 20 397 745
2oo6 9
10
1l
12
234 355
273 556
3O9 261
296 374
合计 5 656 973
结论和建议
在一个时间序列中,若只存在长期趋势而不含季节变动的
影响,各时期的季节比率都应为100%。在本例中各时期的季
节比率大于或者小于100%,说明在这个时间序列中,除存在长
结果与分析
1.建立预测方程为:
Y.=184.452+9.371×t
期趋势外还存在季节变动的影响。其中各时期指标值偏离长
期趋势值越大,说明季节性影响越大。
运用趋势季节模型预测出该院2004—2008年的总门诊诊
疗人数为5 668 781人次,与实际门诊诊疗人数5 656 973人次
相比,相对误差只有0.2%,误差处于控制状态。说明本模型对
于医院门诊诊疗人数的预测效果较好。
季节比率的含义是各季水平比全期总水平高或低的比例,
即季节变动的一般规律,见表2。
趋势季节模型误差计算公札:
√擎。其
在存在长期趋势及季节变动影响的时间序列中,如医院某
个时期内住院人数的预测,医院门诊和住院收入的预测等等,
都可以运用趋势季节模型进行预测。选择正确的模型,对医院
经过计算S =15 733人次。
2.预测结果
本例自由度v=19,to 05f1 )=2.093,则门诊诊疗人数的预
测范围为:
些指标进行科学地预测,可以为医院现代化管理提供重要依
据。
发布者:admin,转转请注明出处:http://www.yc00.com/news/1714482466a2455109.html
评论列表(0条)