2024年3月15日发(作者:)
统计分析方法与Stata应用(2015年春季学期)
第一讲 Stata的学习背景与学习意义
一、Stata是什么?
“Stata”并非数个单词的缩写(因此其正确拼写为Stata而非STATA),而是由
“statistics”和“data”合成的一个新词,Stata公司的员工都将其读做“Stay-ta”。从这
个小小的趣闻中,可以看出Stata在问世之初(1985年)的主要功能在于统计分
析和数据处理。经历了三十余年的发展,Stata已经升级到第13.1版(表1),在
不断强化上述功能的同时,Stata在矩阵运算、绘图、编程等方面的功能也在不
断加强。
表1 Stata发展历程
版本
13.1
13
12.1
12
11.2
11.1
11
10.1
10
9.2
9.1
9
8.2
8.1
8
发布日期
Oct-13
Jun-13
Jan-12
Jul-11
Mar-11
Jun-10
Jul-09
Aug-08
Jun-07
Apr-06
Sep-05
Apr-05
Oct-03
Jul-03
Jan-03
版本
7
6
5
4
3.1
3
2.1
2.05
2
1.5
1.4
1.3
1.2
1.1
1
发布日期
Dec-00
Jan-99
Sep-96
Jan-95
Aug-93
Mar-92
Aug-90
Apr-89
Jun-88
Feb-87
May-86
Aug-85
May-85
Feb-85
Jan-85
资料来源:/support/faqs/res/
Stata擅长数据处理、面板数据分析、时间序列分析、生存分析,以及调查数据
分析,但其它方面的功能也并不逊色(表2)。
表2 Stata的功能一览
1
数据处理和绘图
Data management
统计分析和检验
Basic statistics
ANOVA/MANOVA
回归分析
Linear modelsMLE
Multilevel mixed Probit/Logit/Count
models
多变量模型(多元统 抽样和模拟分析
计)
Multivariate Cluster analysisResampling and
methodssimulation
调查分析和生存分析
Survey methodsSurvival analysisEpidemiologists
编程
Programming MataUser-written
languagecommands
Graphics
Nonparametric
methods
其它检验方法和函
数
GLM
Panel data
Exact statistics
GMM
Time series
二、为什么要学习Stata
1.时代发展的需要:大数据时代的兴起
(1)什么是大数据?
传统的统计分析常常希望数据多多益善。也就是说,数据越多,分析越深入,
所得的结论就越全面。从字面含义上理解似乎指的是数量庞大信息量巨大的数
据。大数据常常被描述成已经大到无法用传统的数据处理工具进行管理和分析的
极大的数据集。超大的数据量只是大数据概念的一个部分。大数据涉及结构化数
据、非结构化数据和半结构化数据这三类数据。
①结构化数据通常指的是传统数据库中的数据,利用结构化查询语言
(Structured Query Language,简称SQL) 来存取数据以及查询、更新和管理数据
库系统。
②非结构化数据一般无法直接进行商业智能分析,这是由于非结构化数据无
法直接存储到数据库表中,也无法被程序直接使用。二进制图片文件就是非结构
2
发布者:admin,转转请注明出处:http://www.yc00.com/web/1710454098a1759533.html
评论列表(0条)