STATA基本命令
文件路径命令
命令1:
pwd //显示当前工作路径
命令2:
dir //显 示当前路径下所有文件/文件夹
命令3:
cd“文件夹路径”//更改工作文件路径
use
“文件名.dta" //从当前文件路径读入数据
use
"文件名.dta" ,clear //删除当前数据, 并从当前工作路径下读入数据
示例
use auto.dta,clear
注:引号均为英文版,打成中文版本会报错
命令4:
global全局暂元名称\文件夹路径
use“$全局暂元名称\文件名.dta",clear
//global为全局单元,用来存储数据的文件地址,可以有效简化命令。
示例:
use $data\auto.dta,clear
命令5:
clear //删除 当前数据
stata内置变量:
特征:_ variables, 均已”"开头。如:
_
n表示数据集观察值的序号
_N表示当前数据集观察值总数
_pi包含pi值以表示精度
示例:
gen price2=price[_ n-1]
//生成新变量price2,取值是序号为n-1的样本的price变量取值
生成新变量:
命令1:
gen新变量名
注意:变量名由英文字母、数字以及下划线””组成,井且首字母必须为英文字母或者
下划线"_ °
否则将出现类似以下情形报错:
invalid name r(198)
注意:不建议变量以下划线””开头,因为stata内置变量格式为variables,
变量重命名:
命令1:
rename old new
//单一变量重命名(old指老变量名,new指新变量名,下同)
命令2:
rename
(old1 old...) (new1 new2 ..
)
//多个变量重命名
命令3:
rename old1 old2 ...
upper
//变量名转换成大写
命令4:
rename old1 old2 ..lowver
//变量名转换成小写
命令5:
rename old1 old2 ..proper
//首字母大写,并且紧接着非字母字符后的字母大写,其他字母小写
示例:
rename foreign ,upper
04、变量标签
命令1:
label variable变量名标签名
//解释变量的含义。因为变量名大多是英文缩写,妨碍理解。
示例: label variable rep“Repair Record 1978"
05、变量值标签
含义:变量值与含义的映射,主要应用于分类变量。包含两个步骤。
命令1:
label define值标签名称值标签内容
//定义标签内容
label define值标签名称值标签内容
//定义标签内容
label value变量名称值标签名称
//将变量值转换为对应的标签内容
示例:
label define repair78 1“好" 2 "较好" 3“中"4 "较差”5 "差"
label values rep78 repair78
//注意对应。容易混淆的话可以将值标签名称和变量名改成一致的:
label define rep78 1“好" 2 "较好”3“中" 4 "较差”5“差"
label value rep78 rep78
值标签的增改:
命令2:
label define值标签名称值标签内容,add
//给扩充变量值增加值标签
命令3:
label define值标签名称值标签内容,modify
//修改原有变量值的值标签
命令4:
label drop_ all
//删去所有变量的值标签
命令5:
label drop指定值标签名称
//删去指定变量的值标签
06、查看标签结果
命令1:
label list
//查看所有变量的变量标签(variable label)和变量值标签(value label)
示例:
. label list
repair78:
1“好”
2“较好”
3“中”
4“较差”
5“差”
命令2:
label list指定变量
//查看指定一至多个变量的变量标签(variable label) 和变量值标签( value
label)
示例:
label list origin
label list origin
origin:
0 Domestic
1 Foreign
07、查看数据
命令1:
describe
//查看数据存储类型、格式、值标签、变量标签。导入数据后了解数据特征的关键一
步
命令2:
summarize (描述)
针对所有变量的描述性统计,均值方差
su price age
也可以在后面加上变量名
只显示特定变量的统计结果
su price age, detail
更详细的结果,如偏度峰度这种
su price age if age>=30
命令3:
format设定数据类型
命令4:
生成统计表格
tabstat price length, stats(mean min max)
tabstat price length, stats(mean min max) by(foreign)
///按照foreign变量分类描述price和length
命令5:
详细列出来变量list
list price
list price in 2/10
列举第二个到第十个
命令6:
累积分布函数tabulate
ta price
08、图表命令
直方图histogram
histogram price
histogram price, frequency
纵坐标为对应样本数而非比例
histogram grade, discrete
散点图scatter
twoway scatter price wei
twoway代表二维
散点图+回归线
twoway (scatter price wei) (Ifit price wei)
Ifit - -次线性拟合
qfit二次拟合
折线图twoway line le year
graph
函数图function
条形图bar
饼状图pie
矩阵图matrix
其他命令
单等号命令=和双等号赋值==
gen dec= (month==12)
生成变量generate
注意新生成的变量名字要和以前的不同
gen age1 = age+1
gen Inprice = In(price)
替换变量replace
replace age = age +1
重命名rename
rename price p
批量重命名renvars
renvars price age/ p ag
删除drop
drop price
drop if (price == . )
删除price为空的
保留keep (反向的drop)
keep if (price > 100)
合并merge
把两个dta里面的数据合并到- -个
merge 1:1 data using merge1
计数count
比较大小compare
ttest t检验
ttest var = 2
检验样本的均值是否显著不同于2
ttest var1 = var2
检验同- -观察值的两个变量均值是否显著不同
10、回归命令
声明时间序列tsset
声明面板数据xtset
平行面板xtbalance
滞后- -阶L.price
滞后二阶L2.price
往前一阶F.price
差分D.price
线性OLS回归reg
reg y x1 x2
predict存回归命令中产生的变量
- -般是存拟合值和残差,保存残差,并保存为e变量
predict e, residual
残差自相关BG检验estat bgodfrey
OLS回归完DW检验自相关estat dwatson
rvfplot画出残差与拟合值散点图
estat imtest, white 怀特检验
hettest BP检验
多重共线性vif
test检验显著性
test price = 1
检验price变量的系数等于1 (F检验)
outreg线性结果导出
xtwest协整检验
xtreg固定效应
hausman Hausman豪斯曼检验