Stata小白系列之四:长宽数据转换

作者:谢作翰 | 连玉君 | (知乎 | | 码云)

编者按: 从本期开始,Stata 连享会将推出「Stata小白系列」推文,介绍数据导入、命令语法等 Stata 入门知识,以帮助各位尽快掌握 Stata 的基本操作。


目录
一 数据调入

0 概念区分

  1. 调入本地标准文件
  • 调入全部数据
  • 调入部分变量
  • 调入部分样本
  • 调入具有某些特征的样本
  1. 调入网络文件
  • 调用 stata 自带数据库——sysuse命令
  • 调入stata 手册在线数据 —— webuse set命令
  • Wooldridge, Greene 等经典教科书范例数据获取——bcuse命令
  • 调用联邦储备经济数据库 (FRED)——freduse&import fred
  1. 大杀器copy命令——从下载地址直接储存文件或复制网页文本信息
  2. 调入ASCII数据
  • 读取ASCII数据 —— insheet命令
  • 读取无固定格式命令 —— infile命令
  • 读取固定格式数据—— infix
  1. 调入excel数据——import excel &xls2dta

二 数据标签与排序

  1. 数据标签
  • 为数据库添加标签
  • 为变量添加标签
  • 为数值添加标签
  1. 数据排序—— sort& gsort

三 数据拆分与合并

  • 数据拆分

    1. 数据横向拆分—— keep& drop
    2. 数据纵向拆分—— keep& drop
    3. 一步到位保存数据子集—— savesome
  • 数据合并

    1. 数据的横向合并—— merge
    2. 数据的纵向合并—— append
    3. 对多个 csv文件纵向合并—— csvconvert

四 长宽数据转换—— reshape命令

  • 宽数据转为长数据
  • 长数据转为宽数据

数据文件:链接: https://pan.baidu.com/s/1qXRh9EG 密码: 5ltw


长宽数据转换—— reshape命令

面板数据中,如果包含两个标识变量,则数据有两种表现形式,一种是长数据,一种是宽数据。在长宽数据的转换中,所使用到的命令为
reshape,具体命令语句为:

reshape long stubnames, i(varlist) [options]
reshape wide stubnames, i(varlist) [options]

语句中, reshape代表数据转换的命令, long表示将宽数据转化为长数据, wide表示将长数据转化成宽数据, stubnames表示需要转化的变量名称前缀, i(varlist)表示识别变量。 options最常用的为 j(varname [values]),它表示用来进行长宽变换的变量名称,通常为时间变量。

宽数据转为长数据命令:

use c:\data\widedata, clear
 
reshape long english science, i(number name) j(year)
Stata小白系列之四:长宽数据转换_第1张图片
宽数据

Stata小白系列之四:长宽数据转换_第2张图片
转换过程

Stata小白系列之四:长宽数据转换_第3张图片
长数据

reshape long 表示将宽数据转化成长数据的命令语句, englishscience是要转化变量名称的前缀,也是即将生成变量的名称, i(number name)表示识别变量,即按学号number和名称 name区分所有观测值, j(year)表示将要长宽转换的变量,一般是按年份进行转化。

长数据转为宽数据命令:

use c:\data\longdata, clear
 
reshape wide english science, i(number name) j(year)
Stata小白系列之四:长宽数据转换_第4张图片
长数据

Stata小白系列之四:长宽数据转换_第5张图片
转换过程

Stata小白系列之四:长宽数据转换_第6张图片
宽数据

reshape wide表示长数据转成宽数据命令语句, englishscience表示将要转化的变量名称的前缀,也即将要生成的变量的名称, i(number name)表示识别变量,即按学号number和名称 name区分所有观测值, j(year)表示将要长宽转换的变量,一般是按年份进行转化。

本文中所用数据文件下载地址:

数据文件:链接: https://pan.baidu.com/s/1qXRh9EG 密码: 5ltw

关于我们

  • Stata 连享会(公众号:StataChina)】由中山大学连玉君老师团队创办,旨在定期与大家分享 Stata 应用的各种经验和技巧。
  • 公众号推文同步发布于 【-Stata连享会】 和 【知乎-连玉君Stata专栏】。可以在知乎中搜索关键词StataStata连享会后关注我们。
  • 推文中的相关数据和程序,以及 Markdown 格式原文 可以在 【Stata连享会-码云】 中获取。【Stata连享会-码云】 中还放置了诸多 Stata 资源和程序。如 Stata命令导航 || stata-fundamentals || Propensity-score-matching-in-stata || Stata-Training 等。

联系我们

  • 欢迎赐稿: 欢迎将您的文章或笔记投稿至Stata连享会(公众号: StataChina),我们会保留您的署名;录用稿件达五篇以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
  • 意见和资料: 欢迎您的宝贵意见,您也可以来信索取推文中提及的程序和数据。
  • 招募英才: 欢迎加入我们的团队,一起学习 Stata。合作编辑或撰写稿件五篇以上,即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
  • 联系邮件: [email protected]

特别说明

文中包含的链接在微信中无法生效。请点击本文底部左下角的【阅读原文】,转入本文【版】


Stata小白系列之四:长宽数据转换_第7张图片
Stata连享会二维码

你可能感兴趣的:(Stata小白系列之四:长宽数据转换)