Stata初高级特训_2025年寒假

现场

6000元/5600元(学生优惠价仅限全日制本科及硕士在读)

远程

6000元/5600元(学生优惠价仅限全日制本科及硕士在读)
上课地点:北京现场班, 同步远程直播; 均提供录播回放 讲师:崔百胜 报名时间:2024/10/28 - 2025/12/31 开课时间:2025年1月13-15, 17-19日 (六天)

一、课程简介

2025年寒假 Stata 课程专为希望在数据分析和计量经济学领域精进技能的学员设计,课程聚焦Stata 软件在学术研究和实务操作中的强大应用,致力于提升学员的数据管理和模型构建能力。本课程提供完整的代码、配套数据和案例解析,分为初级和高级两个层次,逐步带领学员从 Stata 的基础操作到高阶分析,掌握广泛应用于经济、金融、管理等多个领域的前沿分析技术。

在课程内容上,我们结合当前的研究热点,涵盖了从数据预处理、可视化到线性回归、工具变量、面板数据模型(静态和动态)、双重差分、断点回归、合成控制、机器学习与因果推断等多种常用的计量分析方法,力求让学员掌握多元化的模型选择和分析策略。特别值得关注的是,课程全面引入 AI 辅助技术,帮助学员高效完成数据清洗、变量选择、模型优化等繁琐任务。AI 的引入不仅提升了学习效率,更帮助学员掌握数据分析的自动化与智能化技能。

在初级课程中,学员将系统学习 Stata 的基础操作,掌握数据导入、数据清理、绘图等常用技能,为后续的数据分析奠定坚实基础。同时,课程详细讲解了 Stata 在经典计量经济学模型(如线性回归、工具变量法和面板数据模型)中的应用,包括基于 AI 的模型实现和结果解读,帮助学员高效掌握从变量边际效应到弱工具变量检验等关键技能。

高级课程则专注于前沿计量模型和因果推断方法,重点讲授面板模型的最新发展(如非平稳、动态和非线性面板数据模型)、因果推断效应(异质性双重差分、断点回归和合成控制法)以及复杂异质性处理效应等前沿方法。AI 在高级课程中的应用更为突出,包括自动化高维面板数据模型估计、模型选择和动态效果分解等,帮助学员快速适应计量经济学和数据科学的最新趋势。通过深入学习,学员不仅能理解模型背后的理论,还将具备直接应用于学术论文撰写和复杂数据项目分析的能力。

课程面向Stata 初学者、具有一定计量分析基础的学员以及希望掌握最新 Stata 工具和技术的学者。无论是学术研究、政策分析还是行业数据研究,课程都将为学员提供强大支持,并通过 AI 辅助工具提升分析效率,让学员从繁杂的数据处理中解放出来,专注于模型构建和结果分析。



二、课程对象

社会科学、经济管理、公共政策、教育学、医学统计等领域的学术研究人员和行业从业者,适合高校教师、科研院所研究员、在校博硕士研究生、优秀本科生、数据分析师、政府部门统计人员及需要使用 Stata 进行数据分析和计量研究的各类专业人士。无论您是从事经济、管理、金融、社会学、教育学、政治学、公共卫生,还是对数据分析、量化研究有浓厚兴趣的跨领域研究者,本课程都能满足您的学习需求。

特别是那些希望通过 Stata 软件进行高效、精准的数据分析的学员,将从课程中收获系统的实操指导和前沿的分析思维。课程中引入的 AI 辅助技术,能够帮助学员快速掌握数据清理、变量选择、模型构建等实用技能,从而在科研和实际工作中实现创新性突破。这些内容使课程具备了广泛的适用性和前瞻性,能够吸引各个领域中希望掌握 Stata 软件与数据分析技能的学员。


三、课程特色

1、 更加注重课程细节内容的设置和深入。

针对寒假班可能存在部分学员首次接触Stata软件的情况,本次课程在Stata软件操作的细节上进行了调整,增加了Stata菜单操作简介,使得学员能够更快熟悉Stata软件,另一方面,增加了从将从Wind数据库下载的数据直接转换为面板数据的实操部分,提升了数据处理实际技能。


2、 紧跟学科前沿与研究需要,优化了课程的章节内容。

针对较多学员对中介效应与调节效应模型较为关注的情况,将中介效应与调节效应单独作为一讲进行讲解,并对两类模型的构建、检验流程与分解方法进行详细讲授。针对较多学员对于向量自回归模型及扩展模型较为关注的情况,本次课程增加了结构向量自回归模型、符号约束向量自回归模型,贝叶斯向量自回归模型等宏观领域的较新模型。针对单方程模型可能无法描述复制经济现象的现实,本次课程增加了联立方程章节,详细讲授联立方程的识别、估计约束设定等重要问题。


3、 结合每讲主题,精心优化了课程的例文。

本次课程在对课程内容进行扩展的基础上,又对课程例文进行了精心挑选和优化,从研究主题上,尽可能考虑到大多数学员专业背景多样性的特点,多一些主题,从研究方法上,尽可能与该讲的主要模型类型相一致,增进对模型的理解和掌握,在软件实现上,尽可能与较新的命令应用相结合。



四、课程大纲

第一部分(初级)

第1讲 Stata基础操作(3h)

1.1 Stata软件快速入门

1.2 AI赋能Stata学习实例 2025 new

1.3 Stata菜单操作

1.4 Stata路径设定:sysdir和adopath

1.5 Stata外部命令科学管理与更新

1.6 各类文件的合理组织:do文件、ado文件和数据文件

1.7 Stata命令与帮助文件

1.8 do文件创建与优化

1.9 标量与矩阵

第2讲 数据处理与作图(3h)

2.1 数据处理准备

2.1.1 各类数据导入与导出

2.1.2 整理、提取和变量转换

2.1.3 AI辅助数据预处理 2025 new

2.2 合并、转换与堆叠

2.2.1 纵向与横向数据合并

2.2.2 数据转换

2.2.3 数据堆叠与面板数据构建

2.2.4 AI辅助合并与匹配 2025 new

2.3 数据清理

2.3.1 单变量清理

2.3.2 多变量清理

2.3.3 AI自动化数据清洗 2025 new

2.4 缺失值与补漏方法集成

2.5 数据清理实操

2.5.1 主流数据库:Wind数据转换为Stata面板数据

2.5.2 微观调查类数据处理:以CFPS数据为例

2.6 Stata数据的科学图形展示

2.6.1 基础图形命令应用

2.6.2 面板数据的动态显示

2.6.3 交错事件面板数据图形

2.6.4 回归系数可视化

2.6.5 分箱散点图

2.7 例文软件实现与解读:

① Cattaneo M D, Crump R K, Farrell M H, et al. On binscatter[J]. American Economic Review, 2024,

114(5): 1488-1514.

第3讲 Stata程序与编程(3h)

3.1 局域暂元与全局暂元

3.1.1 global的使用技巧

3.1.2 local的几种常用方法

3.1.3 AI提升暂元应用技能 2025 new

3.2 条件与循环语句

3.2.1 巧用if嵌套语句

3.2.2 循环语句

3.2.3 AI辅助语句解读 2025 new

3.3 程序编写规范与语法解析

3.3.1 Stata程序结构

3.3.2 程序参数解析

3.3.3 程序返回值

3.3.4 标准语法解析

3.3.5 参数类型验证

3.3.6 AI智能编写Stata程序 2025 new

3.4 ado文件与hlp文件

3.4.1ado文件编写规范

3.4.2标准文件的编写

3.5 Stata编程示例: LM和GMM估计的代码编程

第4讲 线性回归模型、内生性与工具变量法(3h)

4.1 regress估计、结果解释与边际效应

4.2 如何正确使用稳健与聚类-稳健标准误

4.3 Wild cluster bootstrap

4.4 自变量相对重要性的Shapley分解

4.5 AI辅助识别内生性与修正 2025 new

4.6 IV估计量:IV、2SLS和GMM

4.7 恰好与过度识别模型的IV估计

4.8 弱工具变量检验

4.9 弱工具变量的稳健推断

4.10 IV和OLS估计系数差异分解

4.11 例文软件实现与解读:

② 尹志超等. 农村劳动力流动对家庭储蓄率的影响[J]. 中国工业经济,2020.

③ Ishimaru S. Empirical decomposition of the iv-ols gap with heterogeneous and nonlinear effects[J].

Review of Economics and Statistics, 2024: 1-16.

第5讲 因果推断经验研究中的中介效应与调节效应(IV)(3h)

5.1 中介效应模型的现行做法与检验

5.2 中介效应检验的反思

5.3 中介效应分析的操作建议

5.4 中介效应估计新命令:sgmediation2

5.5 具有工具变量的中介效应分析

5.6 基于结构方程模型的中介效应分析

5.7 AI赋能中介效应分析 2025 new

5.8 调节效应与异质性分析

5.9 调节效应分析的操作建议

5.10 例文软件实现与解读:

④ 孙伟增,毛宁,兰峰等.政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验[J].

中国工业经济,2023.

⑤ 曹伟,綦好东,赵璨.企业金融资产的配置动机:基于产权性质与异质性股东参股的分析[J].中国工业经济,2023.

⑥ Braghieri L, Levy R, Makarin A. Social media and mental health[J]. American Economic Review, 2022.

第6讲 静态面板数据模型与双重差分法(3h)

6.1 估计量比较:混合OLS、组内、组间与一阶差分

6.2 模型选择检验:固定效应or随机效应模型

6.3 面板数据内生性与IV估计

6.4 高维固定效应模型:reghdfe

6.5 AI辅助静态面板数据模型估计、模型选择与结果解释 2025 new

6.6 政策评估两种偏误如何影响评估效果

6.7 双重差分的7种估计方法

6.8 双重差分法的平行趋势检验与安慰剂检验

6.9 Stata时间-空间维度安慰剂检验新命令

6.10 多期双重差分的估计与规范作图

6.11 三重差分估计如何检验平行趋势

6.12 例文软件实现与解读:

⑦ 曹清峰.国家级新区对区域经济增长的带动效应——基于70大中城市的经验证据.中国工业经济,2020.

第二部分(高级)

第7讲 长面板与动态面板数据模型(3h)

7.1 长面板估计策略

7.2 长面板估计方法选择:稳健 vs. 效率

7.3 组内自相关与组间同期相关检验

7.4 偏差校正LSDV估计

7.5 面板工具变量估计法

7.6 工具变量高维固定效应面板

7.7 移动份额工具变量法Bartik方法

7.8 动态面板数据的差分与系统GMM估计

7.9 不规则时间间隔的动态面板数据

7.10 AI赋能长面板与动态面板数据模型学习案例 2025 new

7.11 例文软件实现与解读:

① Acemoglu D, Naidu S, Restrepo P, et al. Democracy does cause growth. Journal of political economy,

2019.

② Borusyak K, Hull P, Jaravel X. Quasi-experimental shift-share research designs[J]. The Review of Economic Studies, 2022.

Economic Studies, 2022.

第8讲 非平稳与非线性面板数据模型(3h)

8.1 跨截面相依检验

8.2 面板单位根检验

8.3 面板协整检验

8.4 异质性数据的面板Granger检验-xtgrangert

8.5 静态面板门槛数据模型

8.6 具有内生性与门限效应的动态面板数据模型

8.7 共同因子数量测度

8.8 具有共同相关因子的动态面板数据模型

8.9 面板向量自回归模型(PVAR)

8.10 AI赋能非平稳与非线性面板数据模型学习案例 2025 new

8.11 例文软件实现与解读:

③ Ditzen J., Estimating long run effects and the exponent of cross-sectional dependence: an update to xtdcce2, The Stata Journal,2021.

xtdcce2, The Stata Journal,2021.

④ 王维国,王鑫鹏.创新转化效率、要素禀赋与中国经济增长[J].数量经济技术经济研究,2022.

第9讲 因变量受限的面板数据模型(3h)

9.1 面板二值选择模型

9.2 面板logit的边际效应与处理效应

9.3 面板多值选择模型

9.4 面板Tobit模型

9.5 面板计数模型:泊松与负二项模型

9.6 多项选择面板回归模型

9.7 高维固定效应泊松面板模型

9.8 动态面板Probit模型

9.9 非平衡面板的动态面板Probit模型

9.10 AI赋能因变量受限的面板数据模型学习案例 2025 new

9.11 例文软件实现与解读:

⑤ 吴小康,于津平.科技中介与全国统一技术大市场建设[J].数量经济技术经济研究,2023.

第10讲 异质性DID模型(3h)

10.1 如何在多期与处理时间变化时,选择合适的DID估计量?

10.2 负权重的诊断:de Chaisemartin and D’Haultfoeuille 分解

10.3 禁止比较组的诊断:Bacon分解

10.4 组别-时期平均处理效应估计:csdid和did_multiplegt

10.5 插补估计量:did_imputation

10.6 堆叠回归估计量:stackedev

10.7 通过TWFE的事件研究:eventstudyinteract与jwdid

10.8 Stata官方异质性双重差分命令:xthdidregress

10.9 放松或允许平行趋势假设被违反

10.10 稳健性推论和敏感性分析

10.11 异质性处理效应应用建议

10.12 AI赋能异质性DID模型学习案例 2025 new

10.13 例文软件实现与解读:

⑥ De Chaisemartin C, d’Haultfoeuille X. Two-way fixed effects and differences-in-differences with heterogeneous treatment effects: A survey[J]. The Econometrics Journal, 2023.

heterogeneous treatment effects: A survey[J]. The Econometrics Journal, 2023.

⑦ Roth J, Sant’Anna P H C, Bilinski A, et al. What’s trending in difference-in-differences? A synthesis of the recent econometrics literature, Journal of Econometrics, 2023.

the recent econometrics literature, Journal of Econometrics, 2023.

⑧ 余长林,马青山.特高压输电与区域经济发展——来自特高压工程的经验证据[J].数量经济技术经济研究,2023.

第11讲 断点回归与合成控制(3h)

11.1 精确断点回归

11.2 断点回归的检验(连续性检验、安慰剂检验)

11.3 模糊断点估计

11.4 多断点回归

11.5 断点回归(RDD)与扭点回归(RKD)的最优模型选择

11.6 合成控制法

11.7 非参数合成控制法

11.8 合成控制与合成双重差分的比较

11.9 AI赋能断点回归与合成控制学习案例 2025 new

11.10 例文软件实现与解读:

⑨ Cattaneo M D, Idrobo N, Titiunik R. A Practical Introduction to Regression Discontinuity Designs: Extensions[M]. Cambridge University Press, 2024.

Extensions[M]. Cambridge University Press, 2024.

⑩ Clarke, D Pailañir, S. Athey and G. Imbens. Synthetic Difference-in-Differences Estimation. IZA Discussion Paper, 2023.

Discussion Paper, 2023.

第12讲 Lasso在预测与推断中的应用(3h)

12.1 变量选择与交叉验证

12.2 收缩法:ridge, Lasso, elasticnet

12.3 Lasso用于预测

12.4 Lasso用于推断

12.4.1 变量选择与系数估计

12.4.2 获得标准误

12.5 不同结果变量的Lssso推断命令

12.5.1 连续结果变量

12.5.2 两元选择结果变量

12.5.3 计数结果变量

12.6 系数解释:边际效应、对比、获胜率、发生率

12.7 实例:探讨母亲教育和吸烟习惯对出生体重的影响

12.8 AI辅助Lasso在预测与因果推断中的应用 2025 new

12.9 扩展Lasso模型

12.9.1 adaptive Lasso

12.9.2 ivlasso

12.9.3 pdslass

12.9.4 dslasso

12.10 例文软件实现与解读:

⑪ Ahrens A, Hansen C B, Schaffer M E. lasso pack: Model selection and prediction with regularized regression in Stata[J]. The Stata Journal, 2020, 20(1): 176-235.

regression in Stata[J]. The Stata Journal, 2020, 20(1): 176-235.


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠与学生优惠价不叠加。


课程提供发票,开课通知及结业证书;课程资料包含do文档,讲义,数据及范例论文。


联系方式:

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu