近期现场/远程培训 Claude Code和Codex助力学术科研与应用
近期专题培训 跨越传统边界:AI赋能下的财务金融研究与论文发表
课程导引
高级课程专注于面板模型的最新发展与因果推断前沿方法两大核心领域,目标是帮助学员建立顶刊级别的实证分析竞争力。
近年来,面板数据模型与因果推断方法在实证研究中取得了突破性进展:异质性处理效应下的双向固定效应(TWFE)问题、动态面板与系统GMM、非平稳与门限面板、空间计量模型、机器学习与因果推断的交叉(Lasso IV、Double MachineLearning)等,已成为《AER》《QJE》《Journal ofEconometrics》《经济研究》《中国工业经济》等顶刊的标配方法。
高级课程围绕三大目标展开:第一,系统讲授长面板、动态面板、非平稳面板、门限面板、因变量受限面板(Logit/Probit/Tobit/计数模型)及空间面板数据模型的原理与Stata实现;第二,深入讲解异质性DID的理论困境与解决方案,包括负权重诊断、Bacon分解、csdid、did_imputation、stackedev、Stata官方命令xthdidregress等最新工具;第三,全面掌握断点回归(RDD/多断点/聚束效应)、合成控制法(SCM/合成DID)、机器学习因果推断(h2oml/Lasso/IVLasso)的前沿应用。
课程适合已完成初级班学习或具备较好Stata与计量基础的学员,通过AI辅助的高维模型估计、自动化稳健性检验与智能结果解读,帮助你快速适应计量经济学与数据科学的最新趋势。
高级班课程优势与特色
一、注重与初级课程的无缝衔接与能力跃迁
高级班在初级班(静态面板、标准DID、基础IV)基础上,自然延伸至:
面板模型进阶:长面板估计策略、动态面板(差分/系统GMM)、非平稳面板(单位根、协整)、门限面板、PVAR、因变量受限面板、空间面板
因果识别进阶:从标准DID到异质性DID(处理时间变化、负权重诊断、多种估计量选择)、从简单RDD到多断点/聚束效应、从合成控制到合成DID
方法融合:机器学习(Lasso、弹性网、随机森林、GBM)与因果推断(IV Lasso、PDLasso、DSLasso)的结合
二、注重面板模型与因果推断两大体系的系统性
高级班构建两大相对独立又紧密联系的模型体系:
面板模型体系:涵盖线性/非线性、连续/受限因变量、截面独立/空间相依的完整面板方法,包括高维固定效应泊松模型、动态Probit模型等前沿内容
因果推断体系:涵盖DID扩展(异质性DID、双向稳健DID、多阶段DID)、断点回归、合成控制法,形成政策评估的完整工具箱
三、注重方法的前沿性与顶刊应用对标
课程讲授的方法均对标2023–2025年顶刊最新应用:
异质性DID:de Chaisemartin分解、Bacon分解、csdid、did_imputation、stackedev、xthdidregress、eventstudyinteract
RDD前沿:连续性检验、密度检验、最优带宽选择(IK/CCT)、多断点、聚束效应(Bunching)
机器学习因果:h2oml集成、Lasso/Ridge/Elastic Net、IV Lasso、PDLasso、DSLasso,实现高维控制变量选择与因果效应估计
AI Agent实战:异质性DID智能选择Agent、RD全流程设计Agent、Lasso因果推断自动化Agent,实现从模型诊断到结果表格生成的半自动化流程
课程大纲(含13篇范例论文)
1.1 长面板估计策略
1.2 长面板估计方法选择:稳健 vs. 效率
1.3 组内自相关与组间同期相关检验
1.4 偏差校正LSDV估计
1.5 面板工具变量估计法
1.6 工具变量高维固定效应面板
1.7 动态面板数据的差分与系统GMM估计
1.8 AI赋能长面板与动态面板数据模型学习案例
1.9 例文软件实现与解读:
① Acemoglu D, Naidu S, Restrepo P, et al. Democracydoes cause growth.Journal of political economy, 2019.
② Borusyak K, Hull P, Jaravel X. Quasi-experimentalshift-share research designs[J]. The Review of Economic Studies, 2022.
第2讲 非平稳、门槛与PVAR(2h)
2.1 跨截面相依检验
2.2 面板单位根检验
2.3 静态面板门槛数据模型
2.4 具有内生性与门限效应的动态面板数据模型
2.5 具有共同相关因子的动态面板数据模型
2.7 AI赋能非平衡与非线性面板数据模型学习案例
2.8 例文软件实现与解读:
③ Ditzen J., Estimatinglong run effects and theexponent of cross-sectional dependence: an update toxtdcce2, The StataJournal,2021.
④ 王维国,王鑫鹏.创新转化效率、要素禀赋与中国经济增长[J].数量经济技术经济研究,2022.
⑤ Li X., Shen Y., Zhou Q., Confidenceinterverbal oftreatment effects in panel data models with interactive fixed effects, workingpaper, 2024
第3讲 因变量受限的面板数据模型(2h)
3.1 面板Logit/Probit模型
3.2 面板Logit的边际效应与处理效应
3.3 面板Tobit模型
3.4 面板计数模型:泊松与负二项模型
3.5 多项选择面板回归模型
3.6 高维固定效应泊松面板模型
3.7 非平衡面板的动态面板Probit模型
3.8 AI赋能因变量受限的面板数据模型学习案例
3.9 例文软件实现与解读:
⑥ 吴小康,于津平.科技中介与全国统一技术大市场建设[J].数量经济技术经济研究,2023.
第4讲 异质性DID模型(3h)
4.1 如何在多期与处理时间变化时,选择合适的DID估计量?
4.2 负权重的诊断:de Chaisemartin andD’Haultfoeuille 分解
4.3 禁止比较组的诊断:Bacon分解
4.4 组别-时期平均处理效应估计:csdid和did_multiplegt
4.5 插补估计量:did_imputation
4.6 堆叠回归估计量:stackedev
4.7 通过TWFE的事件研究:eventstudyinteract与jwdid
4.8 Stata官方异质性双重差分命令:xthdidregress
4.9 放松或允许违背平行趋势假设
4.10 稳健性推论和敏感性分析
4.11 异质性处理效应应用建议
4.12 异质性 DID 智能选择 Agent
诊断负权重问题(de Chaisemartin 分解)
在csdid/ did_imputation/ stackedev/ xthdidregress中选择最优估计量
生成事件研究图
4.13 例文软件实现与解读:
⑦ De Chaisemartin C, d’Haultfoeuille X. Two-wayfixed effects and differences-in-differences with heterogeneous treatmenteffects: Asurvey[J]. The Econometrics Journal, 2023.
⑧ Roth J, Sant’Anna P H C, Bilinski A, et al. What’strending indifference-in-differences? A synthesis of the recent econometricsliterature, Journal of Econometrics, 2023.
⑨ 余长林,马青山.特高压输电与区域经济发展——来自特高压工程的经验证据[J].数量经济技术经济研究,2023.
第5讲 断点回归与合成控制(3h)
5.1 精确断点回归
5.2 断点回归的检验(连续性检验、安慰剂检验)
5.3 模糊断点估计
5.4 多断点回归
5.5 断点回归设计的实证指南:操作规范、应用误区与实践拓展
5.6 聚束效应-另类断点回归-bunching
5.7 合成控制法
5.8 非参数合成控制法
5.9 合成控制与合成双重差分的比较
5.10 AI Agent 辅助 RD 完整设计:
执行连续性检验(密度检验、协变量平衡检验)
带宽选择(IK/CCT 最优带宽计算)
安慰剂检验(假断点、置换检验)
生成规范的结果输出表
5.11 例文软件实现与解读:
⑩ 黄炜, 向科谚, 袁洛琪. 断点回归设计的实证指南:操作规范、应用误区与实践拓展, 数量经济技术经济研究, 2025
⑪ 席鹏辉, 李瑶. 战略性新兴产业发展与重点税源维护:基于断点回归的证据, 数量经济技术经济研究, 2025.
⑫ Clarke, D Pailañir, S. Athey and G. Imbens.Synthetic Difference-in-Differences Estimation. IZA Discussion Paper, 2023.
第6讲 基于机器学习的因果推断(3h)
6.1 机器学习与因果推断
6.2 Trae 作为 Stata 机器学习开发环境
演示如何在 Trae 中管理复杂的 h2ml 命令、自动补全参数、用 AI 解释混淆矩阵结果
结合 Trae 的 Agent 模式,实现"从数据导入→模型训练→结果解读"的半自动化流程
6.3 Stata与机器学习集成:h2ml命令应用
6.3.1 H2O数据准备
6.3.2 变量选择与交叉验证
6.3.3 h2oml rf:用于回归和分类
6.3.4 h2oml gbm:用于回归和分类
6.3.5 h2oml估计后检验:混淆矩阵
6.3.6 h2omlgof:机器学习模型拟合比较
6.4 Lasso与ridge、 elastic net的应用比较
6.5 Lasso用于预测和因果推断
6.5.1 变量选择与系数估计
6.5.2 获得标准误
6.6 不同结果变量的Lssso推断命令
6.6.1 连续结果变量
6.6.2 两元选择结果变量
6.6.3 计数结果变量
6.7 系数解释:边际效应、对比、获胜率、发生率
6.8 实例:探讨母亲教育和吸烟习惯对出生体重的影响
6.9 扩展Lasso模型
6.9.1 adaptive Lasso
6.9.2 ivlasso
6.9.3 pdslass
6.9.4 dslasso
6.10 AI Agent 自动化 Lasso 因果推断:
自动完成 ivlasso/pdslasso/dslasso 的变量选择
自动输出选择后的 IV/控制变量清单
自动生成可放入论文的结果表格
6.11 例文软件实现与解读:
⑬ Ahrens A, Hansen C B, Schaffer M E.lassopack:Model selection and prediction with regularized regression in Stata[J]. TheStata Journal, 2020, 20(1): 176-235.
第7讲 AI智能体驱动的完整实证研究流程(3h)
以一个真实研究问题为例演示完整流程:
Trae 环境:用 Trae 搭建项目框架,管理 do 文件
数据智能体:自动下载/清洗 Wind + 专利数据
模型智能体:自动识别适合 DID/IV/RD 中的哪种方法
编程智能体:Trae 自动生成核心回归代码
稳健性智能体:自动执行 3-5 种稳健性检验
写作智能体:自动生成结果解读文字(可直接放入论文)
优惠:
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
以上优惠不叠加。
课程提供发票,开课通知及结业证书;课程资料包含do文档,讲义,数据及范例论文。
联系方式:
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu
