Trae及AI智能体助力Stata初高级特训_2026年暑期

现场

6000元

远程

6000元
上课地点:南京现场班,同步远程直播;均提供录播回放 讲师:崔百胜 报名时间:2026/06/01 - 2026/07/16 开课时间:2026年7月17-19, 21-23日 (六天)

课程导语

2026年课程全面升级为"Stata + Trae IDE + AI Agent" 三位一体的新型实证研究训练体系。

课程专为希望系统掌握现代计量方法并提升论文实证能力的学员设计。在初级班,你将从Stata基础操作出发,快速掌握数据清洗、面板数据构建、可视化、线性回归、工具变量、面板数据模型、中介与调节效应、双重差分(DID)等主流方法,并借助AI完成自动化代码生成、内生性诊断和结果解读。在高级班,你将深入异质性DID、断点回归(RDD)、合成控制法(SCM)、动态面板、非平稳与门限面板、空间计量、机器学习因果推断(Lasso/IV Lasso/h2oml)等前沿方法,建立顶刊级别的因果推断分析能力。

课程提供完整代码、配套数据与案例解析,涵盖经济、金融、管理、公共政策等多个领域。AI的引入不仅提升学习效率,更帮助你建立从数据处理、模型构建到论文写作的自动化科研 workflow,从繁杂的技术细节中解放出来,专注于研究设计本身。


课程目标

初级班:解决"AI时代如何快速进入现代实证科研"

核心能力Stata软件操作、数据管理与清洗、主流计量模型实现

AI赋能Trae IDE配置、AI代码补全与Debug、自动化DID设计、中介效应Agent

方法覆盖OLSIV/2SLS/GMM、静态面板、中介效应、调节效应、标准DID/多期DID

课程目标让学员立即能做科研——独立完成数据清洗到基准回归的完整流程

高级班:解决"如何进入顶刊级现代因果推断"

核心能力:复杂面板模型、异质性处理效应、因果推断前沿方法

AI赋能:自动化高维面板估计、异质性DID智能选择AgentLasso因果推断自动化、RD全流程Agent

方法覆盖:动态面板/系统GMM、异质性DIDcsdid /did_imputation/stackedev/ xthdidregress)、RDD/多断点/聚束效应、合成控制/合成DID、机器学习因果推断、空间面板数据模型

课程目标让学员真正建立竞争力——掌握2023–2025年顶刊主流方法,具备独立开展高质量因果推断研究的能力


课程特色

1. 零基础友好,但不止于基础

针对首次接触Stata的学员,课程从软件安装、菜单操作、路径管理、外部命令安装等细节入手;同时直接对接科研实战——Wind数据库转面板数据、CFPS微观数据清洗、论文级可视化(binscatter、事件研究图、分仓回归图),实现"三天上手,立即出图"

2. 紧跟顶刊前沿,方法体系完整

初级班聚焦"数据清洗线性回归内生性处理面板数据因果识别(DID"的完整基础链条;高级班则覆盖"动态面板异质性DID→RDD→合成控制机器学习因果推断"的现代因果推断全工具箱。所有模型均配备2020–2025年《中国工业经济》《数量经济技术经济研究》《AmericanEconomic Review》等顶刊例文。

3. AI深度嵌入,不是噱头而是 workflow

课程不是简单演示ChatGPT,而是系统讲授Trae IDE + Stata Agent的科研工作流:

  • TraeAgent模式自动生成do文件框架、解释Stata命令、Debug代码

  • 构建"数据清洗Agent""DID设计Agent""中介效应检验Agent""Lasso因果推断Agent"等自动化工具

  • 从数据导入、模型选择、稳健性检验到结果解读文字生成,实现半自动化实证研究



课程大纲

第一部分(初级)含9篇范例论文

1 AI时代的实证科研工作流(3h

1.1 AI时代科研范式变化

AI如何改变实证研究

为什么传统do-file工作流效率越来越低

科研人如何建立AI时代竞争力

1.2 Stata软件快速入门

1.3 Stata路径设定与修改:sysdiradopath

1.4 Stata外部命令科学管理与更新

1.5 Stata命令与帮助文件

1.6 do文件创建与优化

1.7 Trae IDE 配置与 Stata do 文件开发环境搭建

演示如何用 Trae  SOLO agent 模式自动生成 do 文件框架

演示 Trae  agent 模式解释 Stata 命令(比传统 help 文件更高效)


2 数据清洗、面板数据构构建与论文级可视化(3h

2.1 数据处理准备

2.1.1 各类数据导入与导出

2.1.2 整理、提取和变量转换

2.1.3 离群值、文字变量的处理

2.2 合并、转换与堆叠

2.2.1 纵向与横向数据合并

2.2.2 数据转换

2.2.3 数据堆叠与面板数据构建

2.3 数据清理

2.3.1 单变量清理

2.3.2 多变量清理

2.4 构建数据预处理 Agent:针对 Wind 数据面板数据、CFPS 微观数据的清洗,设计一个多步骤智能体:

Step 1:自动识别数据格式异常

Step 2:自动匹配变量名标准化

Step 3:自动生成清洗后的 do 文件并执行

2.5 缺失值与补漏方法集成

2.6 数据清理实操

2.6.1 主流数据库:Wind数据转换为Stata面板数据

2.6.2 微观调查类数据处理:以CFPS数据为例

2.7 论文级科研绘图

2.7.1 基础图形命令应用

2.7.2 面板数据的动态显示

2.7.3 交错事件面板数据图形

2.7.4 系数及系数差异的可视化呈现

2.7.5 分仓散点图与分仓回归

2.8 例文软件实现与解读:

 Cattaneo M D, Crump R K, Farrell M H, et al.Onbinscatter[J]. American Economic Review, 2024, 114(5): 1488-1514.

 李磊,王天宇.“孔雀东南飞”:经济高质量发展与人才流动[J]. 数量经济技术经济研究, 2023, 40(2):5–24.


 3  AI时代的编程思维与自动化科研(3h

3.1 Trae作为AI科研IDE

AI补全

AI Debug

AI代码解释

3.2 看懂 AI 生成的代码

宏变量

循环

返回值

参数逻辑

3.3 如何让AI生成高质量代码

Prompt设计

任务拆解

结构化描述

3.4 人工审核 AI 代码

参数检查

结果验证

稳健性验证

3.5 ado 文件开发实战:Trae 辅助下,从 0  1 发布一个外部命令

3.6 案例:AI 生成 LM/GMM 估计代码 → 人工修正 → 嵌入论文


4 线性回归模型、内生性与工具变量法(3h

4.1 OLS估计与结果解读

4.2 如何正确使用稳健与聚类-稳健标准误

4.3 交互项与边际效应

4.4 内生性来源与识别策略

4.5 AI智能体诊断与修正内生性

识别内生性来源

推荐IV/DID/RDD

生成检验代码

生成结果解读

4.6 IV估计量:IV2SLSGMM

4.7 恰好与过度识别模型的IV估计

4.8 弱工具变量检验

4.9 弱工具变量的稳健推断

4.10 例文软件实现与解读:

 尹志超等农村劳动力流动对家庭储蓄率的影响[J]. 中国工业经济,2020.

 Ishimaru S. Empirical decomposition of the iv-olsgap with heterogeneous and nonlinear effects[J]. Review of Economics andStatistics, 2024: 1-16.


5 中介效应、调节效应与机制分析(3h

5.1 中介效应模型的核心逻辑

5.2 中介效应分析的操作建议

5.3 中介效应估计新命令:sgmediation2

5.4 基于结构方程模型的中介效应分析

5.5 AI Agent 自动化中介效应检验:

自动完成逐步法、Bootstrapsgmediation2 检验

自动生成检验报告

5.6 调节效应与异质性分析

5.7 调节效应分析的操作建议

5.8 机制识别中的常见问题

5.9 例文软件实现与解读:

 孙伟增,毛宁,兰峰等.政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验[J].中国工业经济,2023.

 曹伟,綦好东,赵璨.企业金融资产的配置动机:基于产权性质与异质性股东参股的分析[J].中国工业经济,2023.

 Braghieri L, Levy R,Makarin A. Social media andmental health[J]. American Economic Review, 2022.


6 静态面板数据模型与双重差分法(3h

6.1 估计量比较:

混合OLS

FE/RE/FD

HDFE高维固定效应

6.2 Stata新功能:相关随机效应(CRE)模型与Mundlak设定检验

6.3 面板数据内生性与IV估计

6.4 AI Agent 辅助 DID 设计全流程

自动判断数据适合标准 DID/多期 DID/异质性 DID

自动执行平行趋势检验(含图形生成)

自动执行安慰剂检验(时间/空间维度)

6.5 双重差分的7种估计方法

6.6 双重差分法的平行趋势检验与安慰剂检验

6.7 Stata时间-空间维度安慰剂检验新命令

6.8 多期双重差分的估计与规范作图

6.9 三重差分估计如何检验平行趋势

6.10 例文软件实现与解读:

 曹友斌,郭峰.新城建设、土地溢价与空间错配——以国家级新区为例.中国工业经济,2025.

 曹清峰.国家级新区对区域经济增长的带动效应——基于70大中城市的经验证据.中国工业经济,2020.


第二部分(高级)含13篇范例论文

7 长面板与动态面板数据模型(2h

7.1 长面板估计策略

7.2 长面板估计方法选择:稳健 vs. 效率

7.3 组内自相关与组间同期相关检验

7.4 偏差校正LSDV估计

7.5 面板工具变量估计法

7.6 工具变量高维固定效应面板

7.7 动态面板数据的差分与系统GMM估计

7.8 AI赋能长面板与动态面板数据模型学习案例

7.9 例文软件实现与解读:

 Acemoglu D, Naidu S, Restrepo P, et al. Democracydoes cause growth.Journal of political economy, 2019.

 Borusyak K, Hull P, Jaravel X. Quasi-experimentalshift-share research designs[J]. The Review of Economic Studies, 2022.


8 非平稳、门槛与PVAR2h

8.1 跨截面相依检验

8.2 面板单位根检验

8.3 静态面板门槛数据模型

8.4 具有内生性与门限效应的动态面板数据模型

8.5 具有共同相关因子的动态面板数据模型

8.6 面板向量自回归模型PVARXTVAR

8.7 AI赋能非平衡与非线性面板数据模型学习案例

8.8 例文软件实现与解读:

③ Ditzen J., Estimatinglong run effects and theexponent of cross-sectional dependence: an update toxtdcce2, The StataJournal,2021.

 王维国,王鑫鹏.创新转化效率、要素禀赋与中国经济增长[J].数量经济技术经济研究,2022.

 Li X., Shen Y., Zhou Q., Confidenceinterverbal oftreatment effects in panel data models with interactive fixed effects, workingpaper, 2024


9 因变量受限的面板数据模型(2h

9.1 面板Logit/Probit模型

9.2 面板Logit的边际效应与处理效应

9.3 面板Tobit模型

9.4 面板计数模型:泊松与负二项模型

9.5 多项选择面板回归模型

9.6 高维固定效应泊松面板模型

9.7 非平衡面板的动态面板Probit模型

9.8 AI赋能因变量受限的面板数据模型学习案例

9.9 例文软件实现与解读:

 吴小康,于津平.科技中介与全国统一技术大市场建设[J].数量经济技术经济研究,2023.


10 异质性DID模型(3h

10.1 如何在多期与处理时间变化时,选择合适的DID估计量?

10.2 负权重的诊断:de Chaisemartin andD’Haultfoeuille 分解

10.3 禁止比较组的诊断:Bacon分解

10.4 组别-时期平均处理效应估计:csdiddid_multiplegt

10.5 插补估计量:did_imputation

10.6 堆叠回归估计量:stackedev

10.7 通过TWFE的事件研究:eventstudyinteractjwdid

10.8 Stata官方异质性双重差分命令:xthdidregress

10.9 放松或允许违背平行趋势假设

10.10 稳健性推论和敏感性分析

10.11 异质性处理效应应用建议

10.12 异质性 DID 智能选择 Agent

诊断负权重问题(de Chaisemartin 分解)

csdid/ did_imputation/ stackedev/ xthdidregress中选择最优估计量

生成事件研究图

10.13 例文软件实现与解读:

 De Chaisemartin C, d’Haultfoeuille X. Two-wayfixed effects and differences-in-differences with heterogeneous treatmenteffects: Asurvey[J]. The Econometrics Journal, 2023.

 Roth J, Sant’Anna P H C, Bilinski A, et al. What’strending indifference-in-differences? A synthesis of the recent econometricsliterature, Journal of Econometrics, 2023.

 余长林,马青山.特高压输电与区域经济发展——来自特高压工程的经验证据[J].数量经济技术经济研究,2023.


11 断点回归与合成控制(3h

11.1 精确断点回归

11.2 断点回归的检验(连续性检验、安慰剂检验)

11.3 模糊断点估计

11.4 多断点回归

11.5 断点回归设计的实证指南:操作规范、应用误区与实践拓展

11.6 聚束效应-另类断点回归-bunching

11.7 合成控制法

11.8 非参数合成控制法

11.9 合成控制与合成双重差分的比较

11.10 AI Agent 辅助 RD 完整设计:

执行连续性检验(密度检验、协变量平衡检验)

带宽选择(IK/CCT 最优带宽计算)

安慰剂检验(假断点、置换检验)

生成规范的结果输出表

11.11 例文软件实现与解读:

 黄炜向科谚袁洛琪断点回归设计的实证指南:操作规范、应用误区与实践拓展数量经济技术经济研究, 2025

 席鹏辉李瑶战略性新兴产业发展与重点税源维护:基于断点回归的证据数量经济技术经济研究, 2025.

 Clarke, D Pailañir, S. Athey and G. Imbens.Synthetic Difference-in-Differences Estimation. IZA Discussion Paper, 2023.


12 基于机器学习的因果推断(3h

12.1 机器学习与因果推断

12.2 Trae 作为 Stata 机器学习开发环境

演示如何在 Trae 中管理复杂的 h2ml 命令、自动补全参数、用 AI 解释混淆矩阵结果

结合 Trae  Agent 模式,实现"从数据导入模型训练结果解读"的半自动化流程

12.3 Stata与机器学习集成:h2ml命令应用

12.3.1 H2O数据准备

12.3.2 变量选择与交叉验证

12.3.3 h2oml rf:用于回归和分类

12.3.4 h2oml gbm:用于回归和分类

12.3.5 h2oml估计后检验:混淆矩阵

12.3.6 h2omlgof:机器学习模型拟合比较

12.4 Lassoridge elastic net的应用比较

12.5 Lasso用于预测和因果推断

12.5.1 变量选择与系数估计

12.5.2 获得标准误

12.6 不同结果变量的Lssso推断命令

12.6.1 连续结果变量

12.6.2 两元选择结果变量

12.6.3 计数结果变量

12.7 系数解释:边际效应、对比、获胜率、发生率

12.8 实例:探讨母亲教育和吸烟习惯对出生体重的影响

12.9 扩展Lasso模型

12.9.1 adaptive Lasso

12.9.2 ivlasso

12.9.3 pdslass

12.9.4 dslasso

12.10 AI Agent 自动化 Lasso 因果推断:

自动完成 ivlasso/pdslasso/dslasso 的变量选择

自动输出选择后的 IV/控制变量清单

自动生成可放入论文的结果表格

12.11 例文软件实现与解读:

 Ahrens A, Hansen C B, Schaffer M E.lassopack:Model selection and prediction with regularized regression in Stata[J]. TheStata Journal, 2020, 20(1): 176-235.


13 AI智能体驱动的完整实证研究流程(3h

以一个真实研究问题为例演示完整流程:

Trae 环境:用 Trae 搭建项目框架,管理 do 文件

数据智能体:自动下载/清洗 Wind + 专利数据

模型智能体:自动识别适合 DID/IV/RD 中的哪种方法

编程智能体Trae 自动生成核心回归代码

稳健性智能体:自动执行 3-5 种稳健性检验

写作智能体:自动生成结果解读文字(可直接放入论文)


优惠:

现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;

以上优惠不叠加。

课程提供发票,开课通知及结业证书;课程资料包含do文档,讲义,数据及范例论文。


联系方式:

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu