近期现场/远程培训 Claude Code和Codex助力学术科研与应用
近期专题培训 跨越传统边界:AI赋能下的财务金融研究与论文发表
课程导引
初级课程专注于Stata软件基本应用与主流经济学模型实现,目标是帮助学员建立完整的实证研究基础能力。
在实证研究中,数据处理和模型实现往往占据80%的时间。初级课程通过三个模块解决这一痛点:第一,系统讲解Stata基础操作与编程思维,包括命令语法、do文件优化、路径管理、外部命令安装;第二,强化数据管理实战,覆盖主流数据库(Wind、CFPS)的数据合并、转换、清洗与面板数据构建;第三,深入讲授线性回归、工具变量、中介效应、调节效应、静态面板与双重差分(DID)等六大核心模型,并结合AI工具实现自动化代码生成与结果解读。
通过"理论原理→软件代码→顶刊例文"三维一体的教学模式,学员将能够独立完成从数据导入到基准回归、内生性检验、机制分析的完整实证流程,为后续高级方法和论文写作打下坚实基础。
初级班课程优势与特色
一、注重Stata基础操作与科研实战的无缝衔接
初级班针对零基础或基础薄弱学员,在讲授软件操作的同时,直接对接科研场景:
数据实操:Wind数据下载后直接转换为面板数据、CFPS微观调查数据清洗与变量构建
可视化输出:论文级绘图(binscatter、系数可视化、事件研究图、面板数据动态显示)
AI辅助:用Trae搭建Stata开发环境,通过AI补全、Debug和代码解释,降低编程门槛
二、注重经典计量模型的"理论-软件-论文"三维贯通
在充分考虑模型广泛应用性的基础上,精选四大类基础模型深入讲授:
线性回归与内生性:OLS、稳健标准误、交互项与边际效应、IV/2SLS/GMM、弱工具变量检验与稳健推断
机制分析:中介效应(逐步法、Bootstrap、sgmediation2、结构方程模型)与调节效应
面板数据:混合OLS、FE/RE/FD、高维固定效应(HDFE)、CRE模型、Mundlak设定检验
因果识别:标准DID与多期DID、7种估计命令(含Stata最新官方命令)、平行趋势检验、时间-空间安慰剂检验
每类模型均搭配顶刊例文,详细解读选题、模型构建、变量选择、结果输出与解读等论文写作关键环节。
三、注重AI Agent在基础实证中的落地应用
初级班首次将AI Agent引入基础计量教学:
数据预处理Agent:自动识别Wind/CFPS数据格式异常、匹配变量名标准化、生成清洗do文件
内生性诊断Agent:自动识别内生性来源、推荐IV/DID/RDD策略、生成检验代码
DID设计Agent:自动判断标准DID/多期DID/异质性DID适用性、执行平行趋势与安慰剂检验
中介效应Agent:自动完成逐步法、Bootstrap、sgmediation2检验并生成报告
课程大纲(含9篇范例论文)
第1讲 AI时代的实证科研工作流(3h)
1.1 AI时代科研范式变化
AI如何改变实证研究
为什么传统do-file工作流效率越来越低
科研人如何建立AI时代竞争力
1.2 Stata软件快速入门
1.3 Stata路径设定与修改:sysdir和adopath
1.4 Stata外部命令科学管理与更新
1.5 Stata命令与帮助文件
1.6 do文件创建与优化
1.7 Trae IDE 配置与 Stata do 文件开发环境搭建
演示如何用 Trae 的 SOLO agent 模式自动生成 do 文件框架
演示 Trae 的 agent 模式解释 Stata 命令(比传统 help 文件更高效)
第2讲 数据清洗、面板数据构构建与论文级可视化(3h)
2.1 数据处理准备
2.1.1 各类数据导入与导出
2.1.2 整理、提取和变量转换
2.1.3 离群值、文字变量的处理
2.2 合并、转换与堆叠
2.2.1 纵向与横向数据合并
2.2.2 数据转换
2.2.3 数据堆叠与面板数据构建
2.3 数据清理
2.3.1 单变量清理
2.3.2 多变量清理
2.4 构建数据预处理 Agent:针对 Wind 数据→面板数据、CFPS 微观数据的清洗,设计一个多步骤智能体:
Step 1:自动识别数据格式异常
Step 2:自动匹配变量名标准化
Step 3:自动生成清洗后的 do 文件并执行
2.5 缺失值与补漏方法集成
2.6 数据清理实操
2.6.1 主流数据库:Wind数据转换为Stata面板数据
2.6.2 微观调查类数据处理:以CFPS数据为例
2.7 论文级科研绘图
2.7.1 基础图形命令应用
2.7.2 面板数据的动态显示
2.7.3 交错事件面板数据图形
2.7.4 系数及系数差异的可视化呈现
2.7.5 分仓散点图与分仓回归
2.8 例文软件实现与解读:
① Cattaneo M D, Crump R K, Farrell M H, et al.Onbinscatter[J]. American Economic Review, 2024, 114(5): 1488-1514.
② 李磊,王天宇.“孔雀东南飞”:经济高质量发展与人才流动[J]. 数量经济技术经济研究, 2023, 40(2):5–24.
第 3 讲 AI时代的编程思维与自动化科研(3h)
3.1 Trae作为AI科研IDE
AI补全
AI Debug
AI代码解释
3.2 看懂 AI 生成的代码
宏变量
循环
返回值
参数逻辑
3.3 如何让AI生成高质量代码
Prompt设计
任务拆解
结构化描述
3.4 人工审核 AI 代码
参数检查
结果验证
稳健性验证
3.5 ado 文件开发实战:Trae 辅助下,从 0 到 1 发布一个外部命令
3.6 案例:AI 生成 LM/GMM 估计代码 → 人工修正 → 嵌入论文
第4讲 线性回归模型、内生性与工具变量法(3h)
4.1 OLS估计与结果解读
4.2 如何正确使用稳健与聚类-稳健标准误
4.3 交互项与边际效应
4.4 内生性来源与识别策略
4.5 AI智能体诊断与修正内生性
识别内生性来源
推荐IV/DID/RDD
生成检验代码
生成结果解读
4.6 IV估计量:IV、2SLS和GMM
4.7 恰好与过度识别模型的IV估计
4.8 弱工具变量检验
4.9 弱工具变量的稳健推断
4.10 例文软件实现与解读:
③ 尹志超等. 农村劳动力流动对家庭储蓄率的影响[J]. 中国工业经济,2020.
④ Ishimaru S. Empirical decomposition of the iv-olsgap with heterogeneous and nonlinear effects[J]. Review of Economics andStatistics, 2024: 1-16.
第5讲 中介效应、调节效应与机制分析(3h)
5.1 中介效应模型的核心逻辑
5.2 中介效应分析的操作建议
5.3 中介效应估计新命令:sgmediation2
5.4 基于结构方程模型的中介效应分析
5.5 AI Agent 自动化中介效应检验:
自动完成逐步法、Bootstrap、sgmediation2 检验
自动生成检验报告
5.6 调节效应与异质性分析
5.7 调节效应分析的操作建议
5.8 机制识别中的常见问题
5.9 例文软件实现与解读:
⑤ 孙伟增,毛宁,兰峰等.政策赋能、数字生态与企业数字化转型——基于国家大数据综合试验区的准自然实验[J].中国工业经济,2023.
⑥ 曹伟,綦好东,赵璨.企业金融资产的配置动机:基于产权性质与异质性股东参股的分析[J].中国工业经济,2023.
⑦ Braghieri L, Levy R,Makarin A. Social media andmental health[J]. American Economic Review, 2022.
第6讲 静态面板数据模型与双重差分法(3h)
6.1 估计量比较:
混合OLS
FE/RE/FD
HDFE高维固定效应
6.2 Stata新功能:相关随机效应(CRE)模型与Mundlak设定检验
6.3 面板数据内生性与IV估计
6.4 AI Agent 辅助 DID 设计全流程
自动判断数据适合标准 DID/多期 DID/异质性 DID
自动执行平行趋势检验(含图形生成)
自动执行安慰剂检验(时间/空间维度)
6.5 双重差分的7种估计方法
6.6 双重差分法的平行趋势检验与安慰剂检验
6.7 Stata时间-空间维度安慰剂检验新命令
6.8 多期双重差分的估计与规范作图
6.9 三重差分估计如何检验平行趋势
6.10 例文软件实现与解读:
⑧ 曹友斌,郭峰.新城建设、土地溢价与空间错配——以国家级新区为例.中国工业经济,2025.
⑨ 曹清峰.国家级新区对区域经济增长的带动效应——基于70大中城市的经验证据.中国工业经济,2020.
优惠:
现场班老学员9折优惠;
同一单位三人以上同时报名9折优惠;
以上优惠不叠加。
课程提供发票,开课通知及结业证书;课程资料包含do文档,讲义,数据及范例论文。
联系方式:
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu
