经管类学术研究中的文本分析方法:AI 智能体 + Python 实战,直达顶刊

现场

2580

远程

2580
上课地点:远程直播,提供录播回放 讲师:麦斯老师 报名时间:2026/06/15 - 2026/08/08 开课时间:2026年8月8-9日 (两天)

核心亮点:AI 智能体 ——>Python代码——>文本量化结果

Python代码到文本量化结果可复现,告别AI直接出结果中的幻觉风险,做可检验、可复现的真研究


课程背景:

近年来,随着量化分析技术的进步,以及数据丰富程度的不断提升,越来越多的学者开始认识到文本信息中包含的重要价值,并将文本分析运用于经管类学术研究之中。目前在经管类学术研究中比较常见的文本分析运用形式是,通过提取文本信息,构建变量,并运用计量等方法开展研究。

本课程的重要内容就是帮助学员掌握常见文本分析方法,能够运用AI+Python编程工具进行词频分析、相似性分析、主题分析和情绪分析等,并构建相应的变量,理解其意义,为学员驾驭文本数据夯实基础,同时也为学员的学术研究拓展思路。

讲师介绍:
麦斯老师,高校商业数据系教授,主要研究领域为资本市场和量化投资,讲授课程包括《智能金融》、《数据挖掘与预测》等,其社会服务主要为企业提供员工数字化转型定制化课程。麦斯在学术研究中的核心量化方法为文本分析,在《管理评论》、《审计研究》等重要期刊发表论文20多篇。


课程特色:

本课程聚焦学术前沿,致力于系统构建学员对文本分析方法的深层认知与高阶应用能力,具备以下突出特色:

1. 学术前沿与研究方法深度融合:

课程内容直接对接核心期刊最新研究成果,不仅讲解方法操作,更着重剖析文本分析在严谨学术研究中的设计逻辑、变量构建的学理依据及结果解读的深层含义,帮助学员理解如何将技术手段转化为有价值的学术发现。

2. “AI+编程”的双重能力锻造:

超越简单的工具使用,课程将引导学员掌握如何将AI提示词与Python编程的灵活可控性有机结合,解决经管研究中复杂的文本识别、分类与语义编码问题,培养学员驾驭前沿技术解决实际科研问题的核心竞争力。

3. 紧扣经管研究场景的实战训练:

所有案例与练习均围绕典型文本(如上市公司年报、互动平台文本等)展开,帮助学员将所学内容迁移至学员的实际科研项目中。

4. 强调方法背后的经济学与管理学内涵:

课程绝非简单的技术操作培训,而是深入探讨文本分析所构建变量(如文本相似性、主题强度、情绪倾向)在经济学、金融学、管理学理论中的具体意义,引导学员思考其如何刻画企业行为、市场情绪与信息效率,提升研究的学术深度。


课程大纲:

第一讲:前沿全景|文本分析 + AI 智能体,经管科研新范式(2h

1. 经管文本分析的研究现状与顶刊趋势
2. 文本研究的分类、变量构建思路与典型设计

3. 主流方法总览:词频、TFIDF、词向量、主题模型、大模型、AI智能体

4. AI智能体安装和调试

5.【暑期实战】
AI 智能体批量清洗 / 格式化年报、公告、互动文本


第二讲:基础实操|智能体驱动文本预处理与词频构建(2h

1. 中文分词、停用词、词库构建(经管领域适配)
2. 词频、
TFIDF 的学术口径计算与变量化

3. 常见陷阱:分词错误、停用词不当、行业词库缺失

4.【暑期实战】AI 智能体生成Python代码,讲分词、去停用、批量计算词频 / TFIDF,直接输出面板变量

参考文献:

① 胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21.


第三讲:语义升级|词向量 + 智能体扩展词与术语挖掘(2h

1. 词向量原理、训练与经管领域应用
2. 近义词、关联词、扩展词在实证中的价值

3. AI 智能体辅助:
自动挖掘领域词、构建扩展词表、做语义扩充
4. 顶刊算法复刻:
数据资产 / 数字化转型类文本变量构建

参考文献:

② 危雁麟,张俊瑞,汪方军,程茂勇.数据资产信息披露与分析师盈余预测关系研究——基于文本分析的经验证据[J].管理工程学报,2022,36(05):130-141.

③ 朱康,唐勇.数据要素利用与企业金融资产配置——基于机器学习和文本分析的证据[J].会计研究,2025,(06):121-133.


第四讲:文本关联|相似性、信息含量 + 智能体高效度量(2h

1. 文本相似度:余弦、软余弦、语义相似度
2. MD&A
信息含量、问答一致性、文本变动度的量化

3. AI 智能体赋能:
批量计算相似度、一致性、信息密度
4. 顶刊算法复刻:
年报文本变动与股价信息效率

参考文献:

④ 郑晓瑜,刘俊晗.信号还是噪声?——基于上市公司年报文本变动的研究[J].投资研究,2022,41(04):70-90.

⑤ 卞世博,陈曜,管之凡,等.高质量的互动可以提高股票价格信息效率吗——基于“上证e互动”的研究[J].会计研究,2023,(04):102-117.


第五讲:主题挖掘|LDA 主题模型 + 智能体赋能调参标注(2h

1. LDA 主题模型原理、主题数选择、结果解读
2. 经管场景:年报风险、
ESG、问询函、管理层讨论

3. AI 智能体赋能:
代码生成与代码解读,加速模型调参、主题命名、标注
4. 顶刊算法复刻:
问询主题分类

参考文献:

⑥ 俞红海,范思妤,吴良钰,马质斌.科创板注册制下的审核问询与IPO信息披露——基于LDA主题模型的文本分析[J].管理科学学报,2022,25(08):45-62.

第六讲:顶刊前沿|大模型 + AI 智能体,端到端文本变量生成(2h

1. 大语言模型在经管文本研究中的应用范式
2. AI
智能体架构:任务拆解、多轮调用、结果整合、质量校验

3. API 调用、提示词工程、识别 / 分类 / 情感 / 风险标注
4. 
【终极实战】AI 智能体全链路:PDF→文本清洗→特征提取→变量生成→可直接回归

参考文献:

⑦ 陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.

注:时间分布仅为参考,根据学员学习情况调整


联系方式:

尹老师

电话:13321178792

QQ:42884447

WeChat:JGxueshu

JGxueshu.jpg