近期现场/远程培训 教育部人文社科基金及其他省部级课题申报解析
近期专题培训 跨越传统边界:AI赋能下的财务金融研究与论文发表
课程背景:
近年来,随着量化分析技术的进步,以及数据丰富程度的不断提升,越来越多的学者开始认识到文本信息中包含的重要价值,并将文本分析运用于经管类学术研究之中。目前在经管类学术研究中比较常见的文本分析运用形式是,通过提取文本信息,构建变量,并运用计量等方法开展研究。
本课程的重要内容就是帮助学员掌握常见文本分析方法,能够运用AI+Python编程工具进行词频分析、相似性分析、主题分析和情绪分析等,并构建相应的变量,理解其意义,为学员驾驭文本数据夯实基础,同时也为学员的学术研究拓展思路。
课程特色:
本课程聚焦学术前沿,致力于系统构建学员对文本分析方法的深层认知与高阶应用能力,具备以下突出特色:
1. 学术前沿与研究方法深度融合:
课程内容直接对接核心期刊最新研究成果,不仅讲解方法操作,更着重剖析文本分析在严谨学术研究中的设计逻辑、变量构建的学理依据及结果解读的深层含义,帮助学员理解如何将技术手段转化为有价值的学术发现。
2. “AI+编程”的双重能力锻造:
超越简单的工具使用,课程将引导学员掌握如何将AI提示词与Python编程的灵活可控性有机结合,解决经管研究中复杂的文本识别、分类与语义编码问题,培养学员驾驭前沿技术解决实际科研问题的核心竞争力。
3. 紧扣经管研究场景的实战训练:
所有案例与练习均围绕典型文本(如上市公司年报、互动平台文本等)展开,帮助学员将所学内容迁移至学员的实际科研项目中。
4. 强调方法背后的经济学与管理学内涵:
课程绝非简单的技术操作培训,而是深入探讨文本分析所构建变量(如文本相似性、主题强度、情绪倾向)在经济学、金融学、管理学理论中的具体意义,引导学员思考其如何刻画企业行为、市场情绪与信息效率,提升研究的学术深度。
课程大纲:
第一讲:经管类学术研究中的文本分析(2h)
1. 文本分析基本思路
2. 文本分析文献的大致分类
3. 文本分析的主要方法
4. 经管报告文本的批量处理
第二讲:文本分析基础(2h)
1. 文本分词
2. 停用词使用
3. 词频计算
4. TFIDF计算
5. 学术研究中的词频是如何计算的?
参考文献:
① 胡楠,薛付婧,王昊楠.管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界,2021,37(05):139-156+11+19-21.
第三讲:词向量分析(2h)
1. 词向量原理
2. 词向量的实现
3. 近义词发现
4. 学术研究中的扩展词是怎么做的?
参考文献:
② 危雁麟,张俊瑞,汪方军,程茂勇.数据资产信息披露与分析师盈余预测关系研究——基于文本分析的经验证据[J].管理工程学报,2022,36(05):130-141.
③ 朱康,唐勇.数据要素利用与企业金融资产配置——基于机器学习和文本分析的证据[J].会计研究,2025,(06):121-133.
第四讲:文本相关分析(2h)
1. 文本相关分析常用方法
2. 余弦与软余弦相似性
3. 软余弦相似性度量方法
4. MD&A信息量如何度量?问与答的一致性如何度量?
参考文献:
④ 郑晓瑜,刘俊晗.信号还是噪声?——基于上市公司年报文本变动的研究[J].投资研究,2022,41(04):70-90.
⑤卞世博,陈曜,管之凡,等.高质量的互动可以提高股票价格信息效率吗——基于“上证e互动”的研究[J].会计研究,2023,(04):102-117.
第五讲:文本主题模型(2h)
1. 主题模型的基本思路
2. 主题模型在学术中应用
3. 主题模型的实现
参考文献:
⑥ 俞红海,范思妤,吴良钰,马质斌.科创板注册制下的审核问询与IPO信息披露——基于LDA主题模型的文本分析[J].管理科学学报,2022,25(08):45-62.
第六讲:大语言模型在识别与分类中的应用 (2h)
1. 大语言模型原理
2. 大语言模型的API调用
3. 大语言模型在识别与分类中的应用
参考文献:
⑦ 陆瑶,施函青,周欣怡.中国企业数字技术风险暴露对企业价值的影响——来自大语言模型的文本分析证据[J].经济研究,2025,60(02):73-89.
注:时间分布仅为参考,根据学员学习情况调整
联系方式:
尹老师
电话:13321178792
QQ:42884447
WeChat:JGxueshu