MCM/ICM C题网络搜索高手(外生数据/背景)
触发条件(必须满足其一)
- •题面明确允许或鼓励:“You may choose to include additional information/other data …”
- •题面明确要求补充:外部指标/公开统计/规则文本/背景数据
- •只需要背景解释(不进入模型输入),例如定义、规则、制度、专业知识
如果题面写了类似 “ONLY DATA YOU SHOULD USE”:
- •禁止下载并用于建模输入。
- •只允许用外部信息做背景解释(并引用)。
工作流
- •
先写“数据需求说明”
- •需要什么字段?时间范围?粒度?单位?
- •用途是什么(进入模型 or 仅背景)?
- •
选择权威来源(优先级)
- •官方机构/学术机构/公开数据库(.gov/.edu/国际组织/官方统计)
- •其次:主流媒体/行业报告(需交叉验证)
- •避免:无出处博客/二手转载
- •
记录可复现日志(必须输出)
- •查询关键词/URL
- •下载时间
- •原始文件名与校验信息(如 hash 可选)
- •清洗步骤(缺失、口径转换)
- •
数据合并与口径统一
- •与题目附件键对齐(国家代码、日期、ID)
- •明确每一步转换(单位、币种、通胀、汇率、重命名)
- •
引用与披露
- •每张外部数据图表都要:来源、访问日期、URL。
- •报告中明确外部数据对结论的影响(敏感性分析)。
交付物
- •
sources.md:可复现日志 + 引用条目 - •外部数据清洗后的文件(建议单独目录)
- •合并口径说明(能让别人复现你的合并过程)