R 流行病学与生物统计核心技能
核心原则
奥卡姆剃刀: 如无必要,勿增实体。决策后立即清理!
禁止
- •
print(),cat()→ 直接返回对象 - •
for循环 →purrr::map_*()或across() - •绝对路径 → 相对路径
"01_data/file.csv" - •
scale_fill_manual()→ggsci::scale_fill_lancet() - •修改
01_data/原始数据
必须
- •中文注释关键步骤
- •代码执行验证
- •双格式导出 (PNG 300dpi + PDF)
- •更新
07_paper/0_result_summaries.md - •命名规范
lower_snake_case
技术栈
r
library(tidyverse) # 数据处理 library(tidymodels) # 建模框架 library(gtsummary) # 表格输出 library(broom) # 结果整理 library(ggsci) # 科学配色 library(ragg) # 中文图片导出
分析类型速查
根据分析需求加载对应参考文件:
| 分析类型 | 参考文件 | 关键包 |
|---|---|---|
| 描述统计/Table 1 | descriptive.md | gtsummary |
| 回归分析 (线性/逻辑/Poisson) | regression.md | tidymodels, broom |
| 生存分析 (KM/Cox) | survival.md | survival, survminer |
| 中介/调节效应 | mediation.md | mediation, lavaan |
| Meta 分析 | meta.md | meta, metafor |
| 可视化规范 | visualization.md | ggplot2, ggsci |
项目结构
code
project/ ├── 01_data/ # 原始数据 (只读) ├── 02_code/ # R 脚本 ├── 03_tables/ # 输出表格 ├── 04_figures/ # 输出图片 ├── 05_reports/ # 汇报文档 ├── 06_results/ # RData 对象 └── 07_paper/ # 论文终稿
标准工作流
- •探查: 检查变量类型、缺失值、分布
- •清洗: 处理缺失、编码分类变量
- •描述: 生成 Table 1
- •分析: 执行主分析 (参考对应 references/)
- •敏感性: 验证结果稳健性
- •可视化: 参考 visualization.md
- •文档: 更新
0_result_summaries.md
导出规范
r
# PNG (中文)
ggsave("04_figures/Fig1.png", plot, dpi = 300, device = ragg::agg_png)
# PDF
ggsave("04_figures/Fig1.pdf", plot, device = cairo_pdf)
结果汇总模板
完成分析后更新 07_paper/0_result_summaries.md:
markdown
## [分析名称] ### 样本 - N = XXX ### 主要结果 | 变量 | 效应值 | 95% CI | P | |------|--------|--------|---| ### 结论 [一句话结论]