杨光论文写作风格与技巧(Guang Yang Writing Style)
本 Skill 的目标:把你的研究内容写成“评审一眼能读懂、能抓到贡献、能看见证据链”的软工论文叙事。
本 Skill 的信号来源(可复现):
- •解析
https://ntdxyg.github.io/publications/得到39条论文条目; - •公开可下载 PDF
6篇(仅做首 1–3 页结构信号提取;不做付费墙/反爬绕过); - •摘要来自网页嵌入数据(已在索引里落盘)。
索引与汇总见:
- •
templog/writingskills/outputs/yg_publications_index.json - •
templog/writingskills/outputs/yg_publications_summary.md
1) “可观察的风格签名”(用数据约束写作)
1.1 标题(Title)
从全量 39 条标题统计(见 yg_publications_summary.md):
- •冒号结构(
A: B)出现56.4%:标题更倾向“先给任务/立场,再给方法/机制/角度”。 - •缩写/方法名(全大写 Acronym)出现
17.9%:常把方法名做成可引用的“术语锚点”(便于评审记住)。 - •“Less is More”作为修辞标题出现
5.1%:用强立场句式吸引注意,但后文必须用实验把立场“兑现”。
可直接套用的标题范式:
- •
Claim/Goal: Mechanism:Less is More: … via … / X: … with … - •
Task: Data/Signal/Structure-aware Method:…: Syntax-Aware … / …: Retrieval-Augmented …
1.2 摘要(Abstract)
英文摘要(38 条)的典型信号(见 yg_publications_summary.md):
- •动作动词(
we propose/present/introduce/develop...)86.8% - •数字(规模/提升/开销等)
65.8% - •结果句(
results show/suggest/indicate...或等价表达)65.8% - •baseline 在摘要中被点名
60.5% - •连接词 “However” 出现
52.6%(常用于“从背景→痛点→缺口”的转折) - •“novel” 出现
47.4%(但通常伴随机制关键词,而不是空喊)
摘要长度(英文 38 条):
- •平均
~206词,中位数204;平均~9.2句(更偏“信息密度型”,不是 3 句短摘要)。
结论:杨光风格的摘要更像一条“证据链速览”,而不是“背景+一句方法+空泛结论”。
2) 他的摘要写法:强转折 + 强动作 + 强对照 + 强数字
建议你按下面顺序写(句子可多,但信息顺序别乱):
- •Context(背景/任务):一句话交代任务与价值(别综述)。
- •However(缺口/痛点):用 However 把失败模式说具体(会导致什么可测后果)。
- •Action(我们做了什么):We propose …,紧跟 1 个“机制关键词”(graph / retrieval / prompt / mutation / pruning / robustness…)。
- •Evaluation(怎么证):数据/对象/基线/指标至少点 2 个(让评审知道你“会做实验”)。
- •Results(结论数字化):最少 1 个数字 + 1 个对照对象(baseline / SOTA / ablation)。
可复用句模版(按需替换括号):
- •However, existing approaches (fail because …), leading to (measurable cost/error) in (scenario).
- •We propose METHOD, which (core mechanism) by (key insight/signal/structure).
- •We evaluate METHOD on (dataset/benchmarks) against (baselines) using (metrics).
- •Results show that METHOD (improves/reduces/speeds up) (X%) over (baseline) while (tradeoff).
3) 证据链写作技巧:把“主张”写成可检验命题
把论文主张写成一行(写作时反复对齐):
我们提出 METHOD,用 MECHANISM 解决 TASK/PROBLEM,在 DATA/SCENARIO 上相对 BASELINE 带来 RESULT(并给出边界/代价)。
对应地,把评审最在意的 4 个槽位写齐:
- •Method:新在哪里(不是“用了 Transformer”,而是“引入了 X 结构/约束/信号来解决 Y 失败模式”)
- •Baselines:比谁强(同类 SOTA + 常用强基线)
- •Datasets/Subjects:在哪些对象上成立(规模、来源、过滤规则)
- •Results:提升多少、成本多少、什么时候不行(边界条件)
4) 写作落地:一套“评审友好”的结构清单
4.1 Introduction(建议 3 段 + 贡献点 3 条)
- •段 1:任务重要性 + 一个具体工程困难(别上来 related work)
- •段 2:However + 现有方法关键失败模式(1–2 条,能映射到 RQ/实验)
- •段 3:We propose + 核心机制(1 个 insight)+ 你如何验证
- •Contributions(3 条足够):
- •Technique:方法/机制(可实现、可解释)
- •Evaluation:评测设计(RQ + baselines + datasets + metrics)
- •Artifact/Insight:可复现资产/发现(数据、工具、分析)
4.2 Evaluation(围绕 claim 设计,而不是“跑一堆实验”)
按 RQ 组织(每个 RQ 只回答一个命题):
- •RQ1:有效性(相对 baselines 的提升)
- •RQ2:效率/成本(时间/显存/能耗/训练开销)
- •RQ3:消融与原因(哪个机制贡献最大,失败案例是什么)
- •RQ4(可选):泛化/迁移(不同项目/语言/场景)
在每个结果段落结尾写“判决句”:
- •Takeaway: 用一句话把数字翻译成结论(并点出适用条件)。
5) 复现与脚本(如何更新这份风格总结)
在 C:\\Users\\daoge\\Desktop\\codes 下运行:
powershell
python templog/writingskills/pipelines/collect_yg_publications.py --no-resume python templog/writingskills/pipelines/collect_yg_publications.py --refresh-missing
说明:
- •脚本只下载公开可访问 PDF,不会尝试绕过付费墙/反爬;因此 PDF 下载率可能长期偏低。
- •若你能在校内/机构网络手动补齐 PDF,再运行
--refresh-missing可把写作信号统计变得更可靠。