AgentSkillsCN

split-to-slides

将论文分析报告拆分为适合幻灯片演示的章节。当用户希望将报告转换为更适合演讲展示的格式时,可使用此功能。

SKILL.md
--- frontmatter
name: split-to-slides
description: Splits a paper analysis report into slide-presentation-sized sections. Use when the user wants to convert a report into a format suitable for presentations.

スライド分割スキル

論文分析レポートをプレゼンテーション用の短いセクションに分割します。

概要

このスキルは以下を行います:

  1. 既存レポートの構造を分析
  2. 各セクションをスライドサイズに分割
  3. 各スライドに「タイトル」「導入」「詳細」を付与
  4. {arxiv_id}_slides.md として出力

スライドの基本原則

コンテンツ量の制限

1枚のスライドに含められる情報量には限りがあります。以下の制限を守ってください:

要素制限
タイトル1行、最大15文字程度
導入文1-2文、最大50文字程度
箇条書き3-5項目、各項目20-30文字程度
図表1枚のスライドに最大1つ
数式1枚のスライドに1-2個まで
合計文字数150-200文字程度

スライドの構成

各スライドは以下の3要素で構成します:

markdown
## [タイトル]

**導入**: [このスライドで伝えたいことの要約(1-2文)]

**詳細**:
- [ポイント1]
- [ポイント2]
- [ポイント3]

[図表がある場合は1つだけ配置]

ワークフロー

1. レポートの読み込みと分析

対象レポートを Read ツールで読み込み、以下を把握:

  • arXiv ID
  • レポートの全体構造(セクション一覧)
  • 図表の数と位置
  • 主要なポイント

2. スライド構成の設計

レポートの内容を以下のスライドカテゴリに分類:

カテゴリ枚数目安内容
タイトル1枚論文タイトル、著者、発表先
概要1-2枚研究の目的と主要な成果
背景・問題2-3枚解決する問題と既存手法の課題
提案手法3-5枚手法の概要、アーキテクチャ、詳細
実験・結果2-4枚実験設定、主要結果、考察
参照論文2-3枚重要な関連研究(各1-2枚)
結論1-2枚貢献、限界、今後の展望
合計15-25枚-

3. 各スライドの作成

スライドテンプレート

markdown
---

## [スライドタイトル]

**導入**: [このスライドの要点を1-2文で]

**詳細**:
- [箇条書きポイント1]
- [箇条書きポイント2]
- [箇条書きポイント3]

---

図表を含むスライド

markdown
---

## [スライドタイトル]

**導入**: [図表が何を示しているかを簡潔に]

![Figure X](./figures/{arxiv_id}/figX.png)

**詳細**:
- [図から読み取れるポイント1]
- [図から読み取れるポイント2]

---

数式を含むスライド

markdown
---

## [数式/アルゴリズムのタイトル]

**導入**: [この数式が何を表すか]

$$[数式]$$

**詳細**:
- $[変数1]$: [意味]
- $[変数2]$: [意味]
- [数式の意義]

---

スライド変換のガイドライン

1. タイトルスライド

入力(レポートの基本情報):

markdown
## 基本情報

| 項目 | 内容 |
|------|------|
| **タイトル** | Chunking Strategies for RAG |
| **著者** | Author et al. |
| **発表先** | arXiv 2024 |

出力(スライド):

markdown
---

## Chunking Strategies for RAG

**導入**: RAGにおけるチャンキング戦略のサーベイ論文

**詳細**:
- 著者: Author et al.
- 発表: arXiv 2024
- arXiv ID: 2401.12345

---

2. 概要スライド

長い概要は複数スライドに分割します。

分割の基準:

  • 1つの主要なポイントにつき1スライド
  • 数値結果は別スライドにまとめる

入力(レポートの概要):

markdown
## 概要

本論文では、RAGシステムにおけるチャンキング戦略を体系的に分類しています。
5つの軸(モダリティ、粒度、ヒューリスティック、アラインメント、目的)に基づく
分類体系を提案し、各カテゴリの手法を詳細に比較しています。

出力(スライド1):

markdown
---

## サーベイの目的

**導入**: RAGシステムのチャンキング戦略を体系的に整理

**詳細**:
- チャンキング = 文書を検索可能な単位に分割
- RAGの性能に大きく影響
- 統一的な分類体系が必要

---

出力(スライド2):

markdown
---

## 分類体系(Taxonomy)

**導入**: 5つの軸でチャンキング手法を分類

**詳細**:
- モダリティ: テキスト/画像/音声/動画
- 粒度: 固定長/可変長/セマンティック
- ヒューリスティック: ルールベース/学習ベース
- アラインメント: モダリティ間の対応
- 目的: 検索/生成/両方

---

3. 手法の説明スライド

複雑な手法は複数スライドに分解:

  1. 概要スライド: 手法の目的と基本アイデア
  2. アーキテクチャスライド: 図を用いた構造説明
  3. 詳細スライド: 重要なコンポーネントの説明

入力(レポートの手法説明):

markdown
### セマンティックチャンキング

セマンティックチャンキングは、文の意味的な類似性に基づいて
分割点を決定する手法です。隣接する文の埋め込みベクトル間の
コサイン類似度を計算し、類似度が閾値を下回る点で分割します。

#### 技術的詳細
- 文埋め込みモデルを使用
- コサイン類似度で境界を検出
- 閾値はハイパーパラメータ

出力(スライド1: 概要):

markdown
---

## セマンティックチャンキング

**導入**: 意味の区切りで文書を分割する手法

**詳細**:
- 文の「意味」に基づいて分割
- 固定長分割の問題を解決
- トピックの境界を自動検出

---

出力(スライド2: 仕組み):

markdown
---

## セマンティックチャンキングの仕組み

**導入**: 文埋め込みの類似度で境界を検出

**詳細**:
- 各文をベクトルに変換
- 隣接文のコサイン類似度を計算
- 類似度が低い点 = トピック境界

$$similarity(s_i, s_{i+1}) < \theta$$

---

4. 結果・比較スライド

表は簡略化し、重要な数値のみを抽出:

入力(レポートの結果表):

markdown
| 手法 | Precision | Recall | F1 |
|------|-----------|--------|-----|
| FixedSize | 0.72 | 0.68 | 0.70 |
| Semantic | 0.85 | 0.82 | 0.83 |
| Proposed | 0.91 | 0.88 | 0.89 |

出力(スライド):

markdown
---

## 実験結果

**導入**: 提案手法がベースラインを上回る性能を達成

**詳細**:
- F1スコア: 0.89(+19%向上)
- Precision: 0.91
- Recall: 0.88
- セマンティック手法より+6%改善

---

5. 参照論文スライド

各重要論文を1-2枚で説明:

入力(レポートの参照論文):

markdown
### [1]. CLIP: Learning Transferable Visual Models

| 項目 | 内容 |
|------|------|
| **著者** | Radford et al. |
| **年** | 2021 |
| **URL** | https://arxiv.org/abs/2103.00020 |

#### 概要
CLIPは、画像とテキストのペアを大規模に学習することで、
ゼロショット画像分類を可能にしたモデルです...

出力(スライド):

markdown
---

## 参照: CLIP (Radford 2021)

**導入**: 画像とテキストの対照学習モデル

**詳細**:
- 4億の画像-テキストペアで学習
- ゼロショット画像分類が可能
- 本論文: マルチモーダルチャンキングの基盤

---

出力形式

ファイル構造

code
reports/
  ├── {arxiv_id}_report.md      # 元のレポート
  └── {arxiv_id}_slides.md      # スライド版

スライドファイルのフォーマット

markdown
# [論文タイトル] - プレゼンテーション用

> 元レポート: [{arxiv_id}_report.md](./{arxiv_id}_report.md)
> スライド数: [N]枚

---

## 目次

1. タイトル
2. 概要
3. 背景・問題
4. 提案手法
5. 実験・結果
6. 重要な参照論文
7. 結論

---

## [論文タイトル]

**導入**: [サブタイトルまたは一言要約]

**詳細**:
- 著者: [著者名]
- 発表: [会議/ジャーナル, 年]
- arXiv: [{arxiv_id}](https://arxiv.org/abs/{arxiv_id})

---

[以下、各スライドが続く]

---

## まとめ

**導入**: 本論文の主要な貢献

**詳細**:
- [貢献1]
- [貢献2]
- [貢献3]

---

*このスライドは [{arxiv_id}_report.md](./{arxiv_id}_report.md) から自動生成されました。*
*生成日: YYYY-MM-DD*

実行コマンド

bash
# 基本的な使用方法
/split-to-slides 2401.12345

# レポートファイルを直接指定
/split-to-slides @reports/2401.12345_report.md

# スライド枚数の目安を指定
/split-to-slides 2401.12345 --max-slides 20

# 特定のセクションのみをスライド化
/split-to-slides 2401.12345 --sections "概要,提案手法,結論"

引数の説明:

  • --max-slides N: 最大スライド枚数を指定(デフォルト: 25)
  • --sections "...": 特定のセクションのみをスライド化

変換時の注意事項

情報の取捨選択

スライドでは全ての情報を含めることができません。以下の優先順位で情報を選択:

高優先度(必ず含める):

  • 論文の主要な主張/貢献
  • 提案手法の核心部分
  • 主要な実験結果の数値
  • 重要な図表

中優先度(可能なら含める):

  • 背景の詳細
  • アブレーション結果
  • 参照論文の詳細

低優先度(省略可能):

  • 実装の細部
  • 全ての数式の導出
  • 全ての参照論文

文章の簡潔化

レポートの文章をスライド用に圧縮:

レポート:

code
MemGPTは、コンピュータのOSにおけるメモリ管理の仕組みをLLMに適用した手法です。
具体的には、LLMのコンテキストウィンドウを「メインメモリ」、外部データベースを
「仮想メモリ(外部ストレージ)」として扱います。

スライド:

code
- OS のメモリ管理を LLM に適用
- コンテキスト = メインメモリ
- 外部DB = 仮想メモリ

図表の扱い

  • 1スライドに1図表まで
  • キャプションは簡潔に
  • 図表を説明するポイントを2-3個追加

サンプル出力

以下は、レポートからスライドへの変換例です。

入力: reports/2512.00185_report.md(一部)

markdown
## 3. テキストチャンキング手法

### 3.1 固定サイズチャンキング

固定サイズチャンキングは、最もシンプルなアプローチです。
文書を一定の文字数またはトークン数で機械的に分割します。

#### 技術的詳細

- **分割単位**: 文字数またはトークン数
- **オーバーラップ**: 隣接チャンク間で一部を共有
- **実装**: LangChain CharacterTextSplitter

#### 利点

- 実装が簡単
- 処理速度が速い
- 予測可能なチャンクサイズ

#### 限界

- 文の途中で分割される
- 意味的な一貫性が保証されない

出力: reports/2512.00185_slides.md(該当部分)

markdown
---

## テキストチャンキング: 固定サイズ

**導入**: 最もシンプルな分割手法

**詳細**:
- 一定の文字/トークン数で分割
- オーバーラップで文脈を維持
- LangChain で実装可能

---

## 固定サイズチャンキングの特徴

**導入**: シンプルだが限界もある

**詳細**:
| 利点 | 限界 |
|------|------|
| 実装が簡単 | 文の途中で分割 |
| 処理が高速 | 意味的一貫性なし |
| サイズ予測可能 | 最適サイズ不明 |

---

完全なワークフロー

ステップ 1: レポートの読み込み

bash
# レポートを読み込み
Read reports/{arxiv_id}_report.md

ステップ 2: 構造の分析

レポートの見出しを抽出し、スライド構成を設計:

code
- 基本情報 → タイトルスライド(1枚)
- 概要 → 概要スライド(2枚)
- 背景 → 背景スライド(2枚)
- 提案手法 → 手法スライド(5枚)
- 実験 → 実験スライド(3枚)
- 参照論文 → 参照スライド(3枚)
- 結論 → 結論スライド(2枚)
合計: 18枚

ステップ 3: 各スライドの作成

各セクションをスライドテンプレートに変換。

ステップ 4: ファイルの出力

bash
# スライドファイルを保存
Write reports/{arxiv_id}_slides.md

ステップ 5: 確認

生成されたスライドを確認し、必要に応じて調整。


注意事項

  • スライドは概要を伝えるもの。詳細はレポートを参照
  • 1スライド=1メッセージの原則を守る
  • 専門用語は初出時に簡単な説明を付ける
  • 図表は必要最小限に絞る
  • 数式は本当に必要な場合のみ含める
  • 生成後、発表者の好みに合わせて調整が必要な場合がある