スライド分割スキル

論文分析レポートをプレゼンテーション用の短いセクションに分割します。

概要

このスキルは以下を行います：

•既存レポートの構造を分析
•各セクションをスライドサイズに分割
•各スライドに「タイトル」「導入」「詳細」を付与
•{arxiv_id}_slides.md として出力

スライドの基本原則

コンテンツ量の制限

1枚のスライドに含められる情報量には限りがあります。以下の制限を守ってください：

要素	制限
タイトル	1行、最大15文字程度
導入文	1-2文、最大50文字程度
箇条書き	3-5項目、各項目20-30文字程度
図表	1枚のスライドに最大1つ
数式	1枚のスライドに1-2個まで
合計文字数	150-200文字程度

スライドの構成

各スライドは以下の3要素で構成します：

markdown

## [タイトル]

**導入**: [このスライドで伝えたいことの要約（1-2文）]

**詳細**:
- [ポイント1]
- [ポイント2]
- [ポイント3]

[図表がある場合は1つだけ配置]

ワークフロー

1. レポートの読み込みと分析

対象レポートを Read ツールで読み込み、以下を把握：

•arXiv ID
•レポートの全体構造（セクション一覧）
•図表の数と位置
•主要なポイント

2. スライド構成の設計

レポートの内容を以下のスライドカテゴリに分類：

カテゴリ	枚数目安	内容
タイトル	1枚	論文タイトル、著者、発表先
概要	1-2枚	研究の目的と主要な成果
背景・問題	2-3枚	解決する問題と既存手法の課題
提案手法	3-5枚	手法の概要、アーキテクチャ、詳細
実験・結果	2-4枚	実験設定、主要結果、考察
参照論文	2-3枚	重要な関連研究（各1-2枚）
結論	1-2枚	貢献、限界、今後の展望
合計	15-25枚	-

3. 各スライドの作成

スライドテンプレート

markdown

---

## [スライドタイトル]

**導入**: [このスライドの要点を1-2文で]

**詳細**:
- [箇条書きポイント1]
- [箇条書きポイント2]
- [箇条書きポイント3]

---

図表を含むスライド

markdown

---

## [スライドタイトル]

**導入**: [図表が何を示しているかを簡潔に]

![Figure X](./figures/{arxiv_id}/figX.png)

**詳細**:
- [図から読み取れるポイント1]
- [図から読み取れるポイント2]

---

数式を含むスライド

markdown

---

## [数式/アルゴリズムのタイトル]

**導入**: [この数式が何を表すか]

$$[数式]$$

**詳細**:
- $[変数1]$: [意味]
- $[変数2]$: [意味]
- [数式の意義]

---

スライド変換のガイドライン

1. タイトルスライド

入力（レポートの基本情報）:

markdown

## 基本情報

| 項目 | 内容 |
|------|------|
| **タイトル** | Chunking Strategies for RAG |
| **著者** | Author et al. |
| **発表先** | arXiv 2024 |

出力（スライド）:

markdown

---

## Chunking Strategies for RAG

**導入**: RAGにおけるチャンキング戦略のサーベイ論文

**詳細**:
- 著者: Author et al.
- 発表: arXiv 2024
- arXiv ID: 2401.12345

---

2. 概要スライド

長い概要は複数スライドに分割します。

分割の基準:

•1つの主要なポイントにつき1スライド
•数値結果は別スライドにまとめる

入力（レポートの概要）:

markdown

## 概要

本論文では、RAGシステムにおけるチャンキング戦略を体系的に分類しています。
5つの軸（モダリティ、粒度、ヒューリスティック、アラインメント、目的）に基づく
分類体系を提案し、各カテゴリの手法を詳細に比較しています。

出力（スライド1）:

markdown

---

## サーベイの目的

**導入**: RAGシステムのチャンキング戦略を体系的に整理

**詳細**:
- チャンキング = 文書を検索可能な単位に分割
- RAGの性能に大きく影響
- 統一的な分類体系が必要

---

出力（スライド2）:

markdown

---

## 分類体系（Taxonomy）

**導入**: 5つの軸でチャンキング手法を分類

**詳細**:
- モダリティ: テキスト/画像/音声/動画
- 粒度: 固定長/可変長/セマンティック
- ヒューリスティック: ルールベース/学習ベース
- アラインメント: モダリティ間の対応
- 目的: 検索/生成/両方

---

3. 手法の説明スライド

複雑な手法は複数スライドに分解：

•概要スライド: 手法の目的と基本アイデア
•アーキテクチャスライド: 図を用いた構造説明
•詳細スライド: 重要なコンポーネントの説明

入力（レポートの手法説明）:

markdown

### セマンティックチャンキング

セマンティックチャンキングは、文の意味的な類似性に基づいて
分割点を決定する手法です。隣接する文の埋め込みベクトル間の
コサイン類似度を計算し、類似度が閾値を下回る点で分割します。

#### 技術的詳細
- 文埋め込みモデルを使用
- コサイン類似度で境界を検出
- 閾値はハイパーパラメータ

出力（スライド1: 概要）:

markdown

---

## セマンティックチャンキング

**導入**: 意味の区切りで文書を分割する手法

**詳細**:
- 文の「意味」に基づいて分割
- 固定長分割の問題を解決
- トピックの境界を自動検出

---

出力（スライド2: 仕組み）:

markdown

---

## セマンティックチャンキングの仕組み

**導入**: 文埋め込みの類似度で境界を検出

**詳細**:
- 各文をベクトルに変換
- 隣接文のコサイン類似度を計算
- 類似度が低い点 = トピック境界

$$similarity(s_i, s_{i+1}) < \theta$$

---

4. 結果・比較スライド

表は簡略化し、重要な数値のみを抽出：

入力（レポートの結果表）:

markdown

| 手法 | Precision | Recall | F1 |
|------|-----------|--------|-----|
| FixedSize | 0.72 | 0.68 | 0.70 |
| Semantic | 0.85 | 0.82 | 0.83 |
| Proposed | 0.91 | 0.88 | 0.89 |

出力（スライド）:

markdown

---

## 実験結果

**導入**: 提案手法がベースラインを上回る性能を達成

**詳細**:
- F1スコア: 0.89（+19%向上）
- Precision: 0.91
- Recall: 0.88
- セマンティック手法より+6%改善

---

5. 参照論文スライド

各重要論文を1-2枚で説明：

入力（レポートの参照論文）:

markdown

### [1]. CLIP: Learning Transferable Visual Models

| 項目 | 内容 |
|------|------|
| **著者** | Radford et al. |
| **年** | 2021 |
| **URL** | https://arxiv.org/abs/2103.00020 |

#### 概要
CLIPは、画像とテキストのペアを大規模に学習することで、
ゼロショット画像分類を可能にしたモデルです...

出力（スライド）:

markdown

---

## 参照: CLIP (Radford 2021)

**導入**: 画像とテキストの対照学習モデル

**詳細**:
- 4億の画像-テキストペアで学習
- ゼロショット画像分類が可能
- 本論文: マルチモーダルチャンキングの基盤

---

出力形式

ファイル構造

code

reports/
  ├── {arxiv_id}_report.md      # 元のレポート
  └── {arxiv_id}_slides.md      # スライド版

スライドファイルのフォーマット

markdown

# [論文タイトル] - プレゼンテーション用

> 元レポート: [{arxiv_id}_report.md](./{arxiv_id}_report.md)
> スライド数: [N]枚

---

## 目次

1. タイトル
2. 概要
3. 背景・問題
4. 提案手法
5. 実験・結果
6. 重要な参照論文
7. 結論

---

## [論文タイトル]

**導入**: [サブタイトルまたは一言要約]

**詳細**:
- 著者: [著者名]
- 発表: [会議/ジャーナル, 年]
- arXiv: [{arxiv_id}](https://arxiv.org/abs/{arxiv_id})

---

[以下、各スライドが続く]

---

## まとめ

**導入**: 本論文の主要な貢献

**詳細**:
- [貢献1]
- [貢献2]
- [貢献3]

---

*このスライドは [{arxiv_id}_report.md](./{arxiv_id}_report.md) から自動生成されました。*
*生成日: YYYY-MM-DD*

実行コマンド

bash

# 基本的な使用方法
/split-to-slides 2401.12345

# レポートファイルを直接指定
/split-to-slides @reports/2401.12345_report.md

# スライド枚数の目安を指定
/split-to-slides 2401.12345 --max-slides 20

# 特定のセクションのみをスライド化
/split-to-slides 2401.12345 --sections "概要,提案手法,結論"

引数の説明:

•--max-slides N: 最大スライド枚数を指定（デフォルト: 25）
•--sections "...": 特定のセクションのみをスライド化

変換時の注意事項

情報の取捨選択

スライドでは全ての情報を含めることができません。以下の優先順位で情報を選択：

高優先度（必ず含める）:

•論文の主要な主張/貢献
•提案手法の核心部分
•主要な実験結果の数値
•重要な図表

中優先度（可能なら含める）:

•背景の詳細
•アブレーション結果
•参照論文の詳細

低優先度（省略可能）:

•実装の細部
•全ての数式の導出
•全ての参照論文

文章の簡潔化

レポートの文章をスライド用に圧縮：

レポート:

code

MemGPTは、コンピュータのOSにおけるメモリ管理の仕組みをLLMに適用した手法です。
具体的には、LLMのコンテキストウィンドウを「メインメモリ」、外部データベースを
「仮想メモリ（外部ストレージ）」として扱います。

スライド:

code

- OS のメモリ管理を LLM に適用
- コンテキスト = メインメモリ
- 外部DB = 仮想メモリ

図表の扱い

•1スライドに1図表まで
•キャプションは簡潔に
•図表を説明するポイントを2-3個追加

サンプル出力

以下は、レポートからスライドへの変換例です。

入力: reports/2512.00185_report.md（一部）

markdown

## 3. テキストチャンキング手法

### 3.1 固定サイズチャンキング

固定サイズチャンキングは、最もシンプルなアプローチです。
文書を一定の文字数またはトークン数で機械的に分割します。

#### 技術的詳細

- **分割単位**: 文字数またはトークン数
- **オーバーラップ**: 隣接チャンク間で一部を共有
- **実装**: LangChain CharacterTextSplitter

#### 利点

- 実装が簡単
- 処理速度が速い
- 予測可能なチャンクサイズ

#### 限界

- 文の途中で分割される
- 意味的な一貫性が保証されない

出力: reports/2512.00185_slides.md（該当部分）

markdown

---

## テキストチャンキング: 固定サイズ

**導入**: 最もシンプルな分割手法

**詳細**:
- 一定の文字/トークン数で分割
- オーバーラップで文脈を維持
- LangChain で実装可能

---

## 固定サイズチャンキングの特徴

**導入**: シンプルだが限界もある

**詳細**:
| 利点 | 限界 |
|------|------|
| 実装が簡単 | 文の途中で分割 |
| 処理が高速 | 意味的一貫性なし |
| サイズ予測可能 | 最適サイズ不明 |

---

完全なワークフロー

ステップ 1: レポートの読み込み

bash

# レポートを読み込み
Read reports/{arxiv_id}_report.md

ステップ 2: 構造の分析

レポートの見出しを抽出し、スライド構成を設計：

code

- 基本情報 → タイトルスライド（1枚）
- 概要 → 概要スライド（2枚）
- 背景 → 背景スライド（2枚）
- 提案手法 → 手法スライド（5枚）
- 実験 → 実験スライド（3枚）
- 参照論文 → 参照スライド（3枚）
- 結論 → 結論スライド（2枚）
合計: 18枚

ステップ 3: 各スライドの作成

各セクションをスライドテンプレートに変換。

ステップ 4: ファイルの出力

bash

# スライドファイルを保存
Write reports/{arxiv_id}_slides.md

ステップ 5: 確認

生成されたスライドを確認し、必要に応じて調整。

注意事項

•スライドは概要を伝えるもの。詳細はレポートを参照
•1スライド=1メッセージの原則を守る
•専門用語は初出時に簡単な説明を付ける
•図表は必要最小限に絞る
•数式は本当に必要な場合のみ含める
•生成後、発表者の好みに合わせて調整が必要な場合がある