スライド分割スキル
論文分析レポートをプレゼンテーション用の短いセクションに分割します。
概要
このスキルは以下を行います:
- •既存レポートの構造を分析
- •各セクションをスライドサイズに分割
- •各スライドに「タイトル」「導入」「詳細」を付与
- •
{arxiv_id}_slides.mdとして出力
スライドの基本原則
コンテンツ量の制限
1枚のスライドに含められる情報量には限りがあります。以下の制限を守ってください:
| 要素 | 制限 |
|---|---|
| タイトル | 1行、最大15文字程度 |
| 導入文 | 1-2文、最大50文字程度 |
| 箇条書き | 3-5項目、各項目20-30文字程度 |
| 図表 | 1枚のスライドに最大1つ |
| 数式 | 1枚のスライドに1-2個まで |
| 合計文字数 | 150-200文字程度 |
スライドの構成
各スライドは以下の3要素で構成します:
markdown
## [タイトル] **導入**: [このスライドで伝えたいことの要約(1-2文)] **詳細**: - [ポイント1] - [ポイント2] - [ポイント3] [図表がある場合は1つだけ配置]
ワークフロー
1. レポートの読み込みと分析
対象レポートを Read ツールで読み込み、以下を把握:
- •arXiv ID
- •レポートの全体構造(セクション一覧)
- •図表の数と位置
- •主要なポイント
2. スライド構成の設計
レポートの内容を以下のスライドカテゴリに分類:
| カテゴリ | 枚数目安 | 内容 |
|---|---|---|
| タイトル | 1枚 | 論文タイトル、著者、発表先 |
| 概要 | 1-2枚 | 研究の目的と主要な成果 |
| 背景・問題 | 2-3枚 | 解決する問題と既存手法の課題 |
| 提案手法 | 3-5枚 | 手法の概要、アーキテクチャ、詳細 |
| 実験・結果 | 2-4枚 | 実験設定、主要結果、考察 |
| 参照論文 | 2-3枚 | 重要な関連研究(各1-2枚) |
| 結論 | 1-2枚 | 貢献、限界、今後の展望 |
| 合計 | 15-25枚 | - |
3. 各スライドの作成
スライドテンプレート
markdown
--- ## [スライドタイトル] **導入**: [このスライドの要点を1-2文で] **詳細**: - [箇条書きポイント1] - [箇条書きポイント2] - [箇条書きポイント3] ---
図表を含むスライド
markdown
---
## [スライドタイトル]
**導入**: [図表が何を示しているかを簡潔に]

**詳細**:
- [図から読み取れるポイント1]
- [図から読み取れるポイント2]
---
数式を含むスライド
markdown
--- ## [数式/アルゴリズムのタイトル] **導入**: [この数式が何を表すか] $$[数式]$$ **詳細**: - $[変数1]$: [意味] - $[変数2]$: [意味] - [数式の意義] ---
スライド変換のガイドライン
1. タイトルスライド
入力(レポートの基本情報):
markdown
## 基本情報 | 項目 | 内容 | |------|------| | **タイトル** | Chunking Strategies for RAG | | **著者** | Author et al. | | **発表先** | arXiv 2024 |
出力(スライド):
markdown
--- ## Chunking Strategies for RAG **導入**: RAGにおけるチャンキング戦略のサーベイ論文 **詳細**: - 著者: Author et al. - 発表: arXiv 2024 - arXiv ID: 2401.12345 ---
2. 概要スライド
長い概要は複数スライドに分割します。
分割の基準:
- •1つの主要なポイントにつき1スライド
- •数値結果は別スライドにまとめる
入力(レポートの概要):
markdown
## 概要 本論文では、RAGシステムにおけるチャンキング戦略を体系的に分類しています。 5つの軸(モダリティ、粒度、ヒューリスティック、アラインメント、目的)に基づく 分類体系を提案し、各カテゴリの手法を詳細に比較しています。
出力(スライド1):
markdown
--- ## サーベイの目的 **導入**: RAGシステムのチャンキング戦略を体系的に整理 **詳細**: - チャンキング = 文書を検索可能な単位に分割 - RAGの性能に大きく影響 - 統一的な分類体系が必要 ---
出力(スライド2):
markdown
--- ## 分類体系(Taxonomy) **導入**: 5つの軸でチャンキング手法を分類 **詳細**: - モダリティ: テキスト/画像/音声/動画 - 粒度: 固定長/可変長/セマンティック - ヒューリスティック: ルールベース/学習ベース - アラインメント: モダリティ間の対応 - 目的: 検索/生成/両方 ---
3. 手法の説明スライド
複雑な手法は複数スライドに分解:
- •概要スライド: 手法の目的と基本アイデア
- •アーキテクチャスライド: 図を用いた構造説明
- •詳細スライド: 重要なコンポーネントの説明
入力(レポートの手法説明):
markdown
### セマンティックチャンキング セマンティックチャンキングは、文の意味的な類似性に基づいて 分割点を決定する手法です。隣接する文の埋め込みベクトル間の コサイン類似度を計算し、類似度が閾値を下回る点で分割します。 #### 技術的詳細 - 文埋め込みモデルを使用 - コサイン類似度で境界を検出 - 閾値はハイパーパラメータ
出力(スライド1: 概要):
markdown
--- ## セマンティックチャンキング **導入**: 意味の区切りで文書を分割する手法 **詳細**: - 文の「意味」に基づいて分割 - 固定長分割の問題を解決 - トピックの境界を自動検出 ---
出力(スライド2: 仕組み):
markdown
---
## セマンティックチャンキングの仕組み
**導入**: 文埋め込みの類似度で境界を検出
**詳細**:
- 各文をベクトルに変換
- 隣接文のコサイン類似度を計算
- 類似度が低い点 = トピック境界
$$similarity(s_i, s_{i+1}) < \theta$$
---
4. 結果・比較スライド
表は簡略化し、重要な数値のみを抽出:
入力(レポートの結果表):
markdown
| 手法 | Precision | Recall | F1 | |------|-----------|--------|-----| | FixedSize | 0.72 | 0.68 | 0.70 | | Semantic | 0.85 | 0.82 | 0.83 | | Proposed | 0.91 | 0.88 | 0.89 |
出力(スライド):
markdown
--- ## 実験結果 **導入**: 提案手法がベースラインを上回る性能を達成 **詳細**: - F1スコア: 0.89(+19%向上) - Precision: 0.91 - Recall: 0.88 - セマンティック手法より+6%改善 ---
5. 参照論文スライド
各重要論文を1-2枚で説明:
入力(レポートの参照論文):
markdown
### [1]. CLIP: Learning Transferable Visual Models | 項目 | 内容 | |------|------| | **著者** | Radford et al. | | **年** | 2021 | | **URL** | https://arxiv.org/abs/2103.00020 | #### 概要 CLIPは、画像とテキストのペアを大規模に学習することで、 ゼロショット画像分類を可能にしたモデルです...
出力(スライド):
markdown
--- ## 参照: CLIP (Radford 2021) **導入**: 画像とテキストの対照学習モデル **詳細**: - 4億の画像-テキストペアで学習 - ゼロショット画像分類が可能 - 本論文: マルチモーダルチャンキングの基盤 ---
出力形式
ファイル構造
code
reports/
├── {arxiv_id}_report.md # 元のレポート
└── {arxiv_id}_slides.md # スライド版
スライドファイルのフォーマット
markdown
# [論文タイトル] - プレゼンテーション用
> 元レポート: [{arxiv_id}_report.md](./{arxiv_id}_report.md)
> スライド数: [N]枚
---
## 目次
1. タイトル
2. 概要
3. 背景・問題
4. 提案手法
5. 実験・結果
6. 重要な参照論文
7. 結論
---
## [論文タイトル]
**導入**: [サブタイトルまたは一言要約]
**詳細**:
- 著者: [著者名]
- 発表: [会議/ジャーナル, 年]
- arXiv: [{arxiv_id}](https://arxiv.org/abs/{arxiv_id})
---
[以下、各スライドが続く]
---
## まとめ
**導入**: 本論文の主要な貢献
**詳細**:
- [貢献1]
- [貢献2]
- [貢献3]
---
*このスライドは [{arxiv_id}_report.md](./{arxiv_id}_report.md) から自動生成されました。*
*生成日: YYYY-MM-DD*
実行コマンド
bash
# 基本的な使用方法 /split-to-slides 2401.12345 # レポートファイルを直接指定 /split-to-slides @reports/2401.12345_report.md # スライド枚数の目安を指定 /split-to-slides 2401.12345 --max-slides 20 # 特定のセクションのみをスライド化 /split-to-slides 2401.12345 --sections "概要,提案手法,結論"
引数の説明:
- •
--max-slides N: 最大スライド枚数を指定(デフォルト: 25) - •
--sections "...": 特定のセクションのみをスライド化
変換時の注意事項
情報の取捨選択
スライドでは全ての情報を含めることができません。以下の優先順位で情報を選択:
高優先度(必ず含める):
- •論文の主要な主張/貢献
- •提案手法の核心部分
- •主要な実験結果の数値
- •重要な図表
中優先度(可能なら含める):
- •背景の詳細
- •アブレーション結果
- •参照論文の詳細
低優先度(省略可能):
- •実装の細部
- •全ての数式の導出
- •全ての参照論文
文章の簡潔化
レポートの文章をスライド用に圧縮:
レポート:
code
MemGPTは、コンピュータのOSにおけるメモリ管理の仕組みをLLMに適用した手法です。 具体的には、LLMのコンテキストウィンドウを「メインメモリ」、外部データベースを 「仮想メモリ(外部ストレージ)」として扱います。
スライド:
code
- OS のメモリ管理を LLM に適用 - コンテキスト = メインメモリ - 外部DB = 仮想メモリ
図表の扱い
- •1スライドに1図表まで
- •キャプションは簡潔に
- •図表を説明するポイントを2-3個追加
サンプル出力
以下は、レポートからスライドへの変換例です。
入力: reports/2512.00185_report.md(一部)
markdown
## 3. テキストチャンキング手法 ### 3.1 固定サイズチャンキング 固定サイズチャンキングは、最もシンプルなアプローチです。 文書を一定の文字数またはトークン数で機械的に分割します。 #### 技術的詳細 - **分割単位**: 文字数またはトークン数 - **オーバーラップ**: 隣接チャンク間で一部を共有 - **実装**: LangChain CharacterTextSplitter #### 利点 - 実装が簡単 - 処理速度が速い - 予測可能なチャンクサイズ #### 限界 - 文の途中で分割される - 意味的な一貫性が保証されない
出力: reports/2512.00185_slides.md(該当部分)
markdown
--- ## テキストチャンキング: 固定サイズ **導入**: 最もシンプルな分割手法 **詳細**: - 一定の文字/トークン数で分割 - オーバーラップで文脈を維持 - LangChain で実装可能 --- ## 固定サイズチャンキングの特徴 **導入**: シンプルだが限界もある **詳細**: | 利点 | 限界 | |------|------| | 実装が簡単 | 文の途中で分割 | | 処理が高速 | 意味的一貫性なし | | サイズ予測可能 | 最適サイズ不明 | ---
完全なワークフロー
ステップ 1: レポートの読み込み
bash
# レポートを読み込み
Read reports/{arxiv_id}_report.md
ステップ 2: 構造の分析
レポートの見出しを抽出し、スライド構成を設計:
code
- 基本情報 → タイトルスライド(1枚) - 概要 → 概要スライド(2枚) - 背景 → 背景スライド(2枚) - 提案手法 → 手法スライド(5枚) - 実験 → 実験スライド(3枚) - 参照論文 → 参照スライド(3枚) - 結論 → 結論スライド(2枚) 合計: 18枚
ステップ 3: 各スライドの作成
各セクションをスライドテンプレートに変換。
ステップ 4: ファイルの出力
bash
# スライドファイルを保存
Write reports/{arxiv_id}_slides.md
ステップ 5: 確認
生成されたスライドを確認し、必要に応じて調整。
注意事項
- •スライドは概要を伝えるもの。詳細はレポートを参照
- •1スライド=1メッセージの原則を守る
- •専門用語は初出時に簡単な説明を付ける
- •図表は必要最小限に絞る
- •数式は本当に必要な場合のみ含める
- •生成後、発表者の好みに合わせて調整が必要な場合がある