AgentSkillsCN

Das Orakel (Semantische Suche)

基于全网七风知识,实现本地向量检索(RAG)。采用 jina-embeddings-v3 进行嵌入计算,借助 bge-reranker-v2-m3 实现重排序。

SKILL.md
--- frontmatter
name: Das Orakel (Semantische Suche)
description: Lokale Vektorsuche (RAG) über das gesamte Siebenwind-Wissen. Nutzt jina-embeddings-v3 für Embedding und bge-reranker-v2-m3 für Re-Ranking.

Das Orakel – Semantische Wissenssuche

Epistemischer Status: #perspektive

Das Orakel ermöglicht semantische, nicht-lineare Suche über das gesamte Siebenwind-Archiv. Es denkt assoziativ: Wenn ein Text „Der dunkle König" erwähnt, findet das Orakel auch Einträge zu „Schattenherrscher", ohne dass das Keyword identisch sein muss.

Architektur

  • Embedding: jinaai/jina-embeddings-v3 (570M Params, 8192 Token Kontext, LoRA-Adapter für Retrieval)
  • Re-Ranker: BAAI/bge-reranker-v2-m3 (568M Params, Cross-Encoder für präzises Re-Ranking)
  • Vektor-DB: ChromaDB (persistent, lokal unter .agent/data/chroma_db/)
  • GPU: Apple MPS (Metal Performance Shaders) für ~4-5× Beschleunigung
  • Modell-Cache: .agent/data/models/ (persistent über Sandbox-Neustarts)

Zwei getrennte Datenbanken

CollectionInhaltLevel
siebenwind_quellen/Quellen/ — Rohmaterialcanon, chronicle, lore, legend
siebenwind_wiki/Siebenwind_Wiki/ — Abgeleitetes Wissenwiki

Voraussetzungen

bash
# Einmalige Installation
bash .agent/skills/oracle/setup.sh

2. Nutzung (CLI)

Der Skill wird über das Terminal aufgerufen.

Basis-Suche (Standard: Nur Wiki):

bash
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/search.py "Wer ist der Gott des Feuers?"

Erweiterte Suche (Quellen / Alles):

bash
# Nur in Rohdaten suchen
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/search.py "Tiamat" --source quellen

# Alles durchsuchen (Wiki + Quellen)
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/search.py "Tiamat" --source all

# Ohne Re-Ranking (schneller)
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/search.py "Tiamat" --no-rerank

# Mehr Ergebnisse
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/search.py "Tiamat" --top 10

3. Indexierung & Wartung

Der Index wird inkrementell gebaut. Das System erkennt Änderungen (via Content-Hash) und Renames automatisch.

Standard (Update):

bash
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/build_index.py

Erweiterte Optionen:

bash
# Status prüfen (ohne Änderungen)
.../build_index.py --status

# Vollständiger Neuaufbau (Reset)
.../build_index.py --rebuild

# CPU-Modus erzwingen (falls MPS instabil)
.../build_index.py --cpu

Hardware-Optimierung:

bash
# Misst Geschwindigkeit und ermittelt optimale Batch-Size
.agent/skills/oracle/venv/bin/python3 .agent/skills/oracle/benchmark_hardware.py

Agent-Integration (Historiker-Workflow)

  1. Artikel-Review: „Gibt es in den Quellen Infos zu X, die im Artikel fehlen?"
  2. Konsistenzprüfung: „Was sagen verschiedene Quellen über Ereignis Y?"
  3. Deep Lore: „Welche Spielergeschichten erwähnen Ort Z?"