Obsidian Analysis Pipeline
Cuando usar
- •Necesito indexar semanticamente el vault.
- •Quiero extraer conceptos, construir grafo o ejecutar busqueda semantica.
- •Quiero procesar en lotes con reanudacion.
Fases principales
- •Procesamiento progresivo
- •Divido en lotes (100 archivos por defecto) y priorizo archivos recientes.
- •Guardo estado en
analisis/estado-procesamiento.jsonpara reanudar.
- •Embeddings
- •Genero embeddings (modelo consistente) y guardo en
analisis/embeddings.json. - •Si ya existe, proceso solo archivos con hash cambiado.
- •Genero embeddings (modelo consistente) y guardo en
- •Conceptos
- •Extraigo terminos relevantes, frecuencias y co-ocurrencias en
analisis/conceptos.json.
- •Extraigo terminos relevantes, frecuencias y co-ocurrencias en
- •Grafo
- •Construyo nodos y aristas a partir de wikilinks y similitud semantica.
- •Guardo en
analisis/grafo-relaciones.json.
- •Busqueda semantica
- •Calculo similitud coseno contra embeddings y retorno top K con extractos.
Manejo de errores
- •Registro en
analisis/errores.logcon nivel y archivo afectado. - •Reintento con backoff y continuo; no detengo el pipeline por un archivo.
- •Creo backup antes de sobrescribir archivos JSON.
Actualizacion incremental
- •Si hay archivos nuevos o modificados, proceso solo esos.
- •Elimino entradas de archivos borrados.
Entrega
- •Resumen del estado (archivos procesados, fallidos, tiempo estimado).
- •Archivos JSON generados/actualizados y validacion basica.