Developer Indexer

Name: developer-indexer
Rating: 92
Author: juniormartinxo

1) Objetivo e Escopo

Evoluir o pipeline de ingestão e indexação para manter alta qualidade semântica, custo previsível e consistência entre full e incremental.

•Disparar quando o pedido mencionar apps/indexer, chunking, embeddings, ingestão de arquivos, full/incremental, tratamento de arquivos grandes ou exclusões de diretórios.
•Disparar quando houver alteração em ID de chunk, payload de metadados, estratégia de deduplicação ou rerank pré-indexação.
•Não disparar para contratos de tools MCP (developer-mcp-server), modelagem da collection Qdrant (developer-vector-db), bootstrap de ambiente (developer-infra) ou escrita de documentação (developer-docs).

•Escopo de indexação (repositórios, pastas, branch/commit, modo full ou incremental).
•Parâmetros de chunking (CHUNK_MAX_TOKENS, CHUNK_OVERLAP_TOKENS, heurística/AST).
•Provider/modelo de embedding e limites de custo/latência.
•Regras de exclusão (ex.: node_modules, dist, build, .git, binários).

•
Discovery
- •Mapear fluxo atual em code_compass/index, chunking, embeddings e storage.
- •Confirmar como o ID de chunk é composto e onde ocorre deduplicação.
- •Consultar references/checklist.md para critérios de consistência e performance.
•
Plan
- •Definir plano com impacto em qualidade de recuperação, custo de embedding e compatibilidade de payload.
- •Diferenciar claramente comportamento full vs incremental.
•
Implement
- •Aplicar mudança mínima por etapa (scan -> chunk -> embed -> upsert).
- •Garantir IDs determinísticos para evitar duplicidade em reindexações.
- •Preservar payload rico (repo, branch, commit, path, language, startLine, endLine).
•
Validate
- •Executar testes e smoke tests da indexação (principalmente incremental idempotente).
- •Validar exclusões obrigatórias e tratamento de arquivos grandes sem explodir memória.
•
Deliver
- •Entregar plano executado, mudanças por arquivo, comandos usados e limitações conhecidas.

•Sempre devolver: (1) plano, (2) alterações, (3) comandos de validação, (4) impacto em qualidade/custo.
•Sempre declarar se houve mudança em ID, payload ou política de exclusão.

•"No indexador Python, implemente chunking AST para TypeScript com fallback heurístico."
•"Ajuste a indexação incremental para atualizar apenas arquivos alterados no commit atual."
•"Crie IDs de chunk estáveis e evite duplicação ao reindexar a mesma branch."
•"Melhore o tratamento de arquivos grandes sem estourar memória durante a ingestão."