SKILL.md — Engineering Contract (Pipeline generation_prompts)
Ce document est le contrat d’ingénierie pour tout changement sur le pipeline Python. Les sorties générées par Codex (code, prompts, docs) doivent rester conformes à ce contrat.
1) Scope
- •Projet Python 3.13 orienté automatisation de contenu.
- •Source of Truth fonctionnelle:
SOT.md. - •Pipeline cible:
loader -> normalizer -> classifier -> prompt_builder -> generator -> export.
2) Coding Rules
- •Code modulaire, lisible, et testable par module.
- •Respect strict PEP8.
- •Utiliser
pathlib.Pathpour tous les chemins. - •Ajouter des logs simples pour debug (
print("[module] ...")). - •Chaque module doit inclure un bloc
if __name__ == "__main__":avec un mini test. - •Toujours conserver la compatibilité des noms de templates:
- •
prompts/prompt_templates.json - •
prompts/prompt_template.json(alias)
- •
3) Error Handling Contract
Erreur explicite (obligatoire)
Lever une erreur explicite dans les cas suivants:
- •CSV source manquant ou mal formé.
- •Colonnes minimales manquantes.
- •JSON template manquant ou mal formé.
- •Schéma template invalide.
Fallback contrôlé (autorisé)
Utiliser un fallback uniquement pour:
- •Valeurs métiers manquantes (
niche,lang,rights,usage_strategy) avec defaults documentés. - •Mapping strategy/rights vers valeurs par défaut sûres (
viral,rewrite).
4) Data Conventions
- •Encodage CSV/JSON: UTF-8.
- •Colonnes minimales d’entrée:
source_url,niche,lang,rights,usage_strategy. - •Colonnes de sortie critiques:
- •
ready_to_generate.csv: métadonnées + scores + flags. - •
prompts_ready.csv: mêmes métadonnées +final_prompt.
- •
5) Tests & Validation
- •Validation syntaxique (
py_compile) obligatoire. - •Validation artefacts obligatoire via script dédié.
- •Afficher
head(5)des sorties dans les checks de validation. - •Tenter un run end-to-end de
master_pipeline.pydans un environnement avecpandas.
6) Acceptance Criteria (End-to-End)
Une implémentation est acceptée si:
- •Les templates alias sont cohérents (
prompt_templates.json==prompt_template.json). - •Les deux CSV finaux existent et contiennent 10 lignes en mode démo.
- •
prompts_ready.csvcontientfinal_promptnon vide pour les lignes éligibles. - •Les colonnes de scoring (
priority_score,blended_priority_score) sont présentes. - •Les logs de debug et les previews
head(5)sont visibles.
7) Prompt/Docs Contract for Codex
- •Les prompts générés par Codex doivent respecter ce contrat (structure, contraintes et mapping).
- •Les documents (
README.md,SOT.md,SKILL.md) servent de source contractuelle pour les futures générations. - •En cas de divergence,
SOT.md+ ceSKILL.mdpriment sur les hypothèses implicites.