Referências e Citações
Propósito
Automatizar ao máximo o trabalho de gestão de referências — a tarefa que o autor mais detesta fazer manualmente. Cobrir desde a inserção inline até a geração da lista final formatada, incluindo verificação de integridade.
1. Estilos de citação suportados
- •Vancouver (ICMJE): Padrão para publicações médicas. Numeração sequencial [1], [2], etc.
- •ABNT: Padrão brasileiro. Autor-data (Sobrenome, Ano).
- •APA: Padrão em ciências sociais. Autor-data (Sobrenome, ano).
- •Outros conforme demanda do projeto.
Cada projeto define seu estilo no respectivo SKILL.md. Sempre verificar antes de inserir referências.
2. Inserção e formatação
Inserção inline
- •Vancouver: numeração sequencial conforme ordem de aparição no texto
- •ABNT/APA: formato autor-data
Lista de referências
- •Formatar conforme estilo definido no projeto
- •Periódicos, livros, Internet e legislação têm formatos distintos (consultar Manual do projeto)
Verificação de consistência
- •Toda referência citada no texto deve constar da lista final
- •Toda referência da lista deve estar citada no texto
- •Numeração sequencial sem lacunas (Vancouver)
3. Verificação e monitoramento de referências
Esta seção é operacional — usar como checklist ao inserir referências e ao auditar referências existentes.
3.1 Checklist por referência (executar ao inserir cada nova referência)
Antes de inserir qualquer referência no texto canônico, verificar:
| # | Verificação | Como fazer | Obrigatório? |
|---|---|---|---|
| 1 | URL/DOI acessível? | WebFetch na URL ou https://doi.org/[DOI] | Sim (para fontes Internet) |
| 2 | Conteúdo corrobora a afirmação? | Ler a fonte e confirmar que os dados citados estão presentes | Sim |
| 3 | Formato correto? | Conferir com o estilo definido no SKILL.md do projeto | Sim |
| 4 | Procedência documentada? | Referência registrada em notas_pesquisa.md com URL, DOI e data de verificação | Sim |
| 5 | Autores verificados? | Confirmar que os autores listados são os autores reais do artigo/documento | Sim |
| 6 | Metadados conferidos? | Volume, issue, páginas, ano — conferir com a fonte primária | Sim |
3.2 Cuidados especiais com referências de IA
Referências sugeridas por modelos de linguagem (Perplexity, scite.ai, ChatGPT, Claude) DEVEM ser verificadas individualmente antes de inserção no texto. Riscos conhecidos e documentados:
- •Autores fabricados — nomes plausíveis mas inexistentes no periódico citado (caso Aldoseri et al. [7], Cap. 16)
- •Metadados misturados — título de um artigo combinado com volume/páginas de outro
- •DOIs inventados — DOIs com formato correto mas que retornam 404
- •Periódicos errados — artigo atribuído ao periódico errado
- •Dados quantitativos sem fonte — números específicos sem URL (ChatGPT: "HC-SP reduziu 40% tempo de auditoria" — inverificável)
- •Refs off-topic — scite.ai gerou 45,8% de refs off-topic sobre resíduos hospitalares e geriatria para um capítulo sobre Big Data/IA em gestão
Protocolo obrigatório para referências de IA:
- •Verificar existência do artigo via DOI ou busca no site do periódico
- •Conferir autores, título, volume, páginas e ano na fonte primária
- •Para dados quantitativos específicos: localizar o número na fonte — não confiar que está lá
- •Se qualquer dado não conferir, descartar e buscar a referência correta manualmente
- •Documentar no
notas_pesquisa.mdque a referência foi verificada
Avaliação empírica das ferramentas (auditoria de 288 refs / 5 ferramentas, 2026-02-18):
| Ferramenta | % off-topic | URLs fornecidas | Risco de alucinação |
|---|---|---|---|
| Perplexity | 59% | 100% (verificável) | Baixo |
| scite.ai | 46% | 0% (inverificável) | Médio |
| Google Gemini | 21% | 100% (verificável) | Médio |
| ChatGPT | 0% | 0% (inverificável) | Alto |
| Claude | 8% | 97% (verificável) | Médio-baixo |
→ Relatório completo: ~/escrita/Livro Editora Atheneu/relatorio-audit-deep-research.md
→ Pipeline recomendado: ~/escrita/skills/revisao-literatura/SKILL.md
3.3 Protocolo de prevenção (integrado ao workflow de escrita)
Ao pesquisar (etapa 1 do workflow):
- •Registrar em
notas_pesquisa.md: URL de acesso, DOI (quando aplicável), data de verificação - •Para periódicos: anotar DOI sempre que disponível (DOIs raramente quebram)
- •Para sites institucionais: anotar URL completa + capturar texto relevante (sites governamentais mudam URLs frequentemente)
Ao inserir referência no texto (etapa 3 do workflow):
- •Executar checklist 3.1 completo
- •Incluir URL ou DOI mesmo para artigos de periódico (facilita verificação futura)
- •Para legislação: separar referência legal (decreto/portaria) de dados quantitativos (relatórios operacionais)
Ao finalizar seção (entre etapas 3 e 4 do workflow):
- •Verificar consistência: todas as referências citadas estão na lista?
- •Verificar numeração sequencial (Vancouver)
- •Rodar checklist 3.1 para referências que foram inseridas sem verificação completa
3.4 Monitoramento periódico
Antes de submeter o capítulo/artigo final:
- •Re-verificar todos os links (URLs podem quebrar em semanas)
- •Priorizar DOIs como âncora estável (DOIs > URLs de sites)
- •Para URLs governamentais (DATASUS, ANS, Planalto): verificar com atenção redobrada
Classificação de risco de link rot:
| Risco | Tipo de fonte | Ação |
|---|---|---|
| Baixo | Periódicos via DOI | Manter DOI; URL é backup |
| Médio | Sites de consultorias e organizações (HIMSS, Straits Research) | Verificar antes de submeter |
| Alto | Sites governamentais brasileiros (.gov.br) | Verificar antes de submeter; manter cópia do conteúdo relevante no notas_pesquisa.md |
| Muito alto | URLs diretas de PDF (download links) em periódicos | Evitar; usar URL canônica do artigo |
| Muito alto | URLs dinâmicas, páginas de busca | Evitar; buscar URL permanente |
Evidência empírica (auditoria Cap. 16, 2026-02-18): dos 217 links verificados, 71,4% acessíveis, 8,8% bloqueados por bot (não implica inexistência), 0,9% 404, 3,7% timeout. URLs de download de PDF foram as únicas 404 reais (2 casos).
4. Verificação de claims (afirmações vs. referências)
Status: Operacional (Camada 1 automatizada + Camada 2 interativa)
O que é
Sistema que verifica se as afirmações no texto são realmente suportadas pelas referências citadas. Motivado pela descoberta de que 9/30 referências do Cap. 16 tinham autores fabricados — se metadados estavam errados, dados citados podem estar igualmente fabricados.
Tipos de verificação
| Tipo | Descrição | Método |
|---|---|---|
| A — Quantitativo | Números, percentagens, valores monetários | Busca numérica com variantes PT↔EN |
| B — Qualitativo | Métodos, modelos, instituições | Entity matching + contexto |
| C — Conceitual | Frameworks, conceitos gerais | Sobreposição temática |
Uso
# Camada 1 — verificação automatizada source .venv/bin/activate python -m tools verify-claims "Projeto/capitulo.md" --project "Projeto" # Camada 2 — revisão interativa via skill /verify-claims "Projeto/capitulo.md" --project "Projeto"
Outputs
- •
<arquivo>.claims-report.md— relatório legível com claims agrupados por risco - •
<arquivo>.claims-data.json— dados estruturados para atualização pela Camada 2
Detalhes técnicos
- •Hierarquia de resolução: pipeline/refs → PMC full text → PubMed abstract → CrossRef abstract
- •Cache em
.refs-cache.json(reutilizado entre execuções) - •Variantes numéricas PT↔EN (vírgula decimal, mil/billion, moeda)
- •Detecção de erros matemáticos (valores absolutos + percentagem derivada)
- •Skill interativa:
~/escrita/skills/pesquisa-academica/verify-claims.md
4.5 Facts Registry (camada preventiva)
Status: Operacional
Relação entre as camadas
| Camada | Ferramenta | Quando | O que faz |
|---|---|---|---|
| Preventiva | extract-facts + Facts Registry | ANTES de escrever | Extrai fatos verificados das refs → .facts-registry.json |
| Corretiva | verify-claims | DEPOIS de escrever | Verifica se afirmações do texto são suportadas pelas refs → .claims-data.json |
facts-crosscheck: ponte entre as camadas
O facts-crosscheck conecta as duas camadas:
python -m tools facts-crosscheck "Projeto"
Cruza os dados quantitativos do .claims-data.json (output do verify-claims) com o .facts-registry.json. Identifica dados usados no texto que NÃO foram registrados previamente no Facts Registry.
Quando usar cada ferramenta
| Situação | Ferramenta |
|---|---|
| Vou começar a escrever uma seção | extract-facts → registrar dados antes |
| Terminei de escrever, quero verificar | verify-claims → verificar depois |
| Quero ver se todos os dados usados estão registrados | facts-crosscheck → cruzar |
| Vou citar um número no texto | Consultar facts-status --section X |
Referência
Skill completa: ~/escrita/skills/pesquisa-academica/extract-facts.md
5. Formato de armazenamento — .bib + Pandoc
Decisão (2026-02-18)
O formato de armazenamento é .bib (BibTeX), gerado automaticamente pelo pipeline como subproduto da verificação via CrossRef.
Abordagem em camadas (não excludentes):
| Camada | O que | Status |
|---|---|---|
| Camada 1 — Output do pipeline | .bib por projeto, gerado automaticamente pela etapa 9 do pipeline. Pandoc + CSL para ABNT/Vancouver. | Implementado (MVP) |
| Camada 2 — Rastreamento no Index | Extensão da tabela contextos do acervo.db para registrar DOI/PMID. | Planejado |
| Camada 3 — Zotero + Better BibTeX | Importar .bib dos projetos para Zotero se/quando necessário. | Futuro/opcional |
Geração de .bib
O pipeline gera refs.bib automaticamente na etapa 9 (s09_synthesize.py). Cada referência verificada contém metadados completos (título, autores, ano, DOI, journal, volume, issue, páginas) obtidos do CrossRef.
# Gerar .bib do projeto python -m tools export "Projeto" --format bib # Output: ~/escrita/Projeto/pipeline/refs.bib
Uso com Pandoc + CSL
Para converter Markdown com citações para Word/PDF com referências formatadas:
# Vancouver (padrão médico) pandoc capitulo16.md --citeproc --bibliography pipeline/refs.bib \ --csl vancouver.csl -o capitulo16.docx # ABNT pandoc artigo.md --citeproc --bibliography pipeline/refs.bib \ --csl abnt.csl -o artigo.docx
CSL files: baixar de https://www.zotero.org/styles
Verificação automatizada
O pipeline inclui verificação na etapa 10 (s10_validate.py):
- •Re-verificar DOIs e URLs das referências finais
- •Checar consistência das grades
- •Relatório de problemas encontrados
python -m tools run "Projeto" --from-stage 10
6. Experiência acumulada
Caso Atheneu (Capítulo 16, 2025-2026)
- •Estilo: Vancouver adaptado ao Manual do Autor Atheneu
- •Referências incluem: artigos de periódico, relatórios de consultorias, legislação brasileira, sites institucionais
- •Formato registrado no
SKILL.mddo projeto - •Auditoria realizada em 2026-02-18: 10 referências verificadas. Achados principais:
- •1 referência inválida (possível alucinação de IA) — removida/substituída
- •1 URL quebrada (site governamental) — corrigida
- •1 dado sem fonte adequada ("80% não estruturados") — fonte complementar adicionada
- •Relatório completo:
~/escrita/Livro Editora Atheneu/relatorio-auditoria-referencias.md
- •Lição aprendida: Referências de modelos de linguagem devem ser verificadas individualmente. O Deep Research do scite.ai produziu referências tangenciais de baixa utilidade.