AgentSkillsCN

pesquisa-academica

以研究为基础的模式:搭建经过验证的参考文献库,为写作提供支撑(章节、文章、教学文本)。这是一项中间成果,而非最终成品。在 ~/escrita/tools/ 中使用自动化流程。

SKILL.md
--- frontmatter
name: pesquisa-academica
description: "Modalidade pesquisa-base: montar base de referências verificadas para subsidiar escrita (capítulo, artigo, texto didático). Produto intermediário, não final. Usa o pipeline automatizado em ~/escrita/tools/."
status: ativa
version: 2.1
date: 2026-02-19
modality: pesquisa-base
evidence: Validado pela auditoria de 288 referências do Cap. 16 Atheneu. Pipeline v2 corrige triagem, queries e outputs.

Pesquisa Acadêmica — Modalidade "pesquisa-base"

Propósito

Montar uma base de referências verificadas como ponto de partida para o desenvolvimento de um texto acadêmico. O produto desta skill é intermediário — o texto final será outra coisa (capítulo, artigo, relatório).

Codificar um workflow padronizado de pesquisa de literatura que seja:

  • Sistemático — bases definidas, palavras-chave documentadas, critérios explícitos
  • Auditável — qualquer pessoa consegue reproduzir a busca
  • Eficiente — automatizado via pipeline Python (python -m tools)
  • Resistente a alucinações — toda referência verificada antes de uso (princípio "zero trust")

Premissa fundamental (validada pela auditoria de 288 refs, Cap. 16): ferramentas de IA generativa são úteis para mapeamento conceitual e descoberta de fontes, mas nunca devem ser a fonte final de referências.

Quando usar esta skill: capítulo de livro-texto, artigo original (introdução/discussão), material didático, relatório técnico.

Quando usar revisao-literatura: quando a revisão É o produto final (integrativa, sistemática, de escopo).

Pipeline automatizado

A partir da v2.0, esta skill é orquestrada pelo pipeline em ~/escrita/tools/.

bash
# 1. Criar scope.yaml para o projeto
python -m tools scope "Projeto" --init --modality pesquisa-base

# 2. Editar scope.yaml com keywords, research_axes, exclusion_keywords, etc.

# 3. (Opcional) Extrair seed refs de textos existentes
python -m tools seed "Projeto"

# 4. Executar pipeline completo (10 etapas + extração + brief)
python -m tools run "Projeto"

# 5. Verificar resultado
python -m tools status "Projeto"

# 6. Revisar validation-list.md (~5-10 min)
# 7. Obter artigos não-OA listados em to-obtain.md
# 8. Processar PDFs manuais
python -m tools extract-manual "Projeto"

# 9. Enriquecer refs com resumos Claude
# (via Claude Code interativo — /enrich-refs)

Documentação completa: ~/escrita/tools/README.md

O pipeline automatiza as etapas 2-6 abaixo. As etapas 1 (delimitação humana) e os prompts de IA assistida permanecem como instruções nesta skill.

Perguntas estruturadas para o scope.yaml

Ao iniciar um novo projeto, o pipeline deve coletar:

  1. Pergunta de pesquisa — qual o tema central?
  2. Eixos de pesquisa — quais os subtemas/dimensões? (min. 3, max. 8)
  3. Keywords por eixo — termos de busca + sinônimos
  4. Exclusões explícitas — temas que NÃO devem aparecer (cobertos em outros capítulos, fora do escopo)
  5. Acesso institucional — Tem acesso Capes, ProBE ou assinatura direta? Artigos indispensáveis não-OA serão listados para você providenciar.
  6. Meta de refs — quantas referências no output final? (default: 40 para pesquisa-base)

1. Visão geral do pipeline

code
┌─────────────────────────────────────────────────────────────┐
│  ENTRADA: Tema / pergunta de pesquisa / seção a escrever    │
└──────────────────────────┬──────────────────────────────────┘
                           │
                    ┌──────▼──────┐
                    │  ETAPA 1    │  Delimitação
                    │  Escopo     │  Pergunta → Palavras-chave → Limites
                    └──────┬──────┘
                           │
              ┌────────────┼────────────────┐
              │            │                │
       ┌──────▼──────┐ ┌──▼──────────┐ ┌───▼─────────┐
       │  ETAPA 2a   │ │  ETAPA 2b   │ │  ETAPA 2c   │
       │  Bases      │ │  Fontes     │ │  IA assist.  │
       │  indexadas   │ │  instit.    │ │  (descoberta)│
       │  (primária)  │ │  e cinza    │ │  NÃO citação │
       └──────┬──────┘ └──────┬──────┘ └──────┬───────┘
              │               │               │
              └───────────────┼───────────────┘
                              │
                       ┌──────▼──────┐
                       │  ETAPA 3    │  Triagem
                       │  Avaliação  │  Tier + Relevância + Acessibilidade
                       │  de qualid. │  → Gold / Silver / Bronze / Descartar
                       └──────┬──────┘
                              │
                       ┌──────▼──────┐
                       │  ETAPA 4    │  Verificação
                       │  Checklist  │  Checklist 3.1 da skill referências
                       │  por ref    │  + verificação de dados quantitativos
                       └──────┬──────┘
                              │
                       ┌──────▼──────┐
                       │  ETAPA 5    │  Contestação
                       │  scite.ai   │  Para afirmações centrais:
                       │  (opcional)  │  supporting / contrasting / mentioning
                       └──────┬──────┘
                              │
                       ┌──────▼──────┐
                       │  ETAPA 6    │  Registro
                       │  Documentar │  notas_pesquisa.md + Zotero (se usar)
                       └─────────────┘

2. Etapa 1 — Delimitação do escopo

2.1 Prompt-template de delimitação

Usar este template para definir a pesquisa antes de ir às bases. Preencher para cada seção ou subtema:

markdown
## Ficha de pesquisa — [seção/tema]

**Pergunta de pesquisa:**
[Ex: "Quais são as aplicações de Big Data na gestão hospitalar para otimização de leitos?"]

**Palavras-chave (PT):** [Ex: big data, gestão hospitalar, leitos, otimização, saúde]
**Palavras-chave (EN):** [Ex: big data, hospital management, bed management, optimization, healthcare]
**Termos MeSH (se aplicável):** [Ex: "Big Data"[MeSH], "Hospital Administration"[MeSH], "Bed Occupancy"[MeSH]]

**Escopo — incluir:**
- [Ex: aplicações administrativas, gestão de leitos, fluxo de pacientes, eficiência operacional]

**Escopo — excluir:**
- [Ex: diagnóstico por imagem, telemedicina, wearables, aplicações puramente clínicas]

**Período:** [Ex: 2020-2026]
**Idiomas:** [Ex: português, inglês, espanhol]
**Tipo de fontes prioritárias:** [Ex: revisão sistemática, estudo de caso, relatório institucional]

**Contexto geográfico prioritário:** [Ex: Brasil > América Latina > global]

2.2 Estratégia de palavras-chave

Montar 3 blocos combináveis com operadores booleanos:

BlocoConceitoTermos (OR entre si)
ATecnologiabig data OR artificial intelligence OR machine learning OR analytics
BDomíniohealthcare management OR hospital administration OR health system
CAplicaçãobed management OR resource allocation OR fraud detection OR cost reduction

String de busca: (Bloco A) AND (Bloco B) AND (Bloco C)

Adaptar para cada base (PubMed usa MeSH; SciELO aceita português; Google Scholar aceita linguagem natural).


3. Etapa 2 — Busca em três trilhas paralelas

3.1 Trilha A — Bases indexadas (PRIMÁRIA)

Esta é a trilha principal. Todas as demais são complementares.

Bases de consenso e como buscar

BaseO que encontrarComo buscarAcesso
PubMed / PMCArtigos biomédicos revisados por paresString com MeSH terms + filtros de data e tipoGratuito
SciELO BrasilArtigos brasileiros e latino-americanosBusca em português + filtros por periódico e áreaGratuito
Google ScholarCobertura ampla (periódicos + teses + grey lit)Linguagem natural + filtro temporalGratuito
Scopus / Web of ScienceMétricas de impacto, artigos indexadosString booleana + filtrosVia CAPES (institucional)
Portal CAPES PeriódicosAcesso a paywalled (Elsevier, Springer, etc.)Via proxy institucionalInstitucional
LILACSLiteratura latino-americana em saúdeDescritores DeCS + filtrosGratuito (BVS)
Semantic ScholarIA-powered; API gratuita; citation contextBusca semântica + filtrosGratuito + API

Strings de busca pré-formatadas por base

PubMed:

code
("Big Data"[MeSH] OR "Artificial Intelligence"[MeSH] OR "Machine Learning"[MeSH])
AND ("Hospital Administration"[MeSH] OR "Health Services Administration"[MeSH])
AND ("2020"[PDAT] : "2026"[PDAT])

SciELO:

code
(big data OR inteligência artificial OR aprendizado de máquina)
AND (gestão hospitalar OR administração em saúde OR gestão em saúde)

Google Scholar:

code
"big data" OR "artificial intelligence" "healthcare management" OR "hospital management"

(Usar aspas para frases exatas; filtrar por ano na interface)

Semantic Scholar API (gratuita, até 100 resultados):

code
GET https://api.semanticscholar.org/graph/v1/paper/search
  ?query=big+data+healthcare+management
  &year=2020-2026
  &fieldsOfStudy=Medicine
  &fields=title,authors,year,citationCount,journal,externalIds,abstract
  &limit=50

Como usar o Claude para buscar

O Claude pode executar buscas via web_search e web_fetch nas bases de acesso aberto. Para cada base:

  1. PubMed: buscar site:pubmed.ncbi.nlm.nih.gov [termos] ou construir URL direta da API E-utilities
  2. SciELO: buscar site:scielo.br [termos em português]
  3. Google Scholar: buscar site:scholar.google.com [termos] (limitado — Scholar bloqueia scraping)
  4. PMC: buscar site:ncbi.nlm.nih.gov/pmc [termos]

Preferência de busca do Claude: PubMed > PMC > SciELO > Scholar > web geral

Para cada resultado encontrado, extrair imediatamente:

  • DOI (prioritário — âncora mais estável)
  • PMID (se PubMed/PMC)
  • Título completo
  • Autores
  • Periódico, volume, issue, páginas, ano
  • URL canônica (não URL de download/PDF)

3.2 Trilha B — Fontes institucionais e literatura cinza

TipoFontesO que buscar
Governo BRDATASUS, ANS, RNDS, Ministério da SaúdePortarias, notas técnicas, relatórios, dados
LegislaçãoPlanalto, Câmara, Senado, LexMLDecretos, leis, regulamentos
Organismos internacionaisOMS, OPAS, OECD, World BankRelatórios, posicionamentos, guidelines
Associações setoriaisANAHP, CFM, SBIS, HIMSSEbooks, pesquisas, posicionamentos
Dados de pesquisa BRCETIC.br (TIC Saúde), IBGE, IPEASurveys nacionais, indicadores
Relatórios de mercadoPwC, Deloitte, McKinsey, Straits, Grand ViewTamanho de mercado, tendências

Regra: relatórios de consultorias (PwC, McKinsey) são Tier 3. Citá-los como "relatório de mercado" ou "relatório técnico", nunca como evidência científica primária.

Atenção especial — URLs governamentais BR: alta taxa de link rot. Sempre:

  • Registrar URL completa + data de acesso
  • Copiar trecho relevante no notas_pesquisa.md
  • Buscar URL alternativa (LexML para legislação; BVS para Ministério da Saúde)

3.3 Trilha C — IA assistida (SOMENTE DESCOBERTA)

REGRA FUNDAMENTAL: Nenhuma referência da Trilha C entra no texto sem passar pela Trilha A ou B para verificação.

O que a IA faz bem (validado pela auditoria)

UsoFerramenta recomendadaProduto esperado
Mapear o ecossistema de um temaGemini, ChatGPTLista de subtemas, atores, terminologia
Descobrir fontes institucionais BRGeminiNomes de bases, relatórios, associações
Curadoria editorial (quais 10 fontes importam?)ChatGPTLista priorizada com justificativa
Triagem em volume de URLsPerplexityLista de URLs para inspecionar
Verificar se citação é apoiada/contestadascite.aiSupporting / contrasting / mentioning

O que a IA faz MAL (validado pela auditoria)

Anti-padrãoEvidência
Gerar lista de referências para citar diretamente49,8% off-topic; 13,5% inverificáveis
Fornecer metadados bibliográficos (autores, vol, pag)Caso Aldoseri — fabricação completa
Fornecer dados quantitativos sem URL"HC-SP reduziu 40%" — inverificável
Substituir busca em bases indexadasscite.ai: 45,8% refs sobre resíduos hospitalares

Prompt-template para IA assistida (descoberta, NÃO citação)

markdown
## Prompt para mapeamento conceitual

Estou pesquisando sobre [TEMA] para um [TIPO DE DOCUMENTO: capítulo de livro / artigo / relatório].

**Escopo:** [incluir / excluir]

**Preciso que você:**
1. Liste os 5-8 subtemas principais que este tema abrange
2. Identifique as bases de dados e fontes institucionais mais relevantes para cada subtema
3. Sugira termos de busca (em português E inglês) para cada subtema
4. Liste 5-10 referências-chave que estruturam o campo — para CADA uma, forneça:
   - Autores completos
   - Título exato
   - Periódico/editora
   - Ano
   - DOI (obrigatório se existir)
   - URL (obrigatória)
5. Identifique lacunas: que subtemas têm pouca literatura recente?

**REGRAS:**
- NÃO invente referências. Se não tiver certeza de um DOI ou URL, diga explicitamente.
- Priorize fontes recentes (2020+) e brasileiras quando disponíveis.
- Para dados quantitativos, indique a fonte primária exata (não "estima-se que...").
- Separe claramente: (a) artigos de periódicos indexados, (b) fontes institucionais, (c) relatórios de mercado, (d) fontes informais.

**Contexto geográfico:** [Brasil / América Latina / Global]

Pós-processamento obrigatório: toda referência sugerida pela IA entra na Etapa 3 (avaliação) e Etapa 4 (verificação) antes de qualquer uso.


4. Etapa 3 — Avaliação de qualidade (triagem)

4.1 Critérios de avaliação

Cada referência candidata recebe três scores independentes:

Tier de qualidade (domínio/fonte)

TierDefiniçãoExemplosPeso
T1Periódico revisado por pares, indexadoPubMed, SciELO, Scopus, IEEE★★★
T2Fonte institucional de referênciaOMS, DATASUS, ANS, CETIC.br, HIMSS★★★
T3Relatório técnico / especializadoPwC, McKinsey, Deloitte, ANAHP★★☆
T4Notícia, blog, site corporativoCarefy, TopSaúde, YouTube, sites pessoais★☆☆

Regra para o texto acadêmico: T1 e T2 são citáveis sem ressalvas. T3 é citável como "relatório técnico" com nota de contexto. T4 não é citável como referência bibliográfica — usar apenas como pista para encontrar a fonte primária.

Relevância para o tema

ScoreDefiniçãoCritério
2Diretamente relevanteO assunto principal do artigo/documento coincide com o escopo da pesquisa
1TangencialO artigo toca no tema mas o foco é outro (ex: saúde digital em geral, regulação ampla)
0Off-topicSem relação com o escopo definido na Etapa 1

Acessibilidade

StatusDefinição
AcessívelURL/DOI retorna conteúdo legível (HTTP 200 ou acesso via navegador)
RestritoPaywall ou bloqueio de bot, mas artigo existe (acessível via CAPES ou navegador)
Quebrado404 ou timeout persistente — URL inválida
Sem URLReferência sem link verificável — exige busca manual

4.2 Classificação composta

ClassificaçãoCritérioAção
🥇 GoldT1 ou T2 + relevância 2 + acessívelUsar prioritariamente
🥈 SilverT1/T2 + relevância 1 + acessível, OU T3 + relevância 2 + acessívelUsar se necessário; contextualizar
🥉 BronzeT3 + relevância 1, OU qualquer tier + restritoReserva; buscar alternativa melhor
❌ DescartarRelevância 0, OU T4, OU sem URL inverificável, OU quebradoNão usar

4.3 Meta de composição para um texto acadêmico

Tier% ideal do total de referências
T1 (periódicos)≥ 50%
T2 (institucional)15-25%
T3 (relatórios técnicos)10-20%
T4 (informal)0%

Se a distribuição final tiver < 50% de T1, voltar à Trilha A e buscar mais artigos em bases indexadas.


5. Etapa 4 — Verificação individual

Executar o Checklist 3.1 da skill referencias-e-citacoes (~/escrita/skills/referencias-e-citacoes/SKILL.md) para cada referência que passou pela triagem.

5.1 Checklist resumido (referência cruzada)

#VerificaçãoObrigatório?
1URL/DOI acessível?Sim
2Conteúdo corrobora a afirmação?Sim
3Formato correto (estilo do projeto)?Sim
4Procedência documentada em notas_pesquisa.md?Sim
5Autores verificados na fonte primária?Sim
6Metadados conferidos (vol, issue, pag, ano)?Sim

5.2 Verificação reforçada para dados quantitativos

Para qualquer afirmação com número específico (ex: "redução de 40%", "mercado de US$ 50 bi"):

  1. Acessar a URL/DOI da fonte
  2. Localizar o número exato no texto da fonte (Ctrl+F)
  3. Se o número não estiver lá: descartar a afirmação ou buscar fonte que a contenha
  4. Registrar no notas_pesquisa.md: "Dado X confirmado em [fonte], parágrafo/página Y"

Motivação (caso real): "80% dos dados clínicos são não estruturados" foi atribuído a Dash et al. (2019), mas o artigo não contém esse número. O dado é amplamente repetido na literatura sem fonte primária clara.

5.3 Verificação reforçada para referências sugeridas por IA

Protocolo completo documentado em ~/escrita/skills/referencias-e-citacoes/SKILL.md, seção 3.2.

Resumo: verificar existência via DOI → confirmar autores no site do periódico → conferir metadados → localizar dados quantitativos na fonte.


6. Etapa 5 — Verificação de contestação (scite.ai)

6.1 Quando usar

  • Para afirmações centrais do texto (as que sustentam argumentos-chave)
  • Para dados quantitativos que parecem surpreendentes ou contraintuitivos
  • Para verificar se uma referência é amplamente apoiada ou contestada pela literatura

6.2 Como usar corretamente

O scite.ai NÃO é um buscador de referências (auditoria: 45,8% off-topic quando usado assim). Seu uso correto é:

  1. Inserir o DOI ou título exato de um artigo específico
  2. Verificar o citation context: quantas citações são supporting, contrasting, mentioning
  3. Se > 20% das citações forem contrasting: investigar as objeções antes de citar

6.3 Alternativas gratuitas para verificação de contestação

FerramentaComo usarLimitações
Google Scholar — "Citado por"Ver quem citou o artigo; ler abstracts dos citantesNão classifica supporting/contrasting
Semantic Scholar — Citation ContextAPI gratuita retorna citation intents (background, method, result)Classificação menos granular que scite.ai
Connected PapersVisualizar cluster de artigos relacionadosNão mostra contestação direta
PubMed — Related ArticlesArtigos similares por algoritmo NLMNão mostra contestação

7. Etapa 6 — Registro e documentação

7.1 Formato de registro em notas_pesquisa.md

Para cada referência verificada, registrar:

markdown
### Ref [N] — Sobrenome et al. (Ano)

- **Título:** [título completo]
- **Periódico:** [nome abreviado], v.X, n.Y, p.Z-W, ano
- **DOI:** [se existir]
- **PMID:** [se PubMed]
- **URL:** [URL canônica, não URL de download]
- **Tier:** T1 / T2 / T3
- **Relevância:** 2 / 1
- **Classificação:** Gold / Silver / Bronze
- **Data de verificação:** [data]
- **Dados sustentados:** [lista de afirmações que esta ref sustenta]
- **Verificação de dados quantitativos:** [número X confirmado no parágrafo Y / não encontrado]
- **Origem da descoberta:** [PubMed / SciELO / Gemini(descoberta) / etc.]

7.2 Tabela de controle de referências

Manter uma tabela resumo no topo do notas_pesquisa.md de cada seção:

markdown
| # | Autor(es) | Ano | Tier | Relev. | Class. | DOI | Status |
|---|---|---|---|---|---|---|---|
| 1 | Straits Research | 2024 | T3 | 2 | Silver | — | Verificada |
| 2 | Dash et al. | 2019 | T1 | 2 | Gold | 10.1186/s40537-019-0217-0 | Verificada |

8. Prompt-template completo para pesquisa de uma seção

Este é o prompt reutilizável para iniciar a pesquisa de qualquer seção de qualquer projeto. Copiar, preencher os campos entre [colchetes] e executar:

markdown
## Pesquisa para [SEÇÃO/TEMA]

**Projeto:** [nome do projeto]
**Seção:** [ex: 16.3 — Aplicações na gestão hospitalar]
**Arquivo canônico:** [ex: capitulo16.md]
**Notas de pesquisa:** [ex: notas_pesquisa.md]
**Próxima referência:** [N]
**Estilo de citação:** [ex: Vancouver — ver SKILL.md do projeto]

### Escopo da seção
[Descrever o que a seção deve cobrir e o que está FORA do escopo]

### Afirmações que precisam de referência
1. [Afirmação 1 — ex: "IA reduz tempo médio de permanência hospitalar"]
2. [Afirmação 2 — ex: "Operadoras usam ML para detecção de fraudes"]
3. [Afirmação N]

### Instruções para o Claude

**Fase 1 — Busca primária (Trilha A):**
Para cada afirmação acima, buscar em PubMed, SciELO e Google Scholar:
- Priorizar revisões sistemáticas e meta-análises
- Depois estudos observacionais e de caso
- Filtrar: 2020-2026, português e inglês
- Para cada resultado: extrair DOI, autores, título, periódico, ano

**Fase 2 — Fontes institucionais (Trilha B):**
Buscar fontes brasileiras primárias:
- CETIC.br, DATASUS, ANS, ANAHP, SBIS para dados nacionais
- OMS, OPAS para dados e diretrizes internacionais
- Relatórios de mercado se necessário (citar como T3)

**Fase 3 — Avaliação:**
Para cada referência encontrada, classificar:
- Tier (T1/T2/T3/T4)
- Relevância (0/1/2)
- Acessibilidade (acessível/restrito/quebrado)
- Classificação composta (Gold/Silver/Bronze/Descartar)

**Fase 4 — Verificação:**
Para as referências Gold e Silver:
- Acessar a URL/DOI e confirmar que o conteúdo sustenta a afirmação
- Para dados quantitativos: localizar o número exato na fonte
- Registrar tudo em notas_pesquisa.md

**Formato de saída:**
Apresentar as referências em tabela com: #, Autores, Ano, Título, Periódico, DOI, Tier, Relevância, Classificação, Afirmação(ões) sustentada(s).
Depois, bloco formatado no estilo [Vancouver/ABNT/outro] para inserção direta.

9. Modos de operação por tipo de projeto

O rigor do pipeline varia conforme o tipo de produção:

9.1 Capítulo de livro-texto (ex: Atheneu)

AspectoConfiguração
Trilha A (bases indexadas)Obrigatória — ≥ 50% das refs
Trilha B (institucional)Obrigatória — fontes BR e internacionais
Trilha C (IA assistida)Opcional — para mapeamento inicial
Etapa 3 (triagem)Gold + Silver apenas
Etapa 4 (verificação)Checklist completo para todas
Etapa 5 (scite.ai)Para afirmações centrais
Meta de refs15-30 refs por capítulo
% T1 mínimo50%

9.2 Artigo científico / revisão

AspectoConfiguração
Trilha AObrigatória — protocolo PRISMA se revisão sistemática
Trilha BConforme tema
Trilha CPara mapeamento; documentar no método
Etapa 3Gold apenas; Silver com justificativa
Etapa 4Checklist completo + verificação cruzada
Etapa 5Obrigatória para afirmações quantitativas
Meta de refsVariável (30-100+ para revisão)
% T1 mínimo80%

9.3 Relatório técnico / texto para aula

AspectoConfiguração
Trilha ARecomendada — pelo menos refs-chave
Trilha BObrigatória (fontes primárias do tema)
Trilha CLivre — com verificação básica
Etapa 3Gold + Silver + Bronze aceitáveis
Etapa 4Checklist simplificado (URL + autores + conteúdo)
Etapa 5Opcional
Meta de refs5-15
% T1 mínimo30%

10. Ferramentas recomendadas por etapa

EtapaFerramenta gratuitaFerramenta pagaObservação
1. DelimitaçãoClaude (este prompt)Template acima
2a. Bases indexadasPubMed, SciELO, Scholar, Semantic ScholarScopus, Web of Science (CAPES)Trilha principal
2b. InstitucionaisCETIC.br, DATASUS, ANS, OMSGratuitas e de alta qualidade
2c. IA assistidaClaude (web_search), Perplexity freePerplexity Pro, ChatGPT Plus, Gemini AdvancedSó para descoberta
3. TriagemPlanilha manual ou tabela em notas_pesquisa.mdCritérios seção 4
4. Verificaçãoweb_fetch (Claude), navegadorChecklist seção 5
5. ContestaçãoGoogle Scholar "Citado por", Semantic Scholarscite.ai (~$20/mês)Para afirmações centrais
6. Registronotas_pesquisa.mdZoteroDOI > URL permanente > URL temporária
Verificação de linksScript check_refs.py (Atheneu)Reutilizável entre projetos

11. Anti-padrões a evitar

Validados pela auditoria de 251 referências (Cap. 16 Atheneu, 2026-02-18):

#Anti-padrãoConsequênciaEvidência
1Usar deep research para gerar lista final de referênciasRefs off-topic (49,8%), sem metadados, risco de alucinaçãoAuditoria completa
2Inserir dados quantitativos sem URL/DOI verificávelAfirmações inverificáveis; possível alucinaçãoChatGPT "HC-SP -40%", Gemini "R$ 2 mi"
3Citar blogs/sites corporativos como referências acadêmicasBaixo rigor; inaceitável em livro-textoGemini: 35,7% Tier 4
4Usar scite.ai como buscador de temaRefs off-topic dominantes (resíduos hospitalares, geriatria)scite.ai: 45,8% off-topic
5Não verificar URL/DOI antes de inserirLink rot, 404, URLs dinâmicasRef [5] ANS quebrada
6Confiar em metadados bibliográficos fornecidos por IAAutores fabricados, DOIs inventadosRef [7] Aldoseri — fabricação completa
7Atribuir dados operacionais a documentos normativosDecreto não contém estatísticas de usoRef [4] Decreto 12.560
8Repetir estatísticas amplamente citadas sem rastrear a fonte primáriaDado sem fonte real; viés de repetição"80% não estruturados" (Dash et al. não contém)

11.5 Extract Facts — camada preventiva

Após coletar referências (Etapas 2-6) e antes de escrever, usar o /extract-facts para extrair fatos verificados das refs para o Facts Registry. Isso previne erros de dados fabricados, valores incorretos e derivações matemáticas erradas.

Skill completa: ~/escrita/skills/pesquisa-academica/extract-facts.md

Uso rápido:

bash
python -m tools extract-facts "Projeto" --refs 11-17   # Extrair candidatos
# Claude revisa e escreve .facts-pending.jsonl
python -m tools facts-import "Projeto"                  # Validar e importar
python -m tools facts-status "Projeto" --section 16.3   # Brief para escrita

12. Questões em aberto (roadmap)

  • Integração com Index (~/Index/) para buscar materiais já no acervo pessoal
  • Script de busca automatizada em PubMed via E-utilities API
  • Template de fichamento por artigo (para revisões mais extensas)
  • Integração com Zotero via Better BibTeX
  • Fluxograma PRISMA simplificado para revisões narrativas
  • Avaliar Semantic Scholar API para triagem automatizada (citation count, fields of study, citation intents)