Documento interno de referência para construção e deploy do agente RAG com base documental de 70GB — fotos, PDFs, emails e processos judiciais.
Os 70GB chegam em 4 formatos distintos. Cada um exige extração diferente — usar a ferramenta errada compromete a qualidade do agente.
Cada ferramenta tem uma função específica. Nenhuma é substituível sem impacto no sistema.
Ordem que minimiza risco e permite uso parcial desde a semana 2.
Valores de referência para precificação e planejamento. O maior custo é o setup — a operação mensal é baixa.
Três passos para começar antes da próxima reunião com o Sergio.
Para cada etapa: nível de dificuldade técnica, quanto o Claude executa sozinho e o que precisa de nós.
Cada lacuna tem uma ferramenta ou processo específico. Nada fica descoberto.
Documentos periciais têm sigilo processual. A arquitetura foi escolhida exatamente para isso.
Dify e Qdrant rodam no Railway — servidor dedicado. Nenhum documento é enviado para OpenAI, Anthropic ou qualquer terceiro. Só os embeddings (números matemáticos, sem texto) são gerados externamente.
R2 (Cloudflare) criptografa todos os arquivos armazenados com AES-256. Todas as conexões são HTTPS/TLS 1.3. Qdrant e Railway têm rede privada interna sem exposição pública.
Autenticação com senha + 2FA no painel do Dify. Nenhuma URL pública expõe os documentos. O agente só é acessível com login — sem links compartilháveis.
R2 replica os originais automaticamente. Qdrant faz snapshot diário dos vetores. Railway persiste o banco de metadados. Recuperação total em caso de falha em menos de 1 hora.
Sim. Nenhum documento precisa ser inserido manualmente. O sistema monitora pastas e ingere automaticamente.