Extractor de Documentos
Extrae texto y tablas de PDF y DOCX nativos. Sin IA, sin alucinaciones, precisión determinista al 100%. 1 crédito/página.
Sube tus PDFs y Words. Recibe un Excel con los campos exactos que necesitas. Procesado en nuestro servidor, nunca en la nube de terceros.
Copiar campos de un PDF a Excel. Uno a uno. Con riesgo de error en cada fila.
Cada módulo resuelve un problema concreto de extracción de datos.
Extrae texto y tablas de PDF y DOCX nativos. Sin IA, sin alucinaciones, precisión determinista al 100%. 1 crédito/página.
Sube 3+ documentos idénticos y extrae automáticamente fechas, importes, porcentajes e IDs en columnas. 1 crédito/página.
Procesa documentos escaneados, fotografías e imágenes con Gemini. Texto + datos estructurados en una sola llamada. 3 créditos/página.
Extrae campos específicos de facturas, nóminas, contratos y extractos bancarios con IA. Output JSON estructurado. 3 créditos/página.
Drag & drop o selección de carpeta completa. PDF, DOCX, en batch. Hasta 500 archivos por job.
Extracción de texto y tablas, seccionar datos entre documentos, o extracción con IA. El sistema calcula el coste antes de procesar.
Excel, JSON o CSV listos para usar. Con columna de origen por fila y trazabilidad completa.
Simulación del flujo de extracción con facturas de ejemplo.
| NIF | Fecha | Proveedor | Base | IVA | Total |
|---|---|---|---|---|---|
| B12345678 | 15/01/2024 | Suministros Iberia SL | 1.028,00 € | 21% | 1.243,88 € |
| A98765432 | 22/01/2024 | Tech Solutions Spain SA | 735,50 € | 21% | 890,00 € |
| B55544433 | 03/02/2024 | Distribuciones Levante SL | 2.150,00 € | 21% | 2.601,50 € |
| A12398765 | 10/02/2024 | Servicios Digitales SL | 480,00 € | 21% | 580,80 € |
Un contrato de 200 páginas no cuesta lo mismo que una factura de 2. Aquí pagas por lo que realmente procesas.
Para probar idpura. 0€ para siempre.
Para freelancers y pequeñas empresas.
Para gestorías, despachos y equipos.
Para empresas con volumen.
Para grandes organizaciones. SLA y soporte dedicado.
Los créditos se renuevan cada mes según tu plan
¿Cuánto cuesta cada herramienta?
| Herramienta | Créditos por página |
|---|---|
| Extractor de Documentos (texto + tablas) | 1 cr / pág |
| Seccionar Datos (varianza multi-doc) | 1 cr / pág |
| OCR con IA (escaneados e imágenes) | 3 cr / pág |
| Extractor IA (campos estructurados) | 3 cr / pág |
Sin AWS. Sin GCP. Sin Azure. Servidor dedicado en Alemania.
Hetzner Falkenstein, Frankfurt. Tus archivos nunca pasan por servicios cloud de terceros. Procesamiento 100% en hardware dedicado bajo jurisdicción alemana.
idpura procesa tus archivos y los elimina inmediatamente del servidor. No almacenamos tus documentos originales bajo ninguna circunstancia. Los resultados de la extracción están disponibles durante 24 horas para que los descargues, y después se eliminan automáticamente. Solo conservamos tu historial de uso (créditos consumidos, fechas y herramientas utilizadas) para que puedas consultarlo en tu dashboard.
Arquitectura diseñada para cumplir GDPR. Próximamente: Clerk Organizations para gestión de equipos con control de acceso por organización.
Actualmente: PDF (nativos y digitales) y DOCX (Word 2007 en adelante). Los archivos .doc (Word 97-2003) no están soportados. Próximamente: OCR con IA para documentos escaneados e imágenes, y Extractor IA para campos estructurados.
Un crédito equivale a una unidad de procesamiento. Las herramientas básicas (Extractor de Documentos, Seccionar Datos) consumen 1 crédito por página. Las herramientas con IA (OCR, Extractor IA) consumen 3 créditos por página. El sistema te muestra el coste exacto antes de confirmar el procesamiento.
Sí. Todo el procesamiento ocurre en un VPS dedicado en Alemania (Hetzner). Tus archivos nunca se envían a servicios cloud de terceros. Se eliminan automáticamente 24 horas después del procesamiento. La comunicación es siempre por HTTPS con certificado SSL.
Actualmente es una herramienta individual. El soporte de equipos multi-usuario está en el roadmap para Q4 2026, con roles, créditos compartidos y control de acceso por organización.
Próximamente. El OCR con IA (3 créditos/página) procesará documentos escaneados, fotografías e imágenes usando Gemini. Actualmente solo se soportan PDFs nativos (digitales) y DOCX.
La API REST pública está en el roadmap para Q3-Q4 2026, disponible desde el plan Business. Incluirá API keys, documentación OpenAPI y webhooks. Si tienes un caso de uso urgente, contacta directamente.
Lo que ya está listo y lo que viene.
Texto + tablas de PDF y DOCX a Excel, JSON y CSV. Hasta 500 archivos por job.
Extracción automática de campos variables entre documentos idénticos.
Navegación completa en español e inglés.
Suscripciones mensuales y anuales con Stripe. Planes Starter, Pro, Business.
Comparativa detallada de planes, herramientas y tabla de créditos.
Términos de servicio, política de privacidad y cumplimiento GDPR.
Documentos escaneados e imágenes a datos estructurados con Gemini. 3 cr/pág.
Campos específicos de facturas, nóminas y contratos con IA. 3 cr/pág.
REST API con API keys, documentación OpenAPI y webhooks. Plan Business+.
Roles admin/miembro, créditos compartidos, control de acceso. Plan Pro+.
Sin suscripción mínima. Sin plantillas. Sin setup. Beta abierta.