Yo trabajo con esto del BigData, creo. No lo tengo claro porque a veces me pierdo en la terminología y las fronteras no están claras. Pero no tengo formación reglada, la vida te va llevando por aquí.
Yo lo uso en ciberseguridad: indexación de eventos de miles de máquinas y el contenido de documentos para hacer búsquedas respetando la GDPR, precisamente. Puedes hacer pruebas con solr, wazuh o si te va la marcha diseñar un sistema con tika+elasticsearch para indexar todo el contenido de tu disco duro, que es como empecé yo, pero con el disco duro de las investigaciones que llevaba. Si tienes euros para quemar, conecta BigQuery a los datos del instituto nacional de estadística y ponte a hacer pruebas.
No sé bien qué quieres así que ni idea de si puedo comentar algo de ayuda.
"Todo es absolutamente falso, salvo alguna cosa"
Marcadores