Antes de comenzar a pensar en bases de datos, formatos de archivo o API, debe articular claramente:
* ¿Qué preguntas responderá esta fuente de datos? Esto dicta qué datos necesita recopilar.
* ¿Quién usará esta fuente de datos? Esto informa los requisitos de formato y accesibilidad.
* ¿Cuál es el volumen y la velocidad esperados de los datos? Esto le ayuda a elegir tecnologías apropiadas.
* ¿Cuáles son los requisitos de calidad de datos? La precisión, la integridad y la consistencia son cruciales.
* ¿Cuáles son las consideraciones de seguridad y privacidad? La gobernanza de datos es esencial desde el principio.
Sin un propósito y alcance bien definidos, corre el riesgo de construir una fuente de datos que sea ineficiente, inexacta y, en última instancia, inútil. Todo lo demás (opciones de tecnología, modelado de datos, etc.) debe fluir desde este paso inicial y crucial.