potencialmente permitido (con salvaguardas apropiadas y dependiendo del contexto):
* Datos agregados: Datos combinados de múltiples individuos, evitando la identificación de cualquier persona (por ejemplo, la edad promedio de los pacientes con cierta afección).
* Datos desidentificados con identificadores limitados: Los datos donde se mantienen algunos identificadores, pero su vinculación con un individuo específico es extremadamente difícil. Esta es un área gris y requiere una consideración cuidadosa. Los ejemplos podrían incluir:
* fechas (pero a menudo limitadas, por ejemplo, solo año, no fecha exacta): El año de nacimiento puede ser aceptable, pero no la fecha de nacimiento.
* Información geográfica (ampliamente definida): El estado de residencia puede estar permitido, el código postal probablemente no.
* rango de edad (amplio rango): "65-74 años" en lugar de "68 años".
* Datos seudonimizados: Datos donde los identificadores se reemplazan con seudónimos. Por lo general, se mantiene una clave para reidentificar a las personas, pero esta clave se mantiene segura separada y el acceso está restringido.
* Datos derivados de otros datos: Información que se deriva estadísticamente de los datos originales, pero no identifica directamente a las personas (por ejemplo, correlaciones entre variables).
generalmente no permitido:
* Identificadores directos: Estas son cosas que identifican directamente a un individuo, como:
* Nombre completo
* Número de seguro social
* Número de registro médico
* Datos de geolocalización precisos
* Dirección de correo electrónico
* Número de teléfono
* Dirección IP (a menos que sea muy anonimizado)
* Identificadores biométricos (huellas digitales, escaneos faciales)
* cuasi identificadores: La información que, cuando se combina con otra información, podría usarse para identificar a un individuo. Si bien individualmente es inocuo, una combinación podría ser un riesgo (por ejemplo, edad, género, código postal, condición específica). El riesgo se evalúa en función del potencial de reidentificación.
Consideraciones clave:
* Riesgo de reidentificación: El aspecto más crucial es el potencial para reidentificar a las personas de los datos. Las regulaciones a menudo requieren evaluaciones de este riesgo.
* Factores contextuales: El nivel aceptable de desidentificación puede variar con el propósito del uso de datos y las regulaciones aplicables. La investigación puede permitir estándares más relajados que el análisis de marketing.
* Minimización de datos: Solo los datos necesarios deben incluirse en el conjunto de datos limitado.
* Seguridad de datos: Las medidas de seguridad robustas son esenciales para proteger conjuntos de datos limitados del acceso no autorizado.
Es crucial consultar la orientación legal y regulatoria relevante para requisitos específicos antes de crear y usar un conjunto de datos limitado. La mala interpretación puede conducir a problemas legales y éticos significativos.