“Conocimientos software>Software de base de datos

Minería de datos y el proceso de ETL

2011/7/27
El poder de procesamiento de las computadoras permite a los investigadores y las empresas para analizar los datos de manera más complejos que todos los antes. La minería de datos es el proceso de tratar de encontrar información útil en grandes conjuntos de datos . Proceso ETL de minería de datos se refiere a las medidas por las que están grabados los datos , codificados y se escribe en una base de datos para su posterior análisis . Definiciones

La minería de datos se define como el proceso de análisis de los datos y agregar en la información que se puede poner a un propósito útil . El proceso de minería de datos consiste en encontrar patrones en conjuntos de datos que proporcionan información categórica sobre cómo se organiza el conjunto de datos . La minería de datos se puede utilizar para analizar la relación entre casi todas las variables medibles ; algunas aplicaciones del mundo real de la minería de datos incluyen el análisis de las estrategias de marketing , procesos de producción y las tendencias del comportamiento humano . El término ETL es un acrónimo de extracción, transformación y carga . Extraer , transformar y cargar refiere a los tres procesos por los cuales se crea una base de datos para el análisis.
Extracción

El primer paso en la creación de un almacén de datos que puede ser minada para el análisis es extraer los datos de su fuente original . Los procedimientos de extracción varían en función del tipo de datos que se extraen . A veces la extracción implica localizar y recuperar un subconjunto de datos de una o más bases de datos existentes . En otros casos , el proceso de extracción requiere de una investigación original, como buscando en la web para los sitios que contienen información relevante.
Transform

vez que los datos correspondientes se encuentran en a continuación, el proceso de extracción de datos que debe ser manipulado de modo que se puede almacenar en una base de datos para su posterior análisis . El proceso de cambio de los datos de su forma original a una forma regularizada se llama transformación. La transformación puede consistir en cualquier número de cambios en los datos , incluyendo las funciones relativamente simples, como la conversión de las letras en minúsculas y la eliminación de los signos de puntuación de cadenas de caracteres. El proceso de transformación también puede incluir procedimientos más complejos tales como la realización de funciones aritméticas sobre valores de origen , la clasificación de datos y la verificación de la validez de los datos de origen . El objetivo de la fase de transformación consiste en tomar los datos de extracción sin refinar y convertirla en datos que son útiles para los objetivos del proyecto de minería de datos.
Carga

vez los datos se transforma en el formato adecuado , que debe ser almacenado en un almacén de datos . La fase de carga se refiere al proceso por el que transforman los datos se registran a una base de datos informática . Una vez que la información se almacena en la base de datos , que puede ser objeto de análisis cualitativo y cuantitativo para buscar patrones de interés .

Software de base de datos
¿Por qué SQL Gotas conexiones
Cómo actualizar los parámetros de consulta en Access
Cómo aprender SQL une
Cómo sacar provecho de entrada para un Best Practices Database
Cómo instalar PostgreSQL en Ubuntu
Cómo elegir Adobe Reader Por Defecto
Tipos de validación de datos en Access
Piso Tutorial Archivo
Conocimientos Informáticos © http://www.ordenador.online