“Conocimientos Problema>Solución de problemas de PC

Los 10 mejores algoritmos de minería de datos

2011/12/26
La minería de datos es el proceso de analizar y resumir los datos desde diferentes perspectivas. Se esfuerza por definir patrones de datos y relaciones en grandes conjuntos de datos utilizando algoritmos --- conjuntos de normas que resuelvan un problema en una serie de medidas concretas (piense el algoritmo de Euclides en el álgebra , la cual se encuentra el máximo común divisor de dos números " ) . La Conferencia Internacional 2006 de IEEE sobre Data Mining clasificaron los 10 mejores algoritmos en el campo. Árboles de decisión

algoritmos de árbol de decisión tienen por objeto organizar los datos en decisiones que compiten en las ramas de influencia después de la decisión inicial . El tronco del árbol representa la decisión inicial , y comienza con un sí - o-no , por ejemplo, si debe o no tomar el desayuno . El desayuno de comer y no comer el desayuno sería las dos primeras ramas divergentes de los árboles, y cada elección a partir de entonces tendría sus propias ramas divergentes que conducen a un punto final.
El algoritmo K -medias

El algoritmo k -means se basa en el análisis de conglomerados . Su objetivo es romper los datos recogidos en "grupos" independientes agrupados por características similares.

Support Vector Machines

algoritmos de Apoyo Vector Machine tomar los datos de entrada y predecir cuál de los dos posibles categorías que incluyen los datos de entrada . Un ejemplo de ello se reunirán los códigos postales de un grupo de votantes y tratar de predecir si un votante dar es un demócrata o republicano.
El algoritmo Apriori

Apriori típicamente algoritmo de seguimiento de los datos de transacción . Por ejemplo, en una tienda de ropa , el algoritmo podría rastrear qué camisas clientes suelen comprar juntos.
La EM algoritmo

Este algoritmo define los parámetros mediante el análisis de los datos y predice la probabilidad de un resultado futuro o un evento al azar dentro de los parámetros de los datos . Por ejemplo , el algoritmo EM podría intentar predecir el momento de la próxima erupción de un géiser en base a los datos de tiempo de las erupciones pasadas.
PageRank Algoritmo

El PageRank algoritmo es un algoritmo de base para motores de búsqueda . Se clasifica y calcula la relevancia de una sola pieza de los datos dentro de un conjunto más amplio de datos, como un sitio web único en el conjunto más amplio de todos los sitios web en Internet.
AdaBoost Algoritmo

El algoritmo Adaboost trabaja dentro de otros algoritmos de aprendizaje que se anticipen el comportamiento sobre la base de los datos observados para que sean más sensibles a los valores atípicos estadísticos. Aunque el algoritmo EM puede estar sesgada por un géiser que tiene dos erupciones en menos de un minuto cuando se entra en erupción por lo general una vez al día , el algoritmo Adaboost sería ajustar la salida del algoritmo EM mediante el análisis de la pertinencia de los valores atípicos .

K -Nearest Neighbor algoritmo

Este algoritmo reconoce patrones en los datos de ubicación y los asociados que los datos con un identificador mayor . Por ejemplo , si usted quería asignar una oficina de correos a la ubicación geográfica de cada casa y tenía el banco de datos de la ubicación geográfica de cada hogar , el algoritmo vecino k- más cercano sería asignar los hogares a la oficina de correos más cercana en función de su proximidad entre sí .
Naive Baye

El algoritmo Bayes naive predice un resultado identidad basada en datos de observaciones conocidas. Por ejemplo , si una persona es g pies seis pulgadas de altura y usa talla 14 zapatos, el algoritmo Bayes Ingenuo sería predecir con cierta probabilidad de que la persona es un hombre.
CART Algoritmo

" Carro " es sinónimo de " Clasificación y Árbol regresiva " análisis. Al igual que el análisis del árbol de decisión , que organiza los datos en base a las opciones que compiten , como si una persona que ha sobrevivido a un terremoto? A diferencia de los algoritmos de árboles de decisión , que sólo puede clasificar un resultado o dar un resultado numérico basado en la regresión , el algoritmo CART puede utilizar tanto para predecir la probabilidad de un evento.

Solución de problemas de PC
¿Qué significa " la conexión se restableció 'Media en Windows Vista
Cómo crear un escritorio de un vínculo con una página Web
Lenovo 7484 : Los accidentes inesperados
Cómo arreglar la pantalla azul de la muerte en el equipo
Cómo tratar el malware en ordenadores
Cómo encontrar mi trabajo Historia En Línea
Cómo quitar las particiones de la unidad de fábrica
Mis documentos Congela Explorer.exe
Conocimientos Informáticos © http://www.ordenador.online