¿Qué es la minería de datos?
by SackPlanet in
Others
0
6
26 by October by 2016
El reto de estos nuevos profesionales es extraer información de enormes bases de datos. ¿Estás preparado para la era del big data?
Tradicionalmente el objetivo de la minería era la obtención de carbón. No obstante, una nueva generación de mineros ha aparecido en el inicio de esta cuarta revolución industrial. Son los mineros o exploradores de datos, que cuales en lugar de buscar carbón intentan descubrir patrones en enormes volúmenes de datos. Los métodos utilizados de estos nuevos profesionales son la inteligencia artificial, el aprendizaje automático, la estadística y sistemas de base de datos.
La minería de datos es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos con el objetivo de encontrar patrones que nos puedan aportar información valiosa en la toma de futuras decisiones. El proceso de minería de datos tiene normalmente cuatro etapas principales:
- Determinación de los objetivos
- Procesamiento de los datos
- Determinación del modelo
- Análisis de los resultados
En el primero de los pasos se trata el tipo de información que el cliente desea extraer de la base de datos. La segunda etapa es la que requiere más trabajo ya que se tiene de seleccionar, limpiar, enriquecer, reducir y transformar la base de datos que nos ha facilitado el cliente. Una vez la hemos procesado y está lista para implementarle el algoritmo de inteligencia artificial, tenemos que escoger qué algoritmo nos va a dar mejores resultados.
La elección del mejor algoritmo para una tarea analítica específica es un gran desafío y depende del problema a resolver. Hay básicamente cinco problemas diferentes en la minería de datos: clasificación, regresión, segmentación, asociación y análisis de secuencias.
Para resolver estos problemas hay muchos algoritmos a utilizar, los principales son: los de asociación, los clústeres, los de árbol de decisión, los de regresión lineal, el clasificador Bayesiano ingenuo, los de red neuronal, los clústeres de secuencia y los de serie temporal.
Finalmente, el último paso es el de análisis de los resultados. Actualmente este trabajo se está realizando en muchas áreas de negocio como seguridad de datos, finanzas, salud, marketing, detección de fraude, búsquedas online, procesamiento de lenguaje natural o los nuevos coches inteligentes.
Por estas razones la minería de datos se está convirtiendo en uno de los trabajos con mayor proyección para el futuro, ya que ahorra grandes cantidades de dinero para las empresas y abre nuevas oportunidades de negocio.
6 COMMENTS