Herramientas útiles para la mineria de datos

Taller Open Data organitzat per Julià Minguillón
 He asistido a la tercera parte del  taller de Open Data,, organizado por  Julià Minguillón  de la UOC.  Esta tercera parte estaba dedicada a las herramientas de análisis de datos mediante métodos estadísticos y láminas de datos, términos implicados pero que hacen referencia a temas diferentes  Os hago un resumen de las 3 más utilizadas a continuación:

R

R es un lenguaje muy potente y de alto nivel de estadistica y minería de datos  http://cran.r-project.org/ R es un lenguaje textual, basado en linea de comandos pero hay herramientas visuales como visual R commander, R Studio  (el mejor)  Un ejemplo típico con R sería crear un árbol de decisión a partir de un conjunto de datos, o hacer un clustering de las mismas  También tenemos Quick-R, una web donde se hace una introducción al poder de análisis de R   

Python

Otro herramienta muy potente es el lenguaje de programación Python  En concreto tenemos la librería Anaconda que sirve para manipular datos. R quizá es más especializado pero el hecho de utilizar un lenguaje potente como Python también tiene ventajas  

Processing

Y finalmente la tercera herramienta sería Processing, que puede ser muy útil para hacer representaciones gráficas