El libro para aprender de manera práctica la estadística necesaria para ciencia de datos

¿Alguna vez te preguntaste cómo aprender la estadística necesaria para la ciencia de datos? Estadística práctica para ciencia de datos con R y Python.

Estadística práctica para ciencia de datos con R y Python

La siguiente es una reseña del libro Estadística práctica para ciencia de datos con R y Python de Peter Bruce, Andrew Bruce y Peter Gedeck. Este libro cumple lo que promete: una forma de aprender estadística práctica para la ciencia de datos, tanto para principiantes como para expertos.

Estadística práctica para ciencia de datos con R y Python es un libro que cubre el tema de la estadística orientado específicamente a los científicos de datos y a los ingenieros de aprendizaje automático / ingenieros de machine learning, de una manera muy práctica.

Si estás familiarizado con R o Python (este segundo lenguaje de programación solo se incluye en esta segunda edición del libro), y has tenido alguna exposición previa a la estadística, este libro conciso te pondrá en marcha con métodos estadísticos complejos, experimentos y procedimienots en estos dos lenguajes de programación.

Qué aprenderás

Aprenderás a realizar análisis exploratorios de datos como un profesional, cómo muestrear correctamente, cómo responder preguntas desde una perspectiva estadística, cómo usar la regresión para predecir resultados y detectar valores atípicos, y algunos métodos estadísticos de aprendizaje automático supervisado y no supervisado.

Este libro está más orientado a programadores que tienen algunos conocimientos de estadística que a científicos de datos que probablemente estén muy familiarizados con estos temas. Si eres un programador que quieres acercarte a la ciencia de datos, o un científico de datos con falta de conocimiento estadístico, entonces este libro es una muy buena compra para ti.

En un mundo lleno de publicaciones de estadísitcas, hilos sobre stack overflow, y libros, Estadística práctica para ciencia de datos con R y Python puede servir como un manual de referencia para tenerlo cerca y buscar en caso de que necesites actualizar un concepto antiguo o ver cómo implementar algo de manera precisa.

En general, se trata de una gran lectura y un fantástico manual de referencia para preguntas puntuales.

Descripción del libro

Este libro está dirigido al científico de datos con cierta familiaridad con los lenguajes de programación R y/o Python, y con cierta exposición previa (quizás irregular o efímera) a la estadística. Dos de los autores llegaron al mundo de la ciencia de datos desde el mundo de la estadística, y tienen cierta apreciación de la contribución que la estadística puede hacer al arte de la ciencia de datos.

Al mismo tiempo, somos muy conscientes de las limitaciones de la instrucción estadística tradicional: la estadística como disciplina tiene un siglo y medio de antigüedad, y la mayoría de los libros de texto y cursos de estadística están cargados con el impulso y la inercia de un transatlántico. Todos los métodos de este libro tienen alguna conexión – histórica o metodológica – con la disciplina de la estadística. No se incluyen los métodos que evolucionaron principalmente a partir de la informática, como las redes neuronales.

En todos los casos, este libro da ejemplos de código – primero en R y luego en Python. Para evitar repeticiones innecesarias, generalmente muestra solo resultados y gráficos creados por el código R. también omite el código requerido para cargar los paquetes y conjuntos de datos requeridos. Puedes encontrar el código completo, así como los conjuntos de datos para descargaren GitHub.

Dos objetivos subyacen en este libro:

  • Presentar, en forma digerible, navegable y de fácil referencia, conceptos clave de la estadística que son relevantes para la ciencia de datos.
  • Explicar qué conceptos son importantes y útiles desde la perspectiva de la ciencia de datos, cuáles lo son menos y por qué.

Contenido del libro

  1. Análisis exploratoio de datos
  2. Distribuciones de datos y muestreo
  3. Experimentos estadísticos y pruebas significativas
  4. Regresión y pronóstico
  5. Clasificación
  6. Aprendizaje automático estadístico
  7. Aprendizaje no supervisado

Autores

Peter Bruce es el fundador y director académico del Institute for Statistics Education en Statistics.com, que ofrece alrededor de 80 cursos de estadística y análisis, aproximadamente la mitad de los cuales están dirigidos a científicos de datos. Es autor o coautor de varios libros sobre estadística y análisis, y obtuvo su licenciatura en Princeton y maestrías en Harvard y la University of Maryland.

Andrew Bruce, científico investigador principal de Amazon, tiene más de 30 años de experiencia en estadística y ciencia de datos en el mundo académico, gubernamental y empresarial. Coautor de Wavelet Analysis with S-PLUS, obtuvo su licenciatura en Princeton y su doctorado en estadística en la University of Washington.

Peter Gedeck, científico de datos sénior en Collaborative Drug Discovery, se especializa en el desarrollo de algoritmos de aprendizaje automático para predecir las propiedades biológicas y fisicoquímicas de los candidatos a fármacos. Coautor de Data Mining for Business Analytics, obtuvo un doctorado en Química de la Erlangen-Nürnberg Universität, y Matemáticas en Fernuniversität Hagen, ambas en Alemania.

Resumen

Estadísitca práctica para ciencia de datos con R y Python es un libro que está muy bien definido por su título: es un libro muy práctico para aprender los conceptos y herramientas estadísticas más importantes que se utilizan en el mundo de la ciencia de datos.

Para las personas que ya tienen confianza con la estadística, la mayoría de los temas les resultarán un poco familiares. Sin embargo, el libro aún brinda algunas perspectivas e ideas nuevas, especialmente para ayudar a obtener una comprensión sólida (paso a paso) de algoritmos y modelos comunes en el kit de herramientas de ciencia de datos. Para los programadores con poco conocimiento estadístico, este libro les enseñará de qué se trata la estadística, y cómo puede usarse para aprovechar el verdadero poder de sus datos.

Con un libro como este, complementado con un curso de aprendizaje automático / machine learning, estarás en camino de convertirte en un excelente científico de datos, si eso es lo que deseas.

Para los expertos en ciencia de datos o aprendizaje automático, el libro puede servir como un manual de referencia para tenerlo cerca para buscar cómo implementar varios algoritmos. En general, se trata de una buena lectura, que seguramente disfrutarás.

Si quieres, puedes comprar el libro en el siguiente enlace en Marcombo.