Reseña del libro: Aprendizaje automático con PyTorch y Scikit-Learn

Reseña del libro: Aprendizaje automático con PyTorch y Scikit-Learn

  • Big Data
  • marzo 18, 2022
  • No Comment
  • 206
  • 6 minutes read


El atractivo nuevo título, cortesía de Packt Publishing, Aprendizaje automático con PyTorch y Scikit-Learn de Sebastian Raschka, Yuxi (Hayden) Liu y Vahid Mirjalili es una adición bienvenida a la lista de recursos de aprendizaje de cualquier científico de datos. Este tomo de 2022 consta de 741 páginas bien diseñadas que tienen como objetivo proporcionar un marco integral para trabajar en aprendizaje automático y aprendizaje profundo. El libro está repleto de temas que lo llevarán a una comprensión de primer nivel del tema. Los temas incluyen una introducción a ML que incluye una implementación simple del algoritmo de perceptrón, recopilación de datos, reducción de dimensionalidad, un recorrido por los algoritmos de clasificación (regresión logística, SVM, árbol de decisiones, ANN), evaluación de modelos y ajuste de hiperparámetros, aprendizaje de conjuntos, regresión, Sentimiento análisis y aprendizaje no supervisado con clustering.

Luego, el libro se pone en marcha con una variedad de temas actuales en aprendizaje profundo, todos utilizando el popular marco PyTorch: implementación de una ANN multicapa simple, capacitación de redes neuronales paralelizantes, clasificación de imágenes con CNN, modelado de datos secuenciales con RNN, transformadores, y más NLP, GAN, redes neuronales gráficas y aprendizaje por refuerzo. Un libro muy completo por cierto!

El libro es el nuevo miembro de la serie ML de Packt, que incluye un título de 2019 que revisé hace unos años: Python Machine Learning, 3.ª edición. Los dos libros tienen en gran medida el mismo contenido con una excepción importante, el libro anterior se basó en TensorFlow para temas de aprendizaje profundo, mientras que este libro usa PyTorch (hoy en día, el claro ganador en proyectos de aprendizaje profundo; solo mire el código asociado con los artículos que aparecen en arXiv).

El nuevo libro eligió a un tercer autor, Liu, y agregó dos nuevos capítulos: Transformers y Graph Neural Networks. Se eliminó el capítulo del libro anterior sobre la incorporación de un modelo ML en una aplicación web. El nuevo libro contiene versiones revisadas de todos los capítulos del libro anterior, lo que hace que el contenido sea aún más convincente y significativamente más sofisticado. Era un gran admirador del libro de 2019 y se lo recomendé a todos mis estudiantes de Introducción a la ciencia de datos en UCLA; Quiero hacer lo mismo con este nuevo libro.

Una de las principales atracciones de este libro es cómo agiliza la integración de fundamentos y matemáticas/estadísticas para muchos elementos clave del aprendizaje automático. Este contenido teórico luego se integra con una generosa cantidad de código Python que se encuentra a lo largo del libro. La calidad y el estilo del código también son de primera categoría. Los cuadernos de Jupyter para el código de cada capítulo se pueden encontrar en un sitio de GitHub diseñado como un recurso para contenido complementario.

Mi capítulo favorito del libro es el capítulo 3: Un recorrido por los clasificadores de aprendizaje automático con scikit-learn. Este es un gran capítulo para principiantes, ya que proporciona una descripción general de alto nivel de muchas técnicas útiles de aprendizaje automático. Después de leer este capítulo, podrá resolver muchos problemas de ciencia de datos de inmediato.

Hay muchas maneras excelentes de poner en marcha sus habilidades de aprendizaje automático a partir del tesoro de nuevos libros que hay hoy en día. Este nuevo libro definitivamente debería tener un lugar en la parte superior de la lista. Debe usar este libro como un recurso de aprendizaje para desarrollar sus superpoderes de ciencia de datos. ¡Muy recomendable!

CContribución de Daniel D. Gutiérrez, editor gerente y científico de datos residente de insideBIGDATA. Además de ser periodista tecnológico, Daniel es consultor científico de datos, autor, educador y forma parte de varios consejos asesores de varias empresas emergentes.

Regístrese para recibir el boletín gratuito insideBIGDATA.

Únase a nosotros en Twitter: @InsideBigData1 – https://twitter.com/InsideBigData1



Related post

Lo más difícil (y lo mejor) del crédito fiscal para vehículos limpios de EE. UU.

Lo más difícil (y lo mejor) del crédito fiscal…

Ha habido mucha discusión sobre el nuevo Crédito para Vehículos Limpios en la Ley de Reducción de la Inflación de 2022…
Aprendizaje eficiente de video-texto con co-tokenización iterativa

Aprendizaje eficiente de video-texto con co-tokenización iterativa

Publicado por AJ Piergiovanni y Anelia Angelova, científicos investigadores, Google Research, Brain Team Los videos son una fuente omnipresente de contenido…
Resolviendo un misterio de larga data en la transferencia de calor |  Noticias del MIT

Resolviendo un misterio de larga data en la transferencia…

Es un problema que ha intrigado a los científicos durante un siglo. Pero reforzado por un premio Distinguished Early Career Award…

Leave a Reply

Tu dirección de correo electrónico no será publicada.