Imagen de cubierta local
Imagen de cubierta local
Tipo: materialTypeLabelLibro de Reserva
Ubicación Física: N64d / 005.133

Data Science Solutions with Python: Fast and Scalable Models Using Keras, PySpark MLlib, H2O, XGBoost, and Scikit-Learn /

Autor: Nokeri, Tshepo Chris.
Pié de imprenta: New York: Springer ; 2022
Descripción: 119 páginas : tablas, gráficas ; 24cm.
ISBN: 9781484277614.
Contenido: Chapter 1: Exploring Machine Learning. -- Chapter 2: Big Data, Machine Learning, and Deep Learning Frameworks. -- Chapter 3: Linear Modeling with Scikit-Learn, PySpark, and H2O. -- Chapter 4: Survival Analysis with PySpark and Lifelines. -- Chapter 5: Nonlinear Modeling With Scikit-Learn, PySpark, and H2O. -- Chapter 6: Tree Modeling and Gradient Boosting with Scikit-Learn, XGBoost, PySpark, and H2O. -- Chapter 7: Neural Networks with Scikit-Learn, Keras, and H2O. -- Chapter 8: Cluster Analysis with Scikit-Learn, PySpark, and H2O
Resumen: Apply supervised and unsupervised learning to solve practical and real-world big data problems. This book teaches you how to engineer features, optimize hyperparameters, train and test models, develop pipelines, and automate the machine learning (ML) process. The book covers an in-memory, distributed cluster computing framework known as PySpark, machine learning framework platforms known as scikit-learn, PySpark MLlib, H2O, and XGBoost, and a deep learning (DL) framework known as Keras. The book starts off presenting supervised and unsupervised ML and DL models, and then it examines big data frameworks along with ML and DL frameworks. Author Tshepo Chris Nokeri considers a parametric model known as the Generalized Linear Model and a survival regression model known as the Cox Proportional Hazards model along with Accelerated Failure Time (AFT). Also presented is a binary classification model (logistic regression) and an ensemble model (Gradient Boosted Trees). The book introduces DL and an artificial neural network known as the Multilayer Perceptron (MLP) classifier. A way of performing cluster analysis using the K-Means model is covered. Dimension reduction techniques such as Principal Components Analysis and Linear Discriminant Analysis are explored. And automated machine learning is unpacked. This book is for intermediate-level data scientists and machine learning engineers who want to learn how to apply key big data frameworks and ML and DL frameworks. You will need prior knowledge of the basics of statistics, Python programming, probability theories, and predictive analytics. Aplique el aprendizaje supervisado y no supervisado para resolver problemas prácticos y del mundo real de big data. Este libro le enseña cómo diseñar funciones, optimizar hiperparámetros, entrenar y probar modelos, desarrollar canalizaciones y automatizar el proceso de aprendizaje automático (ML). El libro cubre un marco de computación en clúster distribuido en memoria conocido como PySpark, plataformas de marco de aprendizaje automático conocidas como scikit-learn, PySpark MLlib, H2O y XGBoost, y un marco de aprendizaje profundo (DL) conocido como Keras. El libro comienza presentando modelos de ML y DL supervisados ​​y no supervisados, y luego examina los marcos de big data junto con los marcos de ML y DL. El autor Tshepo Chris Nokeri considera un modelo paramétrico conocido como modelo lineal generalizado y un modelo de regresión de supervivencia conocido como modelo de riesgos proporcionales de Cox junto con el tiempo de falla acelerado (AFT). También se presenta un modelo de clasificación binaria (regresión logística) y un modelo de conjunto (Gradient Boosted Trees). El libro presenta DL y una red neuronal artificial conocida como clasificador de perceptrón multicapa (MLP). Se cubre una forma de realizar análisis de conglomerados utilizando el modelo K-Means. Se exploran técnicas de reducción de dimensiones como el análisis de componentes principales y el análisis discriminante lineal. Y el aprendizaje automático automatizado está descomprimido. Este libro está dirigido a científicos de datos e ingenieros de aprendizaje automático de nivel intermedio que desean aprender a aplicar marcos clave de big data y marcos de ML y DL. Necesitará conocimientos previos de los conceptos básicos de estadística, programación en Python, teorías de probabilidad y análisis predictivo.

Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
Valoración
    Valoración media: 0.0 (0 votos)
Existencias
Tipo de ítem Biblioteca actual Colección Signatura Copia número Estado Fecha de vencimiento Código de barras
Libro de Reserva Libro de Reserva Biblioteca Sede Principal
Sala Ciencias Puras
Colección Reserva 005.133 / N64d (Navegar estantería(Abre debajo)) Ej.1 Disponible (Acceso Libre) 27202

Chapter 1: Exploring Machine Learning. -- Chapter 2: Big Data, Machine Learning, and Deep Learning Frameworks. -- Chapter 3: Linear Modeling with Scikit-Learn, PySpark, and H2O. -- Chapter 4: Survival Analysis with PySpark and Lifelines. -- Chapter 5: Nonlinear Modeling With Scikit-Learn, PySpark, and H2O. -- Chapter 6: Tree Modeling and Gradient Boosting with Scikit-Learn, XGBoost,
PySpark, and H2O. -- Chapter 7: Neural Networks with Scikit-Learn, Keras, and H2O. -- Chapter 8: Cluster Analysis with Scikit-Learn, PySpark, and H2O

Apply supervised and unsupervised learning to solve practical and real-world big data problems. This book teaches you how to engineer features, optimize hyperparameters, train and test models, develop pipelines, and automate the machine learning (ML) process.


The book covers an in-memory, distributed cluster computing framework known as PySpark, machine learning framework platforms known as scikit-learn, PySpark MLlib, H2O, and XGBoost, and a deep learning (DL) framework known as Keras. The book starts off presenting supervised and unsupervised ML and DL models, and then it examines big data frameworks along with ML and DL frameworks. Author Tshepo Chris Nokeri considers a parametric model known as the Generalized Linear Model and a survival regression model known as the Cox Proportional Hazards model along with Accelerated Failure Time (AFT). Also presented is a binary classification model (logistic regression) and an ensemble model (Gradient Boosted Trees). The book introduces DL and an artificial neural network known as the Multilayer Perceptron (MLP) classifier. A way of performing cluster analysis using the K-Means model is covered. Dimension reduction techniques such as Principal Components Analysis and Linear Discriminant Analysis are explored. And automated machine learning is unpacked. This book is for intermediate-level data scientists and machine learning engineers who want to learn how to apply key big data frameworks and ML and DL frameworks. You will need prior knowledge of the basics of statistics, Python programming, probability theories, and predictive analytics.

Aplique el aprendizaje supervisado y no supervisado para resolver problemas prácticos y del mundo real de big data. Este libro le enseña cómo diseñar funciones, optimizar hiperparámetros, entrenar y probar modelos, desarrollar canalizaciones y automatizar el proceso de aprendizaje automático (ML).


El libro cubre un marco de computación en clúster distribuido en memoria conocido como PySpark, plataformas de marco de aprendizaje automático conocidas como scikit-learn, PySpark MLlib, H2O y XGBoost, y un marco de aprendizaje profundo (DL) conocido como Keras. El libro comienza presentando modelos de ML y DL supervisados ​​y no supervisados, y luego examina los marcos de big data junto con los marcos de ML y DL. El autor Tshepo Chris Nokeri considera un modelo paramétrico conocido como modelo lineal generalizado y un modelo de regresión de supervivencia conocido como modelo de riesgos proporcionales de Cox junto con el tiempo de falla acelerado (AFT). También se presenta un modelo de clasificación binaria (regresión logística) y un modelo de conjunto (Gradient Boosted Trees). El libro presenta DL y una red neuronal artificial conocida como clasificador de perceptrón multicapa (MLP). Se cubre una forma de realizar análisis de conglomerados utilizando el modelo K-Means. Se exploran técnicas de reducción de dimensiones como el análisis de componentes principales y el análisis discriminante lineal. Y el aprendizaje automático automatizado está descomprimido. Este libro está dirigido a científicos de datos e ingenieros de aprendizaje automático de nivel intermedio que desean aprender a aplicar marcos clave de big data y marcos de ML y DL. Necesitará conocimientos previos de los conceptos básicos de estadística, programación en Python, teorías de probabilidad y análisis predictivo.

No hay comentarios en este titulo.

para colocar un comentario.

Haga clic en una imagen para verla en el visor de imágenes

Imagen de cubierta local