Política de Cookies

Utilizamos cookies propias y de terceros para mejorar nuestros servicios y mostrarle publicidad relacionada con sus preferencias mediante el análisis de sus hábitos de navegación.
Puede obtener más información consultando nuestra Política de Cookies y puede cambiar su configuración editando las Preferencias.

Cookies necesarias para el correcto uso de la web, como por ejemplo inicio de sesión, autenticación o seguridad.

Permiten medir, de forma anónima, el número de visitas o la actividad. Gracias a ellas podemos mejorar constantemente introduciendo mejoras en función del análisis de los datos de uso que hacen los usuarios del servicio.

Libros ciclos formativos, grado superior de informática, ASIR, DAM, DAW, libros universitarios: libros ingeniería aeronáutica, libros ingeniería civil, ingeniería de caminos: ingeniería construcción, ingeniería sanitaria, ingeniería del transporte, ingeniería hidráulica, territorio, urbanismo, materiales de construcción, libros ingeniería geológica: geotecnia, expresión gráfica, proyectos, libros ingeniería mecánica: estructuras, resistencia de materiales, libros ingeniería eléctrica, libros ingeniería electrónica: labview, libros termodinámica, libros de electricidad, libros de construcción, libros arquitectura, libro de ciencias: matemáticas: álgebra, cálculo, matemáticas avanzadas, estadística, probabilidad, big data, tratamiento de datos, econometría, química, física, libros contabilidad, PGC, libros finanzas, organización empresas, marketing, libros economía, libros ciencias sociales, libros educación infantil, libros técnicos y reglamentos: eléctricos, construcción, libros informática, computación, libros ciencias de la salud

Big Data aplicado

César Pérez López

Páginas: 470

Fecha: 2022

ISBN: 978-84-1903-409-0

Precio: 40,00 € IVA incluido  

Recomienda este libro

Otros libros relacionados
Este libro está dirigido tanto a alumnos que siguen un Curso de especialización en Inteligencia Artificial y Big Data como a profesionales del sector.

El libro comienza tratando el almacenamiento y el procesamiento de datos masivos. Se presentan los sistemas de almacenamiento de datos y los métodos avanzados de almacenamiento en clusters. Se tienen en cuenta los datos estructurados y no estructurados, los problemas de compatibilidad, la calidad y seguridad de los datos y su procesamiento en clusters. Se desarrolla también la analítica de Big data, sus pasos, capacidades, fuentes de datos y casos de uso, así como el Big data en la nube a través de los servicios Cloud.

A continuación se aborda la Computación Distribuida. Adicionalmente se trata la computación paralela con su evolución, tipos, ventajas, desventajas, patrones de diseño, arquitecturas de memoria, sincronización, lenguajes, modelos y usos. Se presentan ejemplos de computación paralela y distribuida con la herramienta Parallel Computing de MATLAB y con Apache Spark. También se desarrollan sistemas de almacenamiento distribuidos y se analizan sistemas gestores de bases de datos distribuidas presentando ejemplos con SQL-Server. Se aborda también la alta disponibilidad, la tolerancia a fallos y su implementación en la web y en la nube.

Asimismo, se analizan herramientas de computación masiva en los ecosistemas de Big Data con especial atención a Hadoop, Mapreduce, Hadoop Distribute File System y Hadoop Common Components. Después se aborda la automatización de trabajos y se presentan ejemplos desarrollados con SQL-Server. También se presenta el ecosistema Hadoop de Apache Ambari. Adicionalmente se describen las herramientas de Big Data Analytics de SAS y además, se describen las herramientas de Big Data Analytics de Oracle, de Microsoft y de IBM.

Seguidamente, se abordan la calidad e integridad de los datos en procesos de Big Data y el movimiento de datos entre clusters. Finalmente, se profundiza en las técnicas de Big Data e Inteligencia de Negocios. Se analizan las herramientas más importantes de Business Intelligence con especial atención a los cuadros de mando. Se describen las herramientas SAS Visual Analytics y herramientas de SAP para cuadros de mando. Por último, se describe la implementación del KDD (Knowledge Discovery in Data Bases) con herramientas de SAS (SAS Enterprise Miner) e IBM (IBM SPSS Modeler) a través de ejemplos.

CONTENIDO

Introducción

Capítulo 1. Sistemas de almacenamiento y herramientas del centro de datos
1.1 Almacenamiento de datos masivo
1.2 Procesamiento de datos
1.3 Analítica de Big Data
1.4 Big Data y Cloud

Capítulo 2. Computación distribuida y computación paralela
2.1 Computación distribuida
2.2 Computación paralela
2.3 Computación paralela y distribuida con Matlab. Parallel Computing Toolbox
2.4 Computación paralela y distribuida con Apache Spark

Capítulo 3. Sistemas de almacenamiento distribuidos. Tolerancia a fallos
3.1 Sistemas de almacenamiento distribuidos.
3.2 Sistemas gestores de base de datos distribuidos
3.3 Etapas en el acceso a datos distribuidos
3.4 Tablas distribuidas
3.5 Reflejar una base de datos en SQL-server
3.6 Procesamiento de transacciones en SQL-server
3.7 Copiar o mover bases de datos entre servidores en SQL-server: asistente para copiar bases de datos
3.8 Tolerancia a fallos

Capítulo 4. Sistemas de almacenamiento y ecosistemas Big Data
4.1 Herramientas de computación masiva: Hadoop y Map Reduce
4.2 Hadoop Distributed File System (HDFS)
4.3 Hadoop Mapreduce
4.4 Hadoop Common Components
4.5 Automatización de trabajos
4.6 Automatización de trabajos en SQL-server
4.7 Automatización de trabajos con Transact-SQL
4.8 Apache Ambari y el ecosistema de Hadoop

Capítulo 5. Big Data Analytics con herramientas de SAS
5.1 Hadoop y Big Data en SAS
5.2 SAS, Hadoop y el proceso analítico
5.3 Big Data y soluciones Hadoop de SAS
5.4 SAS/Access Interface to Hadoop
5.5 SAS Data Management
5.6 SAS servidor de federación
5.7 Software SAS base
5.8 Herramientas para explorar y visualizar datos científicos
5.9 SAS Visual Analytics
5.10 SAS In-Memory Statistics For Hadoop
5.11 SAS Visual Statistics
5.12 Inicio y entorno de trabajo
5.13 Interfaz de usuario
5.14 SAS High-Performance Analytics
5.15 SAS High-Performance Statistics
5.16 SAS High-Performance Data Mining
5.17 SAS High-Performance Text Mining
5.18 High-Performance Optimization
5.19 SAS viya

Capítulo 6. Big Data Analytics con herramientas de Oracle, Microsoft e IBM
6.1 Introducción
6.2 Oracle Big Data Appliance
6.3 Oracle Big Data Connectors
6.4 Oracle Nosql Database
6.5 Oracle Exadata Database Machine
6.6 Oracle Exalytics in-Memory Machine
6.7 Oracle Business Analytics
6.8 Oracle Business Intelligence Foundation Suite
6.9 Enterprise Performance Management
6.10 Aplicaciones analíticas
6.11 Information Discovery
6.12 Advanced Analytics
6.13 Nube
6.14 Herramientas de Big Data Analytics en Microsoft
6.15 HDinsight
6.16 El ecosistema Hadoop en Azure
6.17 Escenarios de datos de gran tamaño en Hdinsight
6.18 Introducción al uso de Hdinsight de Azure
6.19 Uso del almacenamiento de Blobs de Azure con Hdinsight
6.20 Big data Analytics con herramientas de IBM
6.21 Analítica y Big Data
6.22 IBM SPSS Modeler

Capítulo 7. Integridad y calidad de los datos en procesos de Big Data
7.1 Costes y calidad asociados al proceso de análisis de la información
7.2 Integridad de datos en sistemas distribuidos
7.3 Integridad y sumas de verificación
7.4 Movimiento de datos entre clusters
7.5 Copiar o mover bases de datos entre servidores en SQL-server

Capítulo 8. Monitorización y optimización de clusters
8.1 Monitorización de clusters
8.2 Herramientas de monitorización de clusters hyper-v
8.3 Herramientas de monitorización de clusters hadoop
8.4 Interfaces web de Jobtracker y Namenode
8.5 Monitorización de clusters: ganglia

Capítulo 9. Técnicas de Big Data e Inteligencia de negocios
9.1 modelos de inteligencia de negocios
9.2 Analytics e inteligencia de negocios. El proceso del modelo KDD
9.3 Implantación de modelos de inteligencia de negocios
9.4 herramientas de Business Intelligence
9.5 Cuadros de mando con herramientas de SAS. SAS visual Analytics
9.6 Business Intelligence con herramientas de SAP
9.7 Técnicas de validación de modelos

Capítulo 10. Implementación del KDD con herramientas de SAS e IBM
10.1 Etapas del KDD con SAS Enterprise Miner
10.2 SEMMA. Valoración e interpretación de modelos. El nodo regresión
10.3 IBM SPSS Modeler
10.4 Ejemplo de trabajo con IBM SPSS Modeler
Libros técnicos y Reglamentos para profesionales, Ingenieros, Arquitectos e Instaladores del sector eléctrico (electricidad), construcción, climatización Contabilidad, Plan general de Contabilidad y Pymes. Libros para Ciclos Formativos y Programas de Cualificación Profesional Inicial, PCPI, de Peluquería e Informática. Libros universitarios de Ciencias, físico-química, químico-física, Ingeniería, Matemáticas, Estadística, Software SPSS