Este libro está dirigido tanto a alumnos que siguen un Curso de especialización en Inteligencia Artificial y Big Data como a profesionales del sector. El libro comienza tratando el almacenamiento y el procesamiento de datos masivos. Se presentan los sistemas de almacenamiento de datos y los métodos avanzados de almacenamiento en clusters. Se tienen en cuenta los datos estructurados y no estructurados, los problemas de compatibilidad, la calidad y seguridad de los datos y su procesamiento en clusters. Se desarrolla también la analítica de Big data, sus pasos, capacidades, fuentes de datos y casos de uso, así como el Big data en la nube a través de los servicios Cloud. A continuación se aborda la Computación Distribuida. Adicionalmente se trata la computación paralela con su evolución, tipos, ventajas, desventajas, patrones de diseño, arquitecturas de memoria, sincronización, lenguajes, modelos y usos. Se presentan ejemplos de computación paralela y distribuida con la herramienta Parallel Computing de MATLAB y con Apache Spark. También se desarrollan sistemas de almacenamiento distribuidos y se analizan sistemas gestores de bases de datos distribuidas presentando ejemplos con SQL-Server. Se aborda también la alta disponibilidad, la tolerancia a fallos y su implementación en la web y en la nube. Asimismo, se analizan herramientas de computación masiva en los ecosistemas de Big Data con especial atención a Hadoop, Mapreduce, Hadoop Distribute File System y Hadoop Common Components. Después se aborda la automatización de trabajos y se presentan ejemplos desarrollados con SQL-Server. También se presenta el ecosistema Hadoop de Apache Ambari. Adicionalmente se describen las herramientas de Big Data Analytics de SAS y además, se describen las herramientas de Big Data Analytics de Oracle, de Microsoft y de IBM. Seguidamente, se abordan la calidad e integridad de los datos en procesos de Big Data y el movimiento de datos entre clusters. Finalmente, se profundiza en las técnicas de Big Data e Inteligencia de Negocios. Se analizan las herramientas más importantes de Business Intelligence con especial atención a los cuadros de mando. Se describen las herramientas SAS Visual Analytics y herramientas de SAP para cuadros de mando. Por último, se describe la implementación del KDD (Knowledge Discovery in Data Bases) con herramientas de SAS (SAS Enterprise Miner) e IBM (IBM SPSS Modeler) a través de ejemplos. CONTENIDO Introducción Capítulo 1. Sistemas de almacenamiento y herramientas del centro de datos 1.1 Almacenamiento de datos masivo 1.2 Procesamiento de datos 1.3 Analítica de Big Data 1.4 Big Data y Cloud Capítulo 2. Computación distribuida y computación paralela 2.1 Computación distribuida 2.2 Computación paralela 2.3 Computación paralela y distribuida con Matlab. Parallel Computing Toolbox 2.4 Computación paralela y distribuida con Apache Spark Capítulo 3. Sistemas de almacenamiento distribuidos. Tolerancia a fallos 3.1 Sistemas de almacenamiento distribuidos. 3.2 Sistemas gestores de base de datos distribuidos 3.3 Etapas en el acceso a datos distribuidos 3.4 Tablas distribuidas 3.5 Reflejar una base de datos en SQL-server 3.6 Procesamiento de transacciones en SQL-server 3.7 Copiar o mover bases de datos entre servidores en SQL-server: asistente para copiar bases de datos 3.8 Tolerancia a fallos Capítulo 4. Sistemas de almacenamiento y ecosistemas Big Data 4.1 Herramientas de computación masiva: Hadoop y Map Reduce 4.2 Hadoop Distributed File System (HDFS) 4.3 Hadoop Mapreduce 4.4 Hadoop Common Components 4.5 Automatización de trabajos 4.6 Automatización de trabajos en SQL-server 4.7 Automatización de trabajos con Transact-SQL 4.8 Apache Ambari y el ecosistema de Hadoop Capítulo 5. Big Data Analytics con herramientas de SAS 5.1 Hadoop y Big Data en SAS 5.2 SAS, Hadoop y el proceso analítico 5.3 Big Data y soluciones Hadoop de SAS 5.4 SAS/Access Interface to Hadoop 5.5 SAS Data Management 5.6 SAS servidor de federación 5.7 Software SAS base 5.8 Herramientas para explorar y visualizar datos científicos 5.9 SAS Visual Analytics 5.10 SAS In-Memory Statistics For Hadoop 5.11 SAS Visual Statistics 5.12 Inicio y entorno de trabajo 5.13 Interfaz de usuario 5.14 SAS High-Performance Analytics 5.15 SAS High-Performance Statistics 5.16 SAS High-Performance Data Mining 5.17 SAS High-Performance Text Mining 5.18 High-Performance Optimization 5.19 SAS viya Capítulo 6. Big Data Analytics con herramientas de Oracle, Microsoft e IBM 6.1 Introducción 6.2 Oracle Big Data Appliance 6.3 Oracle Big Data Connectors 6.4 Oracle Nosql Database 6.5 Oracle Exadata Database Machine 6.6 Oracle Exalytics in-Memory Machine 6.7 Oracle Business Analytics 6.8 Oracle Business Intelligence Foundation Suite 6.9 Enterprise Performance Management 6.10 Aplicaciones analíticas 6.11 Information Discovery 6.12 Advanced Analytics 6.13 Nube 6.14 Herramientas de Big Data Analytics en Microsoft 6.15 HDinsight 6.16 El ecosistema Hadoop en Azure 6.17 Escenarios de datos de gran tamaño en Hdinsight 6.18 Introducción al uso de Hdinsight de Azure 6.19 Uso del almacenamiento de Blobs de Azure con Hdinsight 6.20 Big data Analytics con herramientas de IBM 6.21 Analítica y Big Data 6.22 IBM SPSS Modeler Capítulo 7. Integridad y calidad de los datos en procesos de Big Data 7.1 Costes y calidad asociados al proceso de análisis de la información 7.2 Integridad de datos en sistemas distribuidos 7.3 Integridad y sumas de verificación 7.4 Movimiento de datos entre clusters 7.5 Copiar o mover bases de datos entre servidores en SQL-server Capítulo 8. Monitorización y optimización de clusters 8.1 Monitorización de clusters 8.2 Herramientas de monitorización de clusters hyper-v 8.3 Herramientas de monitorización de clusters hadoop 8.4 Interfaces web de Jobtracker y Namenode 8.5 Monitorización de clusters: ganglia Capítulo 9. Técnicas de Big Data e Inteligencia de negocios 9.1 modelos de inteligencia de negocios 9.2 Analytics e inteligencia de negocios. El proceso del modelo KDD 9.3 Implantación de modelos de inteligencia de negocios 9.4 herramientas de Business Intelligence 9.5 Cuadros de mando con herramientas de SAS. SAS visual Analytics 9.6 Business Intelligence con herramientas de SAP 9.7 Técnicas de validación de modelos Capítulo 10. Implementación del KDD con herramientas de SAS e IBM 10.1 Etapas del KDD con SAS Enterprise Miner 10.2 SEMMA. Valoración e interpretación de modelos. El nodo regresión 10.3 IBM SPSS Modeler 10.4 Ejemplo de trabajo con IBM SPSS Modeler
- ISBN: 9788419034090
- Editorial: GARCETA GRUPO EDITORIAL
- Encuadernacion: Rústica
- Páginas: 470
- Fecha Publicación: 01/09/2022
- Nº Volúmenes: 1
- Idioma:
- Inicio /
- INFORMÁTICA /
- DATOS