Sistemas de Big Data

Sistemas de Big Data

Pérez López, César

40,00 €(IVA inc.)

El libro está dirigido tanto a alumnos que siguen un Curso de especialización en Inteligencia Artificial y Big Data como a profesionales del sector. Este texto comienza tratando la aplicación de las técnicas de integración, procesamiento y análisis de la información, con especial énfasis en las técnicas de tratamiento de grandes datos (Big Data) incluyendo los datos estructurados y no estructurados, el procesamiento en tiempo real, los costes y calidad asociados y el modelado, razonamiento y resolución de problemas en grandes datos. A continuación se aborda la Matemática Discreta como parte fundamental para el estudio de las ciencias de la computación. Se ilustran los conceptos con ejemplos y aplicaciones tratados con el software Maple, que posee un lenguaje de programación estructurada específico para la teoría de números, teoría de grafos, teoría de conjuntos, lógica matemática, lógica algorítmica y otras tareas de la Matemática Discreta. Maple admite además la programación funcional. Asimismo, se tratan las técnicas de representación de la información y las estructuras de datos, ya ilustradas anteriormente con Maple y potenciadas con MATLAB. También se presentan las principales librerías de diseño visual para Big data como Tableau, Plotly, C3, NVD3 y especialmente MATLAB. Precisamente con MATLAB, se presenta gran variedad de opciones de visualización de datos. Este software admite el trabajo con grandes datos a través de la herramienta Parallel Computing Toolbox. A continuación se abordan los principales métodos y algoritmos en la Minería de Datos. Se desarrollan ejemplos prácticos para las metodologías SEMMA de SAS y CRISP-DM de IBM, que son las más importantes en el campo del Data Mining. Los paquetes de software visual utilizados son SAS Enterprise Miner e IBM SPSS Modeler. Más adelante se trata la gestión y almacenamiento de datos presentando las tecnologías y herramientas para la importación y la integración de datos. También se introducen los lenguajes de programación de R y Python, dadas sus múltiples aplicaciones en Big Data. Finalmente se profundiza en la aplicación de herramientas para la visualización de datos estructurados y no estructurados como Qlik, Tableau, Power BI, Pentaho, MicroStrategy y otras. Se explica el uso de la inteligencia artificial en el análisis de datos a través de clústers de máquinas y utilizando información distribuida y redundante. Por último, se presentan las tendencias de la visualización de datos. CONTENIDO Introducción al Big Data Capítulo 1. Aplicación de técnicas de integración, procesamiento y análisis de la información 1.1 Introducción a las técnicas integradas de procesamiento y análisis de la información 1.2 Técnicas modernas de tratamiento de datos: Big Data, Data Mining y Business Intelligence 1.3 Técnicas y procesos de extracción de la información de los datos 1.4 Herramientas de extracción de datos: datos no estructurados y estructurados 1.5 Modelado, razonamiento y resolución de problemas 1.6 Análisis en tiempo real 1.7 Costes y calidad asociados al proceso de análisis de la información Capítulo 2. Matemática discreta básica. Teoría de números, combinatoria, teoría de grupos, lógica matemática y teoría de conjuntos. Ejercicios con maple 2.1 Introducción a la matemática discreta 2.2 Matemática discreta a través de maple: teoría de números 2.3 Combinatoria 2.4 Lógica matemática 2.5 Teoría de conjuntos Capítulo 3. Matemática discreta. Probabilidad, teoría de grafos y programación funcional. Ejemplos con maple 3.1 Probabilidad. Regla de Laplace 3.2 Teoría de grafos. Conceptos generales 3.3 El lenguaje de Maple: operadores, funciones y programación funcional Capítulo 4. Representación de la información y estructuración de datos. Ejemplos con Matlab 4.1 Técnicas de representación de la información 4.2 Librerías de diseño visual para Big Data 4.3 Estructuras de datos 4.4 Representación de la información y estructuras de datos en Matlab Capítulo 5. Cuadros de mando en entornos computacionales. El entorno de trabajo de SAS Visual Analytics 5.1 Cuadros de mando. Fundamentos y métricas 5.2 Cuadros de mando con SAS Visual Analytics 5.3 Primer vistazo a la página de inicio de SAS Visual Analytics 5.4 Acceso a datos 5.5 Data Builder (generador de datos) 5.6 SAS Visual Analytics Explorer 5.7 Creando medidas agregadas Capítulo 6. Cuadros de mando. Visualizaciones en SAS Visual Analytics 6.1 Introducción a las visualizaciones 6.2 Trabajando con visualizaciones 6.3 Trabajando con gráficos automáticos 6.4 Trabajando con gráficos de barras 6.5 Trabajando con gráficos de líneas 6.6 Predicción 6.7 Trabajando con tablas 6.8 Trabajando con tablas cruzadas 6.9 Administrando filas y columnas en una tabla de referencias cruzadas 6.10 Crear una jerarquía de un de tabla de referencias cruzadas 6.11 trabajando con gráficos de dispersión 6.12 Aplicando análisis de datos 6.13 Trabajando con gráficos de burbuja 6.14 Trabajando con diagramas de red 6.15 Trabajando con histogramas 6.16 Trabajando con gráficos de caja y bigotes 6.17 Trabajando con mapas de calor 6.18 Trabajando con mapas geográficos (geo mapas) 6.19 Trabajando con los gráficos de mosaicos (Treemaps) 6.20 Trabajando con matrices de correlación 6.21 Trabajando con árboles de decisión 6.23 Informes. SAS Visual Analytics Designer Capítulo 7. Métodos y algoritmos de la minería de datos. Modelos Semma y CRISP-DM. SAS Enterprise Miner 7.1 Analytics y técnicas de minería de datos 7.2 Metodología Semma. Técnicas de minería con SAS Enterprise Miner 7.3 Semma. Valoración e interpretación de modelos. El nodo regresión Capítulo 8. Metodología CRISP-DM. Minería de datos con IBM SPSS Modeler 8.1 IBM SPSS MODELER 8.2 Ejemplo de trabajo con IBM SPSS Modeler 8.3 Nodos de orígenes de datos 8.4 Nodos de operaciones con registros 8.5 Nodos de operaciones con campos 8.6 Nodos para gráficos 8.7 Nodos para modelado 8.8 Nodos de resultado 8.9 Nodos de exportación 8.10 IBM SPSS Modeler e IBM SPSS Statistics 8.11 Modelización automática en IBM SPSS Modeler. Valoración de modelos 8.12 El nodo clasificador automático de IBM SPSS Modeler 8.13 El algoritmo autonumérico de IBM SPSS Modeler 8.14 El algoritmo autoconglomeración de IBM SPSS Modeler Capítulo 9. Gestión y almacenamiento de datos. Importación e integración de datos. 9.1 Introducción al almacenamiento de datos 9.2 Gestión del almacenamiento 9.3 Importación datos: Flume y Sqoop 9.4 Técnicas de integración de datos 9.5 Tecnologías de integración de datos Capítulo 10. Programación con R 10.1 El software R 10.2 Entorno de trabajo de R. R-Studio 10.3 Instalación de paquetes adicionales 10.4 Importando y exportando datos 10.5 Números y operaciones aritméticas 10.6 Números enteros y funciones de variable entera 10.7 Números reales y funciones de variable real 10.8 Estructuras en R 10.9 Operadores 10.10 Funciones de información 10.11 Funciones de conversión 10.12 Funciones de cadena 10.13 Estructuras especiales 10.14 Funciones 10.15 Control de flujo Capítulo 11. Programación con Python 11.1 Introducción a Python. Elementos del lenguaje 11.2 Módulos de Python 11.3 Programas ejecutables 11.4 Uso de funciones con iterables 11.5 Entrada de datos en programas 11.6 Control de flujo 11.7 Módulos, paquetes y la librería estándar de Python 11.8 Creación y administración de ficheros 11.9 Cálculo numérico con Numpy 11.10 Representación gráfica de funciones y datos. Módulo Matplotlib Capítulo 12. Herramientas para visualización de datos 12.1 Datos no estructurados 12.2 Inteligencia artificial en el análisis de datos. Redes neuronales y lógica difusa 12.3 Clúster de máquinas 12.4 Herramientas de visualización de datos 12.5 Tendencias de la visualización de datos

  • ISBN: 9788419034083
  • Editorial: GARCETA GRUPO EDITORIAL
  • Encuadernacion: Rústica
  • Páginas: 600
  • Fecha Publicación: 01/09/2022
  • Nº Volúmenes: 1
  • Idioma: