1- Introducción.
1.1- ¿Qué es SAP HANNA?
SAP HANA es una tecnología nueva desarrollada por SAP en la cual en su núcleo usa nuevas técnicas denominadas “in-memory” para almacenar los datos, esta especialmente diseñado para el manejo de grandes cantidades de datos de las bases de datos.
Las Bases de datos comunes almacenan los datos de las tablas en filas, por ejemplo, todos los datos que describen una dirección se almacenan uno junto a la otro en la memoria. De forma que siempre y cuando las necesidades de acceso sea una única dirección la aplicación se ejecutará más rápidamente ya que todos los datos requeridos se almacenan de forma contigua.
Sin embargo, vamos a imaginar que la aplicación requiere un listado de cuantas de las direcciones almacenadas hay en concreto para un un país, ciudad o código postal. En este caso se tendría que buscar en toda la tabla, seleccionar cada fila, y comprobar si el país o la ciudad que son los requeridos, los que se están buscando en la consulta.
Como en “Todos” los dispositivos de almacenamiento masivo, como, discos duros, cintas, suelen tener lecturas mínimas bastantes grandes en comparación con los datos de interés, como por ejemplo 512 bytes para un disco duro, por lo que tendría que leer una o varias filas solo para comprobar un par de datos, “Brasil” o “San Francisco” por ejemplo. Las tablas a menudo contienen muchos campos, que son rara vez usados, como por ejemplo datos que relacionan otras tablas o campos que determinan otros campos según sus datos.
SAP HANA permite la lectura en de los datos deseados por la organización de una forma mas eficiente que la lectura de tablas formada por filas usando tablas formadas sólo por columnas. Además de la forma de almacenamiento común orientada a filas ahora se dispone de una disposición de datos orientada en columnas. Esto significa que una aplicación no tiene que esperar a la base de datos para recuperar los datos, no es necesario ya que todos los datos de una columna de la tabla se almacenan de una manera adyacente. Así. En nuestro ejemplo de una tabla de direcciones, la exploración por el campo o columna de la ciudad es mucho más rápido que con la distribución orientada al almacenamiento en filas.
Pero que ocurría si su sistema de base de datos almacenara en caché ya todos los datos en la memoria RAM, la memoria principal, accesible cerca de la CPU. ¿Una memoria de acceso orientada a un diseño en columnas, un acceso silencioso y alta velocidad? Las mediciones realizadas en SAP y en el Instituto Hasso Plattner en Potsdam han demostrado que la reorganización de los datos en la memoria en modo de columnas trae un aumento muy elevado de velocidad al acceder a un subconjunto de los datos en cada fila de la tabla. Como SAP HANA almacena todos los datos en la memoria, los discos duros son raramente utilizados en el sistema, sólo son necesarios para registrar los cambios en la base de datos de persistencia permanente.
SAP HANA conserva el número de cambios de nuestro conjunto de datos lo más pequeño posible para ir registrando todos los cambios del conjunto de datos original. Los datos no son modificados en la base de datos sino que son insertados o añadidos a tablas formadas por columnas. Esto proporciona varias ventajas, no sólo la velocidad de acceso. Como todos los datos antiguos se conservan, las aplicaciones pueden efectivamente hacer "un viaje en el tiempo" a través de los datos que proporcionan vistas de los datos, que ha sido cambiados con el tiempo.
Las aplicaciones de gestión de bases de datos , mantienen por separado dos capas en su arquitectura, una capa de aplicación y otra capa de base de datos. Esta separación obliga a hacer viajar los datos de la base de datos a la aplicación antes de que pueda ser analizada o modificada. A veces grandes cantidades de datos tienen que viajar de una capa a otra . SAP HANA evita este cuello de botella común, mediante una localización una localización de los datos mas precisa para las aplicaciones, que están en la propia base de datos. Para activar esta incorporación de la lógica de aplicación en la base de datos SAP ha inventado una extensión al estándar SQL (Structured Query Language) llamado SQLScript. SQLScript permite la programación de operaciones de los datos de una manera mas precisa que pueden ser ejecutados en la capa de base de datos. SQLScript. Le permite ampliar las consultas SQL que contienen cálculos a alto nivel ampliando así la capacidad de procesamiento de datos de la base de datos.
En este documento se explica cómo se puede hacer un uso eficiente del SQLScript para lograr un procesamiento mas preciso y rápido de los datos de nuestra base de datos SAP HANA.
1.2- Documentación relacionada.
SAP ofrece otros documentos relacionados en los que se cuentan con mas detalle las herramientas de las que disponemos los programadores, y los lenguajes de programación utilizados. Estos documentos incluyen:
SAP HANA Database – Administration Guide – Cómo utilizar el SAP HANA estudio y la forma de administrar la base de datos SAP HANA.
SAP HANA - Modeling Guide – Cómo utilizar el entorno de desarollo HANA para crear vistas analíticas OLAP y puntos de vista análiticas que se basan en los programas de SQLScript.
SAP HANA Database – SQL Reference Guide - (PDF)
SAP HANA Database – SQL Reference Guide (HTML) – Referencia completa para el lenguaje de consulta utilizado en SAP HANA.
SAP HANA Database – SQLScript Guide – Un tutorial sobre cómo programar en SQLScript y utilizar métodos y procedimientos de SAP HANA, incluyendo el uso de programas ABAP.
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.