UNIDAD 4 ACCESO A DATOS




INTRODUCCIÓN

En la actualidad los lenguajes de programación no traen incorporada una base de datos, por tal motivo es necesario conectar el lenguaje de programación con Sistema Gestor de Base de Datos (SGBD).
ODBC (Open Database Connectivity) es un estándar de acceso a bases de datos, que permite mantener independencia entre los lenguajes de programación, los sistemas de bases de datos (las bases de datos y su software gestor), y los sistemas operativos.
La visualización es una herramienta para ayudar al análisis y no un sustituto de la habilidad analítica. Tampoco es un sustituto de las estadísticas, es más, el gráfico puede resaltar las diferencias o correlaciones entre los puntos de datos.
El acceso a bases de datos es uno de los recursos más utilizados en las páginas ASP, la facilidad con la que puede crear un sitio web dinámico queda patente en este taller en el que aprenderá los conceptos básicos sobre conexión a bases de datos.
Los sistemas de bases de datos más populares en la actualidad son las bases de datos relacionales. SQL es el lenguaje estándar internacional que se utiliza casi de manera universal con las bases de datos relacionales, para realizar consultas (es decir, para solicitar información que cumpla con ciertos criterios dados) y para manipular datos.
Puesto que muchas aplicaciones trabajan sobre bases de datos, Microsoft decidió crear una tecnología de acceso a datos potente y fácil de utilizar: ADO.NET
Modelo de objetos ADO.NET
● El modelo de objetos ADO.NET proporciona una API para acceder a los sistemas de bases de datos mediante la programación. ADO.NET fue creado para que .NET Framework sustituyera a la tecnología ActiveX Data Objects.

La clase DataSet incluye una colección DataTableCollectio de objetos de tipo DataTable y la colección DataRelationCollection de objetosde tipo DataRelation.
 La clase DataTable incluye las colecciones DataRowCollection, DataColumnCollection y ConstraintCollection las cuales poseen los objetos DataRow (filas), DataColumn (columnas) y Constraint (restricciones) respectivamente.
 La clase DataRow incluye la propiedad RowState que permite saber cuándo cambio una fila y de que modo, alguno de los valores que puede tomar son:
 Added
Deleted
Modified
Unchanged






4.2 CONEXIÓN A ORIGENES DE DATOS

La conexión de origen de datos especifica los parámetros necesarios para conectarse a una base de datos, como la ubicación de la base de datos y la duración del tiempo de espera. Estos parámetros forman una cadena de conexión para el origen de datos.
Puede incluir información de autenticación para la base de datos en la conexión de origen de datos mediante la creación de un inicio de sesión. Los usuarios no necesitan introducir información de autenticación de la base de datos cada vez que se utilice la conexión porque la información de autenticación se cifra y se guarda en el servidor. El inicio de sesión producido cuando se crea un origen de datos está disponible para el grupo Todos. Más adelante, se podrá modificar quién puede utilizar el inicio de sesión o crear más inicios de sesión.

Cada origen de datos puede tener una o varias conexiones físicas con la base de datos.
Si tiene acceso a una conexión de origen de datos en un origen de datos, se le solicitará que seleccione una conexión de origen de datos al abrir el proyecto de IBM Cognos Framework Manager. Puede utilizar varias conexiones de origen de datos en un solo origen de datos para facilitar la migración de un entorno a otro y mantener la integridad de un proyecto
Deben definirse varias conexiones al mismo origen de datos en IBM Cognos Administración. Si desea soportar varias conexiones para cada origen de datos, borre los nombres de esquema y catálogo de origen de datos y cree una conexión para cada base de datos en IBM Cognos Administración.



El nivel de aislamiento especifica cómo se gestionan las transacciones que modifican la base de datos. De forma predeterminada, se utiliza la pasarela de objetos predeterminada. No todos los tipos de bases de datos soportan cada nivel de aislamiento. Algunos proveedores de base de datos utilizan diferentes nombres para los niveles de aislamiento.
Las consultas que sean ejecutadas por informes y análisis están destinadas a ser operaciones de sólo lectura. Las consultas se ejecutan con una unidad de trabajo en el origen de datos como una transacción con un nivel de aislamiento predeterminado o definido por el administrador. Los autores de informes no deben suponer que las consultas que ejecutan procedimientos almacenados confirman todos los datos escritos por el procedimiento. En algunos entornos, los cambios realizados por un procedimiento pueden quedar confirmados por las características de la base de datos. Un procedimiento almacenado marcado con acceso de escritura en Framework Manager confirma los cambios pero sólo se puede usar con Event Studio.

Los siguientes niveles se encuentran en orden creciente de aislamiento:
Lectura no confirmada
Los cambios efectuados por otras transacciones están disponibles inmediatamente para una transacción.
.
Lectura confirmada
Una transacción puede acceder sólo a filas confirmadas por otras transacciones


Estabilidad del cursor
Otras transacciones no pueden actualizar la fila en la que se posiciona una transacción.

Lectura reproducible
Las filas seleccionadas o actualizadas por una transacción no se pueden cambiar por otra transacción hasta que ésta se complete.

Protección fantasma
Una transacción no puede acceder a las filas insertadas o suprimidas desde el inicio de la transacción.
Serializable
Un conjunto de transacciones ejecutado simultáneamente produce el mismo resultado que si se hubiese efectuado de manera secuencial.





4.3 MANIPULACION DE DATOS

Lenguaje de Manipulación de Datos (Data Manipulation Language, DML) es un idioma proporcionado por los sistemas gestores de bases de datos que permite a los usuarios de la misma llevar a cabo las tareas de consulta o modificación de los datos contenidos en las Bases de Datos del Sistema Gestor de Bases de Datos. El lenguaje de manipulación de datos más popular hoy día es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras.

Elementos del lenguaje de manipulación de datos
Select, Insert, Delete y Update
Clasificación de los DML
Se clasifican en dos grandes grupos:
lenguajes de consulta procedimentales
Lenguajes procedimentales. En este tipo de lenguaje el usuario da instrucciones al sistema para que realice una serie de procedimientos u operaciones en la base de datos para calcular un resultado final.
lenguajes de consulta no procedimentales
En los lenguajes no procedimentales el usuario describe la información deseada sin un procedimiento específico para obtener esa información.

Lenguaje de manipulación de datos (DML)
Un lenguaje de manipulación de datos (Data Manipulation Language, o DML en inglés) es un lenguaje proporcionado por el sistema de gestión de base de datos que permite a los usuarios llevar a cabo las tareas de consulta o manipulación de los datos, organizados por el modelo de datos adecuado.

El lenguaje de manipulación de datos más popular hoy día es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras.

INSERT

Una sentencia INSERT de SQL agrega uno o más registros a una (y sólo una) tabla en una base de datos relacional.


Ejemplo 1 (inserto valores alumno pepe en la materia spd2 a la tabla cursada):

INSERT INTO ''cursada'' (''alumno'', ''materia'') VALUES (''pepe'', ''spd2'')


UPDATE

Una sentencia UPDATE de SQL es utilizada para modificar los valores de un conjunto de registros existentes en una tabla.

Ejemplo 1 (modifico la materia donde  el alumno sea pepe):

UPDATE ''cursada'' SET ''materia''= ''spd3'' WHERE ''alumno''= ''pepe''

 DELETE

Una sentencia DELETE de SQL borra uno o más registros existentes en una tabla.

Ejemplo 1 (borro todos los valores de las columnas alumno y materia donde la materia sea spd2):

DELETE FROM ''cursada'' WHERE ''materia''= ''spd2''


SELECT
Palabra clave que indica que la sentencia de SQL que queremos ejecutar es de selección.
ALL
Indica que queremos seleccionar todos los valores. Es el valor por defecto y no suele especificarse casi nunca.
DISTINCT
Indica que queremos seleccionar sólo los valores distintos.
FROM
Indica la tabla (o tablas) desde la que queremos recuperar los datos. En el caso de que exista más de una tabla se denomina a la consulta "consulta combinada" o "join". En las consultas combinadas es necesario aplicar una condición de combinación a través de una cláusula WHERE.
WHERE
Especifica una condición que debe cumplirse para que los datos sean devueltos por la consulta. Admite los operadores lógicos AND y OR.
GROUP BY
Especifica la agrupación que se da a los datos. Se usa siempre en combinación con funciones agregadas.
HAVING
Especifica una condición que debe cumplirse para que los datos sean devueltos por la consulta. Su funcionamiento es similar al de WHERE pero aplicado al conjunto de resultados devueltos por la consulta. Debe aplicarse siempre junto a GROUP BY y la condición debe estar referida a los campos contenidos en ella.
ORDER BY
Presenta el resultado ordenado por las columnas indicadas. El orden puede expresarse con ASC (orden ascendente) y DESC (orden descendente). El valor predeterminado es ASC.





4.4 VISUALIZACION DE DATOS


La visualización de datos es la representación gráfica de información y datos. Al utilizar elementos visuales como cuadros, gráficos y mapas, las herramientas de visualización de datos proporcionan una manera accesible de ver y comprender tendencias, valores atípicos y patrones en los datos.
En el mundo del big data, las herramientas y tecnologías de visualización de datos son esenciales para analizar grandes cantidades de información y tomar decisiones basadas en los datos.
La visualización es una herramienta para ayudar al análisis y no un sustituto de la habilidad analítica. Tampoco es un sustituto de las estadísticas, es más, el gráfico puede resaltar las diferencias o correlaciones entre los puntos de datos. Disponer de una buena herramienta no es suficiente; como indica Enrique Rodríguez también es necesario que se disponga de conocimientos de negocio, estadística, teoría del color, composición gráfica, story-telling e inteligencia emocional.
Las visualizaciones de datos, y más si estas se basan en herramientas gratuitas online con plantillas, no hacen todo el trabajo de forma automática. El éxito de una visualización se basa, entre otras variables, en la comprensión de nuestros datos que por lo general requiere una combinación de habilidades de análisis, estadística y experiencia en la limpieza de datos. No hay todavía un perfil determinado de visualizadores de datos; hoy en día encontramos desde diseñadores hasta ingenieros, pasando por psicólogos, periodistas y profesionales de la comunicación y el marketing en general.
Según Pere Rovira, la visualización de datos nos ayuda a elaborar mejores cuadros de mando, y en general a comunicar el significado de los datos de la manera más adecuada para cada interlocutor. Así mismo, en ámbitos como las redes sociales, donde se tratan grandes cantidades de datos, cree que esta visualización nos ayuda a generar conocimiento.


Existen multitud de herramientas útiles para llevar a cabo el proceso de visualización de datos. Entre ellas, se pueden destacar las siguientes:


LightningChart 
es un complemento para Microsoft Visual Studio, se utiliza para implementar visualizaciones de datos en aplicaciones desarrolladas en WPF y Windows Forms. Popular por su fluidez soporta gráficos con más de mil millones de puntos de datos al mismo tiempo, actualizados en tiempo real.Posee una librería con más de 100 tipos de gráficos diferentes y personalizables, en 2D y 3D. Sus componentes para la visualización de datos son utilizados en programas y aparatos en todo tipo de campos e industrias.
SAS Visual Analytics proporciona mayores capacidades analíticas a partir de cualquier cantidad de datos, permitiendo llevar a cabo análisis de datos exploratorios. Sin necesidad de crear subconjuntos o muestras de datos. Gracias a sus funciones high-performance, puede utilizar todos sus datos, volúmenes grandes o pequeños, para obtener conocimientos precisos de forma mucho más rápida de lo que era posible hasta ahora.
Tableau Software 
es una de las herramientas de visualización de datos más utilizadas actualmente por los usuarios, debido en esencia a la facilidad de uso de todas sus funciones. Aunque en principio existe una versión de pago, se pude utilizar también de forma gratuita obteniendo gráficos profesionales sin la necesidad de pagar, pero con limitaciones a la hora de introducir un exceso de dato
QlikView 
es bastante fácil de manejar y permite utilizar e introducir gran cantidad de datos, que pueden proceder de diferentes formatos. Una vez introducidos se pueden manipular y organizar libremente según como se quieran presentar, para conseguir el objetivo final, que es obtener una forma atractiva de visualizar cantidades de datos. 
Gephi
Es un programa de código abierto
para la visualización y consulta de grafos. Además, Gephi permite manejar grafos grandes con buena calidad, algo no común en este tipo de herramientas. 

Gephi da la posibilidad al usuario de agrupar nodos del grafo, colorearlos, dotarlos de tamaños proporcionales a indicadores

Many Eyes: Es una herramienta gratuita creada por la empresa IBM que ofrece 2 posibilidades: navegar entre datos ya existentes o usar los creados por uno mismo





Comentarios

Entradas populares