UNIDAD 4 ACCESO A DATOS
INTRODUCCIÓN
En la actualidad los lenguajes de programación no traen incorporada
una base de datos, por tal motivo es necesario conectar el lenguaje de
programación con Sistema Gestor de Base de Datos (SGBD).
ODBC (Open Database Connectivity) es un estándar de acceso a bases
de datos, que permite mantener independencia entre los lenguajes de
programación, los sistemas de bases de datos (las bases de datos y su software
gestor), y los sistemas operativos.
La visualización es una herramienta para ayudar al análisis y no un
sustituto de la habilidad analítica. Tampoco es un sustituto de las
estadísticas, es más, el gráfico puede resaltar las diferencias o correlaciones
entre los puntos de datos.
El acceso a bases de datos es uno de los recursos más utilizados en
las páginas ASP, la facilidad con la que puede crear un sitio web dinámico
queda patente en este taller en el que aprenderá los conceptos básicos sobre
conexión a bases de datos.
Los sistemas de bases de datos más populares en la actualidad son
las bases de datos relacionales. SQL es el lenguaje estándar internacional que
se utiliza casi de manera universal con las bases de datos relacionales, para
realizar consultas (es decir, para solicitar información que cumpla con ciertos
criterios dados) y para manipular datos.
Puesto que muchas aplicaciones trabajan sobre bases de datos,
Microsoft decidió crear una tecnología de acceso a datos potente y fácil de
utilizar: ADO.NET
Modelo de objetos ADO.NET
● El modelo de objetos ADO.NET proporciona una API para acceder a
los sistemas de bases de datos mediante la programación. ADO.NET fue creado
para que .NET Framework sustituyera a la tecnología ActiveX Data Objects.
La clase DataSet incluye una colección DataTableCollectio de
objetos de tipo DataTable y la colección DataRelationCollection de objetosde
tipo DataRelation.
La clase DataTable incluye
las colecciones DataRowCollection, DataColumnCollection y ConstraintCollection
las cuales poseen los objetos DataRow (filas), DataColumn (columnas) y
Constraint (restricciones) respectivamente.
La clase DataRow incluye la
propiedad RowState que permite saber cuándo cambio una fila y de que modo,
alguno de los valores que puede tomar son:
➔Added
➔Deleted
➔Modified
➔Unchanged
4.2 CONEXIÓN A ORIGENES DE DATOS
La conexión de origen de datos especifica los parámetros necesarios
para conectarse a una base de datos, como la ubicación de la base de datos y la
duración del tiempo de espera. Estos parámetros forman una cadena de conexión
para el origen de datos.
Puede incluir información de autenticación para la base de datos en
la conexión de origen de datos mediante la creación de un inicio de sesión. Los
usuarios no necesitan introducir información de autenticación de la base de
datos cada vez que se utilice la conexión porque la información de
autenticación se cifra y se guarda en el servidor. El inicio de sesión
producido cuando se crea un origen de datos está disponible para el grupo
Todos. Más adelante, se podrá modificar quién puede utilizar el inicio de
sesión o crear más inicios de sesión.
Cada origen de datos puede tener una o varias conexiones físicas
con la base de datos.
Si tiene acceso a una conexión de origen de datos en un origen de
datos, se le solicitará que seleccione una conexión de origen de datos al abrir
el proyecto de IBM Cognos Framework Manager. Puede utilizar varias conexiones
de origen de datos en un solo origen de datos para facilitar la migración de un
entorno a otro y mantener la integridad de un proyecto
Deben definirse varias conexiones al mismo origen de datos en IBM
Cognos Administración. Si desea soportar varias conexiones para cada origen de
datos, borre los nombres de esquema y catálogo de origen de datos y cree una
conexión para cada base de datos en IBM Cognos Administración.
El nivel de aislamiento especifica cómo se gestionan las
transacciones que modifican la base de datos. De forma predeterminada, se
utiliza la pasarela de objetos predeterminada. No todos los tipos de bases de
datos soportan cada nivel de aislamiento. Algunos proveedores de base de datos
utilizan diferentes nombres para los niveles de aislamiento.
Las consultas que sean ejecutadas por informes y análisis están
destinadas a ser operaciones de sólo lectura. Las consultas se ejecutan con una
unidad de trabajo en el origen de datos como una transacción con un nivel de
aislamiento predeterminado o definido por el administrador. Los autores de
informes no deben suponer que las consultas que ejecutan procedimientos
almacenados confirman todos los datos escritos por el procedimiento. En algunos
entornos, los cambios realizados por un procedimiento pueden quedar confirmados
por las características de la base de datos. Un procedimiento almacenado
marcado con acceso de escritura en Framework Manager confirma los cambios pero
sólo se puede usar con Event Studio.
Los siguientes niveles se encuentran en orden creciente de
aislamiento:
Lectura no confirmada
Los cambios efectuados por otras transacciones están disponibles
inmediatamente para una transacción.
.
Lectura confirmada
Una transacción puede acceder sólo a filas confirmadas por otras
transacciones
Estabilidad del cursor
Otras transacciones no pueden actualizar la fila en la que se
posiciona una transacción.
Lectura reproducible
Las filas seleccionadas o actualizadas por una transacción no se
pueden cambiar por otra transacción hasta que ésta se complete.
Protección fantasma
Una transacción no puede acceder a las filas insertadas o
suprimidas desde el inicio de la transacción.
Serializable
Un conjunto de transacciones ejecutado simultáneamente produce el
mismo resultado que si se hubiese efectuado de manera secuencial.
4.3 MANIPULACION DE DATOS
Lenguaje de Manipulación de
Datos (Data Manipulation Language, DML) es un idioma
proporcionado por los sistemas gestores de bases de datos que permite
a los usuarios de la misma llevar a cabo las tareas de consulta o modificación
de los datos contenidos en las Bases de Datos del Sistema Gestor de Bases de
Datos. El lenguaje de manipulación de datos más popular hoy día es SQL,
usado para recuperar y manipular datos en una base de datos relacional.
Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u
otras.
Elementos del lenguaje de manipulación de
datos
Select, Insert, Delete y Update
Clasificación de los DML
Se clasifican en dos grandes grupos:
lenguajes de consulta procedimentales
Lenguajes procedimentales. En este tipo de
lenguaje el usuario da instrucciones al sistema para que realice una serie de
procedimientos u operaciones en la base de datos para calcular un resultado
final.
lenguajes de consulta no procedimentales
En los lenguajes no procedimentales el
usuario describe la información deseada sin un procedimiento específico para
obtener esa información.
Lenguaje de manipulación de datos (DML)
Un lenguaje de manipulación de datos (Data
Manipulation Language, o DML en inglés) es un lenguaje proporcionado por el
sistema de gestión de base de datos que permite a los usuarios llevar a cabo
las tareas de consulta o manipulación de los datos, organizados por el modelo
de datos adecuado.
El lenguaje de manipulación de datos más popular hoy día es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras.
INSERT
Una sentencia INSERT de SQL agrega uno o más registros a una (y sólo una) tabla en una base de datos relacional.
Ejemplo 1 (inserto valores alumno pepe en la materia spd2 a la tabla cursada):
INSERT INTO ''cursada'' (''alumno'', ''materia'') VALUES (''pepe'', ''spd2'')
UPDATE
Una sentencia UPDATE de SQL es utilizada para modificar los valores de un conjunto de registros existentes en una tabla.
Ejemplo 1 (modifico la materia donde el alumno sea pepe):
UPDATE ''cursada'' SET ''materia''= ''spd3'' WHERE ''alumno''= ''pepe''
DELETE
Una sentencia DELETE de SQL borra uno o más registros existentes en una tabla.
Ejemplo 1 (borro todos los valores de las columnas alumno y materia donde la materia sea spd2):
DELETE FROM ''cursada'' WHERE ''materia''= ''spd2''
El lenguaje de manipulación de datos más popular hoy día es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras.
INSERT
Una sentencia INSERT de SQL agrega uno o más registros a una (y sólo una) tabla en una base de datos relacional.
Ejemplo 1 (inserto valores alumno pepe en la materia spd2 a la tabla cursada):
INSERT INTO ''cursada'' (''alumno'', ''materia'') VALUES (''pepe'', ''spd2'')
UPDATE
Una sentencia UPDATE de SQL es utilizada para modificar los valores de un conjunto de registros existentes en una tabla.
Ejemplo 1 (modifico la materia donde el alumno sea pepe):
UPDATE ''cursada'' SET ''materia''= ''spd3'' WHERE ''alumno''= ''pepe''
DELETE
Una sentencia DELETE de SQL borra uno o más registros existentes en una tabla.
Ejemplo 1 (borro todos los valores de las columnas alumno y materia donde la materia sea spd2):
DELETE FROM ''cursada'' WHERE ''materia''= ''spd2''
SELECT
|
Palabra clave que indica que la sentencia
de SQL que queremos ejecutar es de selección.
|
ALL
|
Indica que queremos seleccionar todos los
valores. Es el valor por defecto y no suele especificarse casi nunca.
|
DISTINCT
|
Indica que queremos seleccionar sólo los
valores distintos.
|
FROM
|
Indica la tabla (o tablas) desde la que
queremos recuperar los datos. En el caso de que exista más de una tabla se
denomina a la consulta "consulta combinada" o "join". En
las consultas combinadas es necesario aplicar una condición de combinación a
través de una cláusula WHERE.
|
WHERE
|
Especifica una condición que debe
cumplirse para que los datos sean devueltos por la consulta. Admite los
operadores lógicos AND y OR.
|
GROUP BY
|
Especifica la agrupación que se da a los
datos. Se usa siempre en combinación con funciones agregadas.
|
HAVING
|
Especifica una condición que debe
cumplirse para que los datos sean devueltos por la consulta. Su
funcionamiento es similar al de WHERE pero aplicado al conjunto de
resultados devueltos por la consulta. Debe aplicarse siempre junto a GROUP
BY y la condición debe estar referida a los campos contenidos en ella.
|
ORDER BY
|
Presenta el resultado ordenado por las
columnas indicadas. El orden puede expresarse con ASC (orden
ascendente) y DESC (orden descendente). El valor predeterminado
es ASC.
|
4.4 VISUALIZACION DE DATOS
La visualización de datos es la representación gráfica de
información y datos. Al utilizar elementos visuales como cuadros, gráficos y
mapas, las herramientas de visualización de datos proporcionan una manera
accesible de ver y comprender tendencias, valores atípicos y patrones en los
datos.
En el mundo del big data, las herramientas y tecnologías de
visualización de datos son esenciales para analizar grandes cantidades de
información y tomar decisiones basadas en los datos.
La visualización es una herramienta para ayudar al análisis y no un
sustituto de la habilidad analítica. Tampoco es un sustituto de las
estadísticas, es más, el gráfico puede resaltar las diferencias o correlaciones
entre los puntos de datos. Disponer de una buena herramienta no es suficiente;
como indica Enrique Rodríguez también es necesario que se disponga de
conocimientos de negocio, estadística, teoría del color, composición
gráfica, story-telling e inteligencia emocional.
Las visualizaciones de datos, y más si estas se basan en herramientas
gratuitas online con plantillas, no hacen todo el trabajo de forma automática.
El éxito de una visualización se basa, entre otras variables, en la comprensión
de nuestros datos que por lo general requiere una combinación de habilidades de
análisis, estadística y experiencia en la limpieza de datos. No hay todavía un
perfil determinado de visualizadores de datos; hoy en día encontramos desde
diseñadores hasta ingenieros, pasando por psicólogos, periodistas y
profesionales de la comunicación y el marketing en general.
Según Pere Rovira, la visualización de datos nos ayuda a elaborar
mejores cuadros de mando, y en general a comunicar el significado de los datos
de la manera más adecuada para cada interlocutor. Así mismo, en ámbitos como
las redes sociales, donde se tratan grandes cantidades de datos, cree que esta
visualización nos ayuda a generar conocimiento.
Existen multitud de herramientas útiles para llevar a cabo el
proceso de visualización de datos. Entre ellas, se pueden destacar las
siguientes:
LightningChart
es un complemento para Microsoft Visual Studio, se utiliza para implementar
visualizaciones de datos en aplicaciones desarrolladas en WPF y Windows Forms.
Popular por su fluidez soporta gráficos con más de mil
millones de puntos de datos al mismo tiempo, actualizados en tiempo real.Posee una librería con más de 100 tipos
de gráficos diferentes y personalizables, en 2D y 3D. Sus componentes para la
visualización de datos son utilizados en programas y aparatos en todo tipo de
campos e industrias.
SAS Visual Analytics proporciona mayores capacidades
analíticas a partir de cualquier cantidad de datos, permitiendo llevar a cabo
análisis de datos exploratorios. Sin necesidad de crear subconjuntos o muestras
de datos. Gracias a sus funciones high-performance, puede utilizar todos sus
datos, volúmenes grandes o pequeños, para obtener conocimientos precisos de
forma mucho más rápida de lo que era posible hasta ahora.
Tableau Software
es una de las herramientas de visualización
de datos más utilizadas actualmente por los usuarios, debido en esencia a la
facilidad de uso de todas sus funciones. Aunque en principio existe una versión
de pago, se pude utilizar también de forma gratuita obteniendo gráficos
profesionales sin la necesidad de pagar, pero con limitaciones a la hora de
introducir un exceso de dato
QlikView
es bastante fácil de manejar y permite utilizar e
introducir gran cantidad de datos, que pueden proceder de diferentes formatos.
Una vez introducidos se pueden manipular y organizar libremente según como se
quieran presentar, para conseguir el objetivo final, que es obtener una forma
atractiva de visualizar cantidades de datos.
Gephi
Es un programa de código abierto
para la visualización y consulta de
grafos. Además, Gephi permite manejar grafos grandes con buena calidad, algo no
común en este tipo de herramientas.
Gephi da la posibilidad al usuario de agrupar
nodos del grafo, colorearlos, dotarlos de tamaños proporcionales a indicadores
Many Eyes: Es una herramienta gratuita creada por la empresa
IBM que ofrece 2 posibilidades: navegar entre datos ya existentes o usar los
creados por uno mismo
Comentarios
Publicar un comentario