Introduccion a BD






¿Que es una base de datos?


Es un conjunto de información pertenecientes a un mismo contexto y almacenado sistemáticamente para su posterior uso. En este sentido una biblioteca puede considerarse una base de datos por que esta compuesta en su mayoría por documentos y textos impresos en papel indexados para su consulta.


Diferencia entre dato e información

Los datos son una representación simbólica de alguna situación o conocimiento mientras que la información es el conjunto de datos los cuales son procesados, para que de esta manera puedan proveer un mensaje que contribuya a la toma de decisión a la hora de resolver un problema



12 reglas de Codd y para que sirven

Las 12 reglas de Codd son un sistema de reglas (numeradas del 0 al 12) propuestas por Edgar F. Cood, del modelo relacional para las bases de datos, diseñado para definir que requiere un sistema de administración de base de datos.

Reglas

  • Regla 0: Regla de fundación. Cualquier sistema que se proclame como relacional, debe ser capaz de gestionar sus bases de datos enteramente mediante sus capacidades relacionales
  • Regla 1: Regla de la información. Toda la información en la base de datos es representada unidireccionalmente por valores en posiciones de las columnas dentro de filas  de tablas. Toda la información en una base de datos relacional se representa explicitamente en el nivel lógico exactamente de una manera: con valores en tablas.
  • Regla 2: Regla del acceso garantizado. Todos los datos deben ser accesibles sin ambiguedad. Esta regla es escencialmente una nueva exposicion del requisito fundamental para las llaves primarias. Dice que cada valor escalar individual en la base de datos debe ser logicamente direccionable especificando el nombre de la tabla, la columna que lo contiene y la llave primaria.
  • Regla 3: Regla del tratamiento sistemático de valores nulos. El sistema de gestión de base de datos debe permitir que haya campos nulos. Debe tener una representación de la "Información que falta y de la información inaplicable" que sea sistemática y distinta a todos los valores regulares.
  • Regla 4: Catalogo dinámico en linea basado en el modelo relacional. El sistema debe soportar un catalogo en linea, el catalogo relacional, que da acceso a la estructura de la base de datos y que debe ser accesible a los usuarios autorizados.
  • Regla 5: Regla comprensiva del sublenguaje de los datos. El sistema debe soportar por lo menos un lenguaje relacional que: 1.Tenga una sintaxis lineal, 2.Puede ser utilizado de manera interactiva, 3.Tenga soporte de operaciones de definición de datos, operaciones de manipulación de datos, de control de seguridad e integridad y operaciones de administración de transacciones.
  • Regla 6: Regla de actualización de vistas. Todas las vistas que son teóricamente actualizables deben ser actualizadas por el sistema.
  • Regla 7: Alto nivel de inserción, actualización y borrado. El sistema debe permitir la manipulación de alto nivel en los datos, es decir, sobre conjuntos de tuplas. Esto significa que los datos no solo se pueden recuperar de una base de datos relacional a partir de filas múltiples y/o de tablas múltiples, sino que también pueden realizarse inserciones, actualización y borrados sobre varias tuplas y/o tablas al mismo tiempo y no solo sobre registros individuales.
  • Regla 8: Independencia física de los datos. Los programas de aplicación y actividades del terminal permanecen inalterados a nivel lógico aunque realicen cambios en las representaciones de almacenamiento o métodos de acceso.
  • Regla 9: Independencia lógica de los datos. Los programas de aplicación y actividades del terminal permanecen inalterados a nivel lógico aunque se realicen cambios a las tablas base que preserven la información. La independencia de datos lógica es mas difícil de lograr que la independencia física de datos.
  • Regla 10: Independencia de la integridad. Las restricciones de integridad se deben especificar por separado de los programas de aplicación y almacenarse en la base de datos. Debe ser posible cambiar estas restricciones sin afectar innecesariamente a las aplicaciones existentes.
  • Regla 11: Independencia de la distribución. La distribución de porciones de base de datos en distintas localizaciones debe ser invisible a los usuarios de la base de datos. Los usos existentes deben continuar funcionando con éxito.
  • Regla 12: La regla de la no subversión. Si el sistema proporciona una interfaz de bajo nivel de registro, aparte de una interfaz relacional, esa interfaz de bajo nivel no debe permitir su utilización para subvertir el sistema. Por ejemplo para sortear las reglas de seguridad relacional o las restricciones de integridad. Esto es debido a que algunos sistemas no relacionales previamente existentes se les añadió una interfaz relacional pero, al mantener la interfaz nativa. seguía existiendo la posibilidad de trabajar no relacionalmente.


¿Que es un motor de base de datos?

 Motor de base de datos es el servicio principal para almacenar, procesar y proteger los datos. El motor de base de datos proporciona acceso controlado y procesamiento de transacciones rápido para cumplir con los requisitos de las aplicaciones consumidoras de datos mas exigentes de su empresa.




¿Que es un SGBD?

Un sistema gestor de base de datos (SGBD) es un conjunto de programas que permiten el almacenamiento, modificación y extracción de la información en una base de datos. Los usuarios pueden acceder a la información usando herramientas especificas de consulta y de generación de informes, o bien mediante aplicaciones al efecto.



Bases de datos mas utilizadas

Oracle: Este tipo de sistema de gesiton, es la base de datos relacional que tiene mayor fiabilidad y es el que mas se usa. Su desarrollo data de 1977 y es propiedad de Oracle Coporation. Se construyo en un marco en el cual podemos acceder de forma directa a los objetos mediante el lenguaje de consulta SQL.

SQL Server: Uno de los sistemas que hace la competencia de forma directa a Oracle, es el SQL Server del gigante de Microsoft. Tanto este ultimo como Oracle, son los que cuentan con una mayor cuota de mercado en el sector de las bases de datos.



Clasificación de las bases de datos según su variabilidad

Bases de datos estáticas

Estas son bases de datos de solo lectura, utilizadas primordialmente para almacenar datos históricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a través del tiempo, realizar proyecciones y tomar decisiones.

Bases de datos dinámicas

Estas son las bases de datos donde la información almacenada se modifica con el tiempo, permitiendo operaciones como actualización, borrado y adición de datos ademas de las operaciones fundamentales de consulta.

 


Modelos de bases de datos

Un modelo de base de datos es un tipo de modelo de datos que determina la estructura logica de una base de datos y de manera fundamental determina el modo de almacenar, organizar y manipular los datos.

Modelo Jerárquico

Un modelo de datos jerárquico es un modelo de datos en el cual los datos son organizados en una estructura parecida a un árbol. La estructura permite a la información que se repite y usa relaciones padre/hijo: cada padre puede tener muchos hijos pero cada hijo solo tiene un padre.


Modelo en red

Una base de datos de red es una base de datos conformada por una colección o set de registros, los cuales están conectados entre si por medio de enlaces en una red.


Modelo documental

Una base de datos documental esta constituida por un conjunto de programas que almacenan. recuperan y gestionan datos de documentos o datos de algún modo estructurados. Este tipo de bases de datos constituyen una de las principales subcategorias dentro de las denominadas bases de datos NoSQL.


Modelo relacional

El modelo relacional, para el modelado y la gestión de bases de datos, es un modelo de datos basado en la lógica de predicados y en la teoría de conjuntos.


Orientado a objetos

En una base de datos orientada a objetos, la información se representa mediante objetos como los presentes en la programación orientada a objetos. Cuando se integra las caracteristicas de una base de datos con las de un lenguaje de programacion orientado a objetos el resultado es un sistema gestor de una base de datos orientada a objetos (ODBMS, object database management system).




¿Que es una relación y que tipos de relaciones existen?

En bases de datos relacionales, una relación o vinculo entre dos o mas entidades describe alguna interacción entre las mismas.

Las relaciones evitan redundancia de datos guardados en las tablas.


Tipos de relaciones

1 a 1

Aparece cuando un registro de la tabla A solo puede relacionarse con 1 registro de la tabla B. Este modelo aparece en relaciones de tipo exclusivo, como por ejemplo Países-Banderas, ya que cada país tiene una única bandera oficial, y cada bandera solo puede pertenecer a un país.

relacion 1 a 1 mer

1 a varios

En este caso, un registro de la tabla A puede relacionarse con varios de la tabla B. Es el tipo mas habitual y utilizado y existen numerosos casos; por ejemplo, domicilios con personas que viven en el mismo, nombre de empresa con sus trabajadores, proveedores con productos que sirven....


Varios a varios

Se da si varios registros de A pueden relacionarse con varios de B y viceversa. Es quizas la menos habitual de manera formal

Resultado de imagen para relacion muchos a muchos base de datos






Diseño de base de datos

El diseño de bases de datos es el proceso por el que se determina la organización de una base de datos, incluidas su estructura, contenido y las aplicaciones que se han de desarrollar

Conceptual

El diseño conceptual de una base de datos forma parte del proceso de diseño de la base de datos completa, que incluye el diseño conceptual, diseño lógico y diseño físico de la misma.


Lógico

En este punto del proyecto, transformamos el esquema de la base de datos (diseño conceptual) en una seria de estructuras lógicas (tablas, campos, claves primarias y ajenas, etc.), que permitirán almacenar los datos de una forma optima, sin redundancia de datos ( que no haya duplicidad de información; que no se repita el mismo dato) y garantizando la integridad referencial: que no se puede relacionar un dato A con otro dato B, si este ultimo no existe todavía en la base de datos.


Físico

El diseño físico parte del esquema lógico de bases de datos y da como resultado un esquema físico de bases de datos. El esquema físico de una base de datos, depende del tipo de SGBD y del SGBD especifico que se emplee.

El esquema físico de una base de datos es una descripción de la implementacion de una base de datos en memoria secundaria, describiendo las estructuras de almacenamiento y los métodos de acceso a esos datos.


Ventajas y desventajas de una base de datos relacional

Ventajas

  • Provee herramientas que garantizan evitar la duplicidad de registros
  • Garantiza la integridad referencial, asi , al eliminar un registro elimina todos los registros relacionados dependientes
  • Favorece la normalizacion por ser mas comprensible y aplicable.

Desventajas

  • Presentan deficiencias con datos gráficos, multimedia, CAD y sistemas de información geográfica.
  • No se manipulan de forma manejable los bloques de texto como tipo de dato.
  • las bases de datos orientadas a objetos(BDOO) se propusieron con el objetivo de satisfacer las necesidades de las aplicaciones anteriores y así complementar pero no sustituir a las bases de datos relacionales. 


Elementos de una base de datos relacional

Entidad o Tabla

Son estructuras encargadas de alojar la información de la base de datos

Campo

Son cada una de las columnas de una tabla, cada campo almacena un dato en concreto.


Dato

Un dato es la representación simbólica (numérica, alfabética, algorítmica, espacial, etc.) de un atributo o variable cuantitativa o cualitativa. Los datos describen hechos empíricos, sucesos y entidades.


Registro o tupla

Cada una de las filas de la tabla que agrupa toda la información de un mismo elemento.



¿Que es la normalización?

Es un proceso que consiste en designar y aplicar una seria de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional.

Las bases de datos relacionales se normalizan para:
  • Evitar redundancia de los datos
  • Disminuir problemas de actualización de los datos en las tablas
  • Proteger la integridad de datos


¿Cuantas formas normales existen?

Primera forma normal

La primera forma normal(1FN o forma mínima) es forma normal usada en normalizacion de bases de datos. Una tabla de base de datos relacional que se adhiere a la 1FN es una que satisface cierto conjunto mínimo de criterios.

Segunda forma normal

La segunda forma normal (2NF) es una forma normal usada en normalizacion de bases de datos. la 2FN fue definida originalmente per E.F Codd en 1971. Una abla que esta en la primera forma normal (1NF) debe satisfacer cierto criterios adicionales para calificar para la segunda forma normal.


Tercera forma normal

La tercera forma normal (3NF) es una forma normal usada en la normalizacion de bases de datos. La 3NF fue definida originalmente por E.F.Codd en 1971. La definicion de Codd indica que una tabla esta en 3NF si y solo si las tres condiciones siguientes se cumplen:
  • La tabla esta en la segunda forma normal (2NF)
  • Ningun atributo no-primario de la tabla es dependiente transitivamente de una clave primaria
  • Es una relacion que no incluye ningun atributo clave.

Formal normal de Boyce-Codd

La forma normal de Boyce-Codd (o FNBC) es una forma normal utilizada en la normalizacion de bases de datos. Es una versión ligeramente mas fuerte de la tercera forma normal (3FN). La forma normal de Boyce-Codd requiere que no existan dependencias funcionales no triviales de los atributos que no sean un conjunto de la clave candidata.


Cuarta forma normal

La cuarta forma normal (4NF) es una forma normal usada en la normalizacion de bases de datos. La 4NF se asegura de que las dependencias multivaluadas independientes esten correctas y eficientemente representadas en un diseño de base de datos.


Quinta forma normal

La quinta forma normal (5FN) también conocida como forma normal de proyección-unión (PJ/NF) es un nivel de normalizacion de bases de datos diseñados para reducir redundancia en las bases de datos relacionales que guardan hechos multi-valores aislando semanticamente relaciones múltiples relacionadas.


Forma normal de dominio/clave

La forma normal de dominio/clave (DKNF) es una forma normal usada en normalizacion de bases de datos que requieren que la base de datos contenga restricciones de dominios y de claves.

Una restricción del dominio especifica los valores permitidos para un atributo dado, mientras que una restricción de clave especifica los atributos que identifican únicamente una fila en una tabla dada.


¿Que es SQL?

SQL (por sus siglas en ingles Structured Query Laguage; en español lenguaje de consulta estructurada) es un lenguaje especifico del dominio utilizado en programación, diseñado para administrar, y recuperar información de sistemas de gestión de bases de datos relacionales.

DDL

Un lenguaje de base de datos o lenguaje de definición de datos (Data Definition Language, DDL por sus siglas en ingles) es un lenguaje proporcionado pro el sistema de gestión de base de datos que permite a los programadores de la misma llevar a cabo las tareas de definición de estructuras que almacenaran los datos así como los procedimientos o funciones que permitan consultarlos.

DML

Lenguaje de manipulacion de datos ( Data Manipulation Language, DML) es un lenguaje proporcionado por los sistemas gestores de bases de datos que permite a los usuarios de la misma llevar a cabo las tareas de consulta o midificacion de los datos contenidos en las bases de datos del sistema gestor de bases de datos.

DCL

Un lenguaje  de control de datos ( DCL  pos sus siglas en ingles Data Control Language) es un lenguaje proporcionado por el sistema de gestión de base de datos que incluye una serie de comandos SQL que permiten al administrador controlar el acceso a los datos contenidos en la base de datos.

Las tareas sobre las que se pueden conceder o denegar permisos son las siguientes:
  • CONNECT
  • SELECT
  • INSERT
  • UPDATE
  • DELETE
  • USAGE

TCL

Permite administrar diferente transacciones que ocurren dentro de una base de datos.
  • COMMIT: Empleado para guardar el trabajo hecho.
  • ROLLBACK: Utilizado para deshacer la modificación que hice desde el ultimo COMMIT


¿Que es ACID?

En base de datos se denomina ACID a las caracteristicas de los parametros que permiten clasificar las transacciones de los sistemas de gestion de base de datos. Cuando se dice que es ACID compilant se indica -en diversos grados- que este permite realizar transacciones.

En concreto ACID es un acronimo de Atomicity, Consistency, Isolation and Durability: Atomicidad,
Consistencia, Aislamiento y Durabilidad en español.



¿Que es cloud computing?

Cloud Computing, o computación en la nube, es una plataforma que permite ofrecer las TI como servicios en la red. Todo lo que se encuentra en el Datacenter se ofrece al usuario como servicio, tanto software, plataforma e infraestructuras.


¿Que es big data?

Big data es un termino que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de datos lo que es importante. Lo que importa con el big data es lo que las organizaciones hacen con los datos. Big data se puede analizar para obtener ideas que conduzcan a mejores decisiones y movimientos de negocios estratégicos.


 































 

















 

Comentarios

Entradas populares de este blog

INTRODUCCIÓN A JAVA