Bases de datos
A fin de evitar que idénticos datos se encuentren repetidos en múltiples archivos, parece necesario que los comunes se almacenen en un archivo único y que este archivo sea accesible por todos los programas que los
manipulen.
Definición
Una base de datos es una colección de datos interrelacionados, almacenados en un conjunto sin redundancias (repeticiones) perjudiciales o innecesarias. Su finalidad es la de servir a una o más aplicaciones de la mejor manera posible. Los datos se almacenan de modo que resulten independientes de los programas que los utilizan, y se emplean métodos concretos y determinados para incluir nuevos datos y para modificar o extraer los ya almacenados.
ELEMENTOS INTEGRANTES DE UNA BASE DE DATOS
Los datos
Pueden referirse a objetos individuales o grupos de objetos. Por su naturaleza, los datos pueden ser numéricos, alfabéticos o alfanuméricos, siendo además variable su estructura, organización, etc.
La metabase
Se trata de una información sobre la información contenida en la base y su funcionamiento. Son dos importantes elementos de la metabase:
· El directorio de datos: contiene las instrucciones necesarias para pasar de la representación externa a la representación interna.
· El catálogo de variables o diccionario: donde se detalla cada una de las variables, su longitud, sus valores y agrupaciones posibles, etc.
El software
Es el conjunto de programas, procedimientos, lenguajes, etc. necesarios para realizar los procesamientos exigidos. Está compuesto de:
· Sistema de gestión de la base de datos: es el encargado de realizar las funciones de creación y actualización de la base, así como de la recuperación de la información que contiene.
· Interface de comunicaciones: es el conjunto de programas de teleproceso, necesarios cuando la base ha de ser consultada a distancia.
Los programas y/o lenguajes para procesamientos específicos
Son los lenguajes y/o programas mediante los cuales el usuario puede interrogar a la base o realizar ciertas operaciones.
El administrador de la base de datos
Es la persona cuya misión es asegurar la calidad y permitir el uso correcto y permanente por los usuarios de los datos almacenados. Es también, a veces, el diseñador de la base de datos. No es en absoluto el propietario de la base, sino su coordinador y administrador, y la persona encargada de autorizar las modificaciones de la misma.
Los usuarios
Son todas las personas autorizadas para acceder a la base de datos.
CUALIDADES DE UNA BUENA BASE DE DATOS
Versatilidad en la representación de relaciones
Diferentes programadores requieren la misma colección de datos y, por otro lado, existen relaciones diversas entre los conjuntos de datos almacenados. El método de organización debe de ser capaz de representar estas relaciones y acomodar sus posibles cambios en el futuro.
Tiempo de respuesta
Las bases de datos diseñadas para ser utilizadas de forma interactiva deben de asegurar un tiempo de respuesta adecuado para el diálogo entre el operador y el terminal. Además, el sistema debe de tener la capacidad suficiente para manejar un número concreto de terminales y el flujo de transacciones a que éstos den origen. Esto es importante en los sistemas interactivos de alto volumen de tráfico, cuando los datos deben de actualizarse al momento de haber sufrido una variación.
Coste mínimo
Adecuado a las necesidades reales.
Redundancia mínima
Para suprimir la redundancia de los datos, es preciso identificar los que van a ser utilizados en común por varios programas y almacenarlos en un archivo único. No obstante, si sólo existe una copia de ciertos datos que son necesarios para fines distintos, es preciso también almacenar y mantener las relaciones pertinentes. Por ésta y otras razones puede no ser siempre oportuno eliminar toda la redundancia del sistema.
Capacidad de búsqueda
En algunas organizaciones los tiempos de búsqueda son vitales para el uso que ha de darse a los datos. Uno de los objetivos a conseguir con la instalación de una base de datos es el obtener una capacidad de búsqueda
rápida y flexible.
Integridad
En ocasiones pueden producirse fallos en los componentes físicos del computador. El sistema de almacenamiento de los datos debe estar previsto para absorber estas contingencias y evitar que se produzcan daños en los datos almacenados.
Seguridad y privacidad
Los datos han de estar protegidos contra el acceso a los mismos de personas no autorizadas y contra su alteración indebida, casual o intencionada. La privacidad se refiere al derecho del propietario de la base de datos, a facilitar o no la información contenida en la misma a terceras personas.
El enlace con el pasado
Cuando una empresa decide instalar un nuevo software de base de datos, es importante que éste pueda utilizar los procedimientos y programas existentes y que los datos almacenados anteriormente puedan ser convertidos al nuevo software.
El enlace con el futuro
Con el tiempo los programas de una organización van aumentando, hasta un punto en que no puede ya pensarse en volver a escribirlos. Un objetivo importante al construir una base de datos es prever que posibles modificaciones futuras no afecten a las aplicaciones y programas en uso.
Afinación
Resulta necesario poder ajustar y cambiar la organización de la base de datos después que el sistema está ya en funcionamiento y cuando se conocen en la práctica los retoques necesarios a implantar. Este proceso se llama
afinación y en la práctica conduce a importantes economías en la implementación de las bases de datos.
Cambios en la importancia de los datos
A medida que disminuye la importancia de un conjunto de datos o la frecuencia de su uso, se hace necesario el cambiarlos dentro de la base a posiciones más o menos accesibles según su uso. El proceso de ajustar la posición de los datos en la base conforme la frecuencia de su utilización se llama migración.
Claridad y simplicidad
Los medios que se utilicen para la representación y manipulación de los datos, deben de ser lo más claros y simples posibles.
LAS TRES ESTRUCTURAS DE LAS BASES DE DATOS
Estructura física (hardware)
Se refiere a la forma en que los datos se almacenan en el soporte físico, y está directamente relacionada con el tipo de soporte utilizado.
Estructura lógica (software)
Es la visión de los datos que tienen el programador o el usuario.
Estructura lógica global
Es la visión que del conjunto tiene el administrador de la base de datos.
SISTEMA DE ADMINISTRACION DE LA BASE DE DATOS (SABD)
Es un conjunto coordinado de programas, procedimientos, lenguajes, etc., que suministra tanto a usuarios no informáticos como a analistas, programadores o al administrador de la base, los medios necesarios para describir, recuperar y manipular los datos contenidos en la base, asegurando su confidencialidad e integridad.
Funciones principales de un SABD
· Descripción: es la que permite, al administrador de la base, especificar los datos que la integran, sus estructuras y las relaciones que existen entre ellos.
· Manipulación: es la que permite a los usuarios, informáticos o no, añadir, buscar, suprimir o modificar los datos de acuerdo con las normas fijadas por el administrador de la base.
· Utilización: comprende todas las interfaces necesarias a los diferentes usuarios para comunicarse con la base.
Lenguajes y procedimientos de un SABD
· Descripción de datos: el que utiliza el administrador para definir la estructura lógica global, el que necesita el administrador para realizar la descripción física de los datos y el que precisan los usuarios para definir la estructura de los datos de una aplicación.
· Manipulación de datos: una vez que el programador ha especificado la estructura de su registro lógico, necesitar realizar con él una serie de operaciones (lectura, actualización, procesamiento de errores, etc.).
TIPOS DE BASES DE DATOS
Base de datos jerárquica
Su estructura y relación entre los datos se corresponde con las de las estructuras en arbol vistas anteriormente. En este modelo, cada nudo del árbol es un registro. Todos los nudos, excepto el raíz, están ligados a otros de nivel superior mediante punteros y ningún nudo puede tener más que un antecesor.
Base de datos en red (plex)
En este modelo, las conexiones entre registros se representan mediante estructuras en red. A diferencia del modelo jerárquico, cada nudo puede tener más de un antecesor.
Base de datos relacional
Al igual que toda estructura en red o plex, se puede reducir a una estructura más simple en árbol, admitiendo cierta repetición. Cualquier representación de los datos puede transformarse asímismo a tablas de tipo bidimensionales (matrices), siempre que se admita un grado determinado de redundancia. El proceso de transformación mediante el cual estructuras en árbol o red se convierten en tablas bidimensionales recibe el nombre de normalización. Las tablas así construidas se llaman relaciones y la base de datos construida mediante relaciones base de datos relacional.
SISTEMAS DE RECUPERACION DE LA INFORMACION (SRI)
Bases de datos documentales
· Documentación: conjunto de informaciones impresas que explican el funcionamiento de un programa o bien las instrucciones correspondientes al uso de un determinado equipo informático.
· Ciencia de la Documentación: es la disciplina que estudia los Sistemas de Administración de la Información y del conocimiento humano, una vez que éstos han sido vertidos en algún tipo de soporte físico.
La documentación, combinada con la Informática, ha generado las bases de datos documentales, que tienen por misión el procesamiento de una información realmente complicada: la información textual. Un SRI se utiliza para la administración de cualquier clase de información textual. Una base de datos relacional administra datos concretos, en tanto que un SRI administra ideas y conceptos.
Procesamiento de textos
Una vez adquiridos y seleccionados los documentos a insertar en la base de datos, los documentos se organizan y controlan de manera que se puedan identificar y localizar en respuesta a los distintos tipos de peticiones. Esta organización y control comprende la clasificación, catalogación, indexación por materias, etc. El proceso de indexación por materias está dividido en dos partes:
· El análisis conceptual, que estudia los aspectos del documento que pueden tener más interés para los usuarios del SRI.
· La traducción del an lisis conceptual al lenguaje de indexación.
Una vez realizado el proceso de indexación, los documentos se almacenan en una base de datos y los registros de indexación en una segunda base de datos, donde se organizan adecuadamente para responder a las búsquedas
solicitadas por los usuarios.
· Descriptores: es una clave o un conjunto de claves que se utiliza para la búsqueda de datos en un SRI. Son sinónimos cuando son equivalentes, es decir, cuando tienen un significado similar. Son homógrafos cuando tienen igual escritura pero significado diferentes.
· Diccionario Thesaurus: soluciona el problema de los sinónimos estableciendo un patrón para cada conjunto de sinónimos. El sistema hará una consulta al diccionario y sustituir éste por el patrón.
· Vocabulario controlado: son las palabras que entiende el sistema y está compuesto por las palabras clave propias de cada SRI, los operadores booleanos (NOT, AND, OR) y los operadores aritméticos o de proximidad (< > =).