Solución:
Están hablando lo mismo y tiene que ver con tuplas (relational algebra
) o filas (término simple).
Cuando dice alta cardinalidad, son posibles valores de un atributo particular (o campo) que son únicos y, por lo tanto, el número de filas o tuplas es mayor:
Ejemplo:
StudentID Lastname Firstname Gender
101 Smith John M
102 Jones James M
103 Mayo Ann F
104 Jones George M
105 Smith Suse F
En cuanto a Identificación del Estudiante los cardinality
es high
porque es único. En este tiene cinco (5) tuplas / filas.
Por otra parte Apellido tiene cardinalidad normal, en particular, solo hay tres (3) tuplas / filas únicas. Así tiene normal cardinality
.
Y finalmente Género tiene solo dos posibles tuplas únicas, por lo que Low Cardinality
.
Probablemente confundas Cardinality
adjunto Degree
de una relación que tiene algo que ver con el número de attributes/fields
en una relación (o mesa).
Por otro lado, el libro de texto para Database
al hablar de Cardinality
normalmente tiene que ver con una entidad en relación con otra entidad, es decir, el número de posibles ocurrencias de relaciones para una entidad que participa en un tipo de relación dado. Así, por ejemplo, para un binary relationship
cardinality
podría ser cualquiera one-to-one
, one-to-many
o many-to-many
.
Ambas definiciones intentan decir que la cardinalidad es el “número de filas”. La diferencia es si la comparación está “en la tabla” o “en una columna en particular”.
La versión del libro de texto de su base de datos se centra en el álgebra relacional y la estructura de tablas (“relaciones” en esa jerga).
La entrada de Wikipedia es más práctica. Abarca la definición del libro de texto, asumiendo que la tabla tiene una clave primaria (la cardinalidad de la clave primaria es la misma que la tabla). Sin embargo, también se puede aplicar a, digamos, una columna de banderas. Si la bandera solo toma dos valores (0
versus 1
), entonces podemos decir que la cardinalidad de la columna es 2.
Esto es importante para optimizar las consultas. La cardinalidad es un componente de la elección de los mejores métodos para unir, agregar y seleccionar datos. En la práctica, la mayoría de las bases de datos utilizan más información que la cardinalidad, las llamadas “estadísticas” sobre las columnas y sus valores para la optimización.