{{ title }}

Reporte generado automáticamente {{ current_time }}

{% if html_metadatos_full != None %}

Metadatos - ver en Datos Abiertos


{% endif %}

Estadísticas generales


Muestra de datos


{{ html_dataframe_head }}

{{ html_dataframe_tail }}

{{ dataframe_shape }}


Estadísticas específicas


Aquí se muestran los tipos de las columnas de la base de datos con tres metodologías diferentes. La columna 'Tipo general' muestra si las variables son numéricas, de texto, booleanas; la columna 'Tipo general (Python)' muestra el tipo de la variable según la función "dtypes" de Python; las columnas 'Tipo especifico' muestran los tipos de las observaciones de cada columna, incluidos datos faltantes ("nan"), como porcentaje del total.

Variables

Seleccionar todos

{% for item in variables_list_2 %}

{{ loop.index }} - {{ item }}

{% endfor %}
{% for item in header_list_2 %} {% endfor %} {% for row in items_2%} {% for column in row %} {% if loop.index0 == 0 %} {% else %} {% endif %} {% endfor %} {% endfor %}
Variable{{ item }}
{{ column }}{{ column }}

Contiene las 10 categorías más frecuentes de las columnas tipo texto y presenta el porcentaje dentro del total de observaciones. Incluye valores faltantes.

Variables

Seleccionar todos

{% for item in variables_list_3 %}

{{ loop.index }} - {{ item }}

{% endfor %}
{% for item in columnas_list_3 %} {% endfor %} {% for row in items_3%} {% for column in row %} {% if loop.index0 == 0 %} {% else %} {% endif %} {% endfor %} {% endfor %}
{{ item }}
{{ column }}{{ column }}

Cada columna muestra los nombres de las filas y columnas que están duplicadas en la base de datos


{% if html_dataframe_duplic_filas != None %}
{{ html_dataframe_duplic_filas }}
{% else %} * La base de datos no contiene filas duplicadas {% endif %}

{% if html_dataframe_duplic_colum != None %}
{{ html_dataframe_duplic_colum }}
{% else %} * La base de datos no contiene columnas duplicadas {% endif %}

Contiene información para cada columna de tipo numérico, incluye media, mediana, percentiles, desviación estándar, valores extremos y porcentaje de valores faltantes.

{% if variables_list != None %}

Variables

Seleccionar todos

{% for item in variables_list %}

{{ loop.index }} - {{ item }}

{% endfor %}
{% for item in header_list %} {% endfor %} {% for row in items%} {% for column in row %} {% if loop.index0 == 0 %} {% else %} {% endif %} {% endfor %} {% endfor %}
Variable{{ item }}
{{ column }}{{ column }}
{% else %} * La base de datos no tiene columnas numéricas {% endif %}


Correlaciones


La correlación de Pearson es una medida de correlación lineal entre dos variables. Varía entre -1 y 1, donde -1 significa que la correlación entre las variables es negativa y total, 0 que no existe la correlación y 1 que hay correlación positiva total. Se calcula como la división de la covarianza de las dos variables con el producto de las desviaciones estándar de cada variable.

{% if corre_pearson_headers|length > 1 %}

* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.


{% else %}

* La base de datos no tiene columnas numéricas para el cálculo de correlaciones

{% endif %}

La correlación de Kendall mide la relación entre dos variables ordinales. Varía entre -1 y 1, donde -1 significa que la correlación entre las variables es negativa total, 0 que no existe la correlación y 1 que hay correlación positiva total. Se calcula como la división de los números concordantes menos los discordantes de pares entre las variables con el número total de pares.

{% if corre_kendall_headers|length > 1 %}

* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.


{% else %}

* La base de datos no tiene columnas numéricas para el cálculo de correlaciones

{% endif %}

La correlación de Spearman es una medida de correlación monotónica que se usa principalmente para medir la relación entre dos variables ordinales. Varía entre -1 y 1, donde -1 significa una correlación monotónica negativa total, 0 que no hay correlación monotónica y 1 que hay una correlación monotónica positiva total. Se calcula como la división de la covarianza de los rangos de cada variable con el producto de las desviaciones estándar de cada variable.

{% if corre_spearman_headers|length > 1 %}

* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.


{% else %}

* La base de datos no tiene columnas numéricas para el cálculo de correlaciones

{% endif %}

La correlación Cramer V se usas para medir la relación entre dos variables nominales. Varía entre 0 y 1, donde 0 significa que no hay correlación y 1 que la correlación es positiva y total. Se calcula como la raíz cuadrada de la división de estadístico Chi Cuadrado con el mínimo entre el número de filas o columnas y el número total de observaciones.

{% if corre_cramer_headers|length > 1 %}

* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.


{% else %}

* La base de datos no tiene columnas categóricas para el cálculo de correlaciones

{% endif %}

Esta correlación se calcula con el módulo Phik de Python. ver más detalles

{% if corre_phik_headers|length > 1 %}

* En caso de ver mal los labels del eje x, ajustar el zoom del navegador.


{% else %}

* La base de datos no tiene columnas categóricas para el cálculo de correlaciones

{% endif %}