{ "cells": [ { "cell_type": "code", "execution_count": 1, "id": "bcb2eb03-8273-46dd-ba20-f1817691fe42", "metadata": {}, "outputs": [], "source": [ "from functools import cache\n", "import pandas as pd\n", "\n", "pd.set_option(\"display.max_columns\", None)" ] }, { "cell_type": "code", "execution_count": 3, "id": "5b51e9a7-1dbd-4b86-8aad-109a2f4095cd", "metadata": {}, "outputs": [], "source": [ "columns_selected = [\n", " \"edo_captura\",\n", " \"edo_nac_madre\",\n", " \"fecha_nac_madre\",\n", " \"edad_madre\",\n", " \"estado_conyugal\",\n", " \"entidad_residencia_madre\",\n", " \"numero_embarazos\",\n", " \"hijos_nacidos_muertos\",\n", " \"hijos_nacidos_vivos\",\n", " \"hijos_sobrevivientes\",\n", " \"el_hijo_anterior_nacio\",\n", " \"vive_aun_hijo_anterior\",\n", " \"orden_nacimiento\",\n", " \"recibio_atencion_prenatal\",\n", " \"trimestre_recibio_primera_consulta\",\n", " \"total_consultas_recibidas\",\n", " \"madre_sobrevivio_al_parto\",\n", " \"escolaridad_madre\",\n", " \"ocupacion_habitual_madre\",\n", " \"trabaja_actualmente\",\n", " \"fecha_nacimiento_nac_vivo\",\n", " \"hora_nacimiento_nac_vivo\",\n", " \"sexo_nac_vivo\",\n", " \"semanas_gestacion_nac_vivo\",\n", " \"talla_nac_vivo\",\n", " \"peso_nac_vivo\",\n", " \"valoracion_apgar_nac_vivo\",\n", " \"valoracion_silverman_nac_vivo\",\n", " \"producto_de_un_embarazo\",\n", " \"entidad_certifico\",\n", "]" ] }, { "cell_type": "code", "execution_count": 5, "id": "2848508d-264a-487b-951f-99ef8483e3b1", "metadata": {}, "outputs": [], "source": [ "df_original = pd.read_csv(\"~/Downloads/out2.csv\", dtype=object)" ] }, { "cell_type": "code", "execution_count": 6, "id": "a6c8cc59-5461-4362-932f-0ddf8fbcb764", "metadata": {}, "outputs": [], "source": [ "# df_original.columns" ] }, { "cell_type": "code", "execution_count": 7, "id": "f5641028-679f-473b-945d-5775d144dcf2", "metadata": {}, "outputs": [], "source": [ "df = df_original.copy()" ] }, { "cell_type": "code", "execution_count": 8, "id": "b0362862-d25d-40a8-a4d7-95b1e337b955", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "{'entidad_residencia_madre.1', 'edo_captura.1', 'sexo_nacimiento_vivo.1', 'escolaridad_madre.1', 'edo_nac_madre.1', 'madre_sobrevivio_parto.1', 'recibio_atencion_prenatal.1', 'producto_de_un_embarazo.1', 'estado_conyugal'}\n" ] } ], "source": [ "df_cols = df.columns.to_list()\n", "columnas_description = {x for x in df_cols if x[-2:] == \".1\"} | {\"estado_conyugal\"}\n", "df_cols = [x for x in df_cols if x + \".1\" not in columnas_description]\n", "print(columnas_description)\n", "df = df[df_cols]" ] }, { "cell_type": "code", "execution_count": 9, "id": "62f5a056-048a-4d5c-a28b-704cfcc44692", "metadata": {}, "outputs": [], "source": [ "df = df.rename(columns={x: x[:-2] for x in columnas_description})" ] }, { "cell_type": "code", "execution_count": 10, "id": "57fab793-97b6-4189-b6e0-578062763b68", "metadata": {}, "outputs": [ { "data": { "text/plain": [ "Index(['Unnamed: 0', 'MPO_NACM', 'fecha_nac_madre', 'edad_madre', 'CON_INDM',\n", " 'HABLA_INDM', 'CUAL_LENGM', 'estado_conyug', 'TIPOVIAL_RES',\n", " 'TIPOASEN_RES', 'MPO_RES', 'LOC_RES', 'numeros_embarazos',\n", " 'hijos_nacidos_muertos', 'hijos_nacidos_vivos', 'hijos_sobrevivientes',\n", " 'hijo_anterior_nacio', 'VIVE_AUN', 'orden_nacimiento', 'TRIM_CONS',\n", " 'total_consultas_recibidas', 'DERHAB', 'DERHAB2',\n", " 'ocupacion_habitual_madre', 'CVEOCUPHAB', 'TRAB_ACT',\n", " 'fecha_nacimiento_vivo', 'hora_nacimiento_vivo',\n", " 'semanas_gestacion_vivo', 'talla_nacimiento_vivo', 'peso_nac_vivo',\n", " 'valoracion_apgar_nac_vivo', 'valoracion_silverman_nac_vivo', 'BCG',\n", " 'HEP_B', 'VIT_A', 'VIT_K', 'TAM_AUD', 'ACELRN', 'CVE_CIE', 'ACELRN2',\n", " 'CVE_CIE2', 'PROCNAC', 'FORCEPS', 'ESPECIFIQUE', 'INST_NAC', 'UNIMED',\n", " 'CLUES', 'ATENDIO', 'ATEN_OTRO', 'TIPOVIAL_NAC', 'TIPOASEN_NAC',\n", " 'lugar_de_nacimiento', 'MPO_NAC', 'LOC_NAC', 'CERT_POR', 'OTROMEDICO',\n", " 'UNIMED_33_1', 'CLUES_33_2', 'TIPOVIAL_CERT', 'TIPOASEN_CERT',\n", " 'ENT_CERT', 'MPO_CERT', 'LOC_CERT', 'FECH_CERT', 'FECH_ALTA',\n", " 'FECH_CAMB', 'IDCAPTURA', 'TIPO_FORMATO', 'edo_nac_madre',\n", " 'edo_captura', 'el_hijo_anterior_nacio', 'entidad_certifico',\n", " 'entidad_residencia_madre', 'escolaridad_madre', 'Descrip',\n", " 'lugar_nacimiento', 'madre_sobrevivio_parto', 'producto_de_un_embarazo',\n", " 'recibio_atencion_prenatal', 'sexo_nacimiento_vivo',\n", " 'trabaja_actualmente', 'trimestre_recibio_primera_consulta',\n", " 'vive_aun_hijo_anterior'],\n", " dtype='object')" ] }, "execution_count": 10, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.columns" ] }, { "cell_type": "code", "execution_count": 11, "id": "3e3f76f5-2e5e-4ac6-a5c2-34cecdfa977b", "metadata": {}, "outputs": [], "source": [ "mapper = {\n", " \"numeros_embarazos\": \"numero_embarazos\",\n", " \"madre_sobrevivio_parto\": \"madre_sobrevivio_al_parto\",\n", " \"fecha_nacimiento_vivo\": \"fecha_nacimiento_nac_vivo\",\n", " \"hora_nacimiento_vivo\": \"hora_nacimiento_nac_vivo\",\n", " \"sexo_nacimiento_vivo\": \"sexo_nac_vivo\",\n", " \"semanas_gestacion_vivo\": \"semanas_gestacion_nac_vivo\",\n", " \"talla_nacimiento_vivo\": \"talla_nac_vivo\",\n", " \"Descrip\": \"estado_conyugal\",\n", "}\n", "df = df.rename(columns=mapper)" ] }, { "cell_type": "code", "execution_count": 12, "id": "14f1b915-aa58-42c0-99f9-901ad56509c0", "metadata": {}, "outputs": [], "source": [ "# df_original.sample(n=10)[[\"estado_conyugal\"]]" ] }, { "cell_type": "code", "execution_count": 13, "id": "0aa4b396-b901-441e-9f94-e6521e7146a9", "metadata": {}, "outputs": [ { "data": { "text/html": [ "
| \n", " | edo_captura | \n", "edo_nac_madre | \n", "fecha_nac_madre | \n", "edad_madre | \n", "estado_conyugal | \n", "entidad_residencia_madre | \n", "numero_embarazos | \n", "hijos_nacidos_muertos | \n", "hijos_nacidos_vivos | \n", "hijos_sobrevivientes | \n", "el_hijo_anterior_nacio | \n", "vive_aun_hijo_anterior | \n", "orden_nacimiento | \n", "recibio_atencion_prenatal | \n", "trimestre_recibio_primera_consulta | \n", "total_consultas_recibidas | \n", "madre_sobrevivio_al_parto | \n", "escolaridad_madre | \n", "ocupacion_habitual_madre | \n", "trabaja_actualmente | \n", "fecha_nacimiento_nac_vivo | \n", "hora_nacimiento_nac_vivo | \n", "sexo_nac_vivo | \n", "semanas_gestacion_nac_vivo | \n", "talla_nac_vivo | \n", "peso_nac_vivo | \n", "valoracion_apgar_nac_vivo | \n", "valoracion_silverman_nac_vivo | \n", "producto_de_un_embarazo | \n", "entidad_certifico | \n", "CVE_CIE | \n", "CVE_CIE2 | \n", "
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | \n", "CHIAPAS | \n", "CHIAPAS | \n", "05/07/1980 | \n", "36 | \n", "UNIÓN LIBRE | \n", "CHIAPAS | \n", "9 | \n", "1 | \n", "8 | \n", "8 | \n", "VIVO | \n", "SI | \n", "9 | \n", "SI | \n", "SEGUNDO | \n", "6 | \n", "SI | \n", "NINGUNA | \n", "HOGAR | \n", "NaN | \n", "19/04/2017 | \n", "02:00:00 | \n", "MUJER | \n", "40 | \n", "50 | \n", "3100 | \n", "8 | \n", "0 | \n", "ÚNICO | \n", "CHIAPAS | \n", "0000 | \n", "0000 | \n", "
| 1 | \n", "CHIAPAS | \n", "CHIAPAS | \n", "17/05/1991 | \n", "25 | \n", "UNIÓN LIBRE | \n", "CHIAPAS | \n", "4 | \n", "99 | \n", "4 | \n", "4 | \n", "VIVO | \n", "SI | \n", "4 | \n", "SI | \n", "SEGUNDO | \n", "4 | \n", "SI | \n", "SECUNDARIA COMPLETA | \n", "HOGAR | \n", "NaN | \n", "11/01/2017 | \n", "13:00:00 | \n", "MUJER | \n", "39 | \n", "50 | \n", "3900 | \n", "0 | \n", "0 | \n", "ÚNICO | \n", "CHIAPAS | \n", "0000 | \n", "0000 | \n", "
| 2 | \n", "CHIAPAS | \n", "CHIAPAS | \n", "27/01/1982 | \n", "35 | \n", "CASADA | \n", "CHIAPAS | \n", "6 | \n", "0 | \n", "6 | \n", "6 | \n", "VIVO | \n", "SI | \n", "6 | \n", "SI | \n", "PRIMERO | \n", "3 | \n", "SI | \n", "PRIMARIA INCOMPLETA | \n", "AMA DE CASA | \n", "NaN | \n", "22/05/2017 | \n", "12:23:00 | \n", "MUJER | \n", "38 | \n", "50 | \n", "2960 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "CHIAPAS | \n", "0000 | \n", "0000 | \n", "
| 3 | \n", "CHIAPAS | \n", "CHIAPAS | \n", "16/11/1983 | \n", "33 | \n", "UNIÓN LIBRE | \n", "CHIAPAS | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "S.I. | \n", "NaN | \n", "1 | \n", "SI | \n", "TERCERO | \n", "4 | \n", "SI | \n", "PRIMARIA COMPLETA | \n", "AMA DE CASA | \n", "NaN | \n", "03/06/2017 | \n", "10:35:00 | \n", "MUJER | \n", "99 | \n", "48 | \n", "2900 | \n", "99 | \n", "99 | \n", "ÚNICO | \n", "CHIAPAS | \n", "0000 | \n", "0000 | \n", "
| 4 | \n", "CHIAPAS | \n", "CHIAPAS | \n", "22/11/1982 | \n", "34 | \n", "UNIÓN LIBRE | \n", "CHIAPAS | \n", "3 | \n", "99 | \n", "3 | \n", "3 | \n", "VIVO | \n", "SI | \n", "3 | \n", "SI | \n", "PRIMERO | \n", "5 | \n", "SI | \n", "NINGUNA | \n", "AMA DE CASA | \n", "NaN | \n", "29/04/2017 | \n", "23:12:00 | \n", "MUJER | \n", "39 | \n", "51 | \n", "3050 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "CHIAPAS | \n", "0000 | \n", "0000 | \n", "
| ... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
| 5873372 | \n", "ZACATECAS | \n", "OTROS PAISES DE LATINOAMERICA | \n", "01/07/1987 | \n", "31 | \n", "CASADA | \n", "ZACATECAS | \n", "3 | \n", "1 | \n", "2 | \n", "2 | \n", "VIVO | \n", "SI | \n", "3 | \n", "SI | \n", "PRIMERO | \n", "12 | \n", "SI | \n", "PROFESIONAL | \n", "LIC. EN INFORMATICA | \n", "SI | \n", "23/05/2019 | \n", "16:06:00 | \n", "MUJER | \n", "39 | \n", "49 | \n", "2990 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "ZACATECAS | \n", "0000 | \n", "0000 | \n", "
| 5873373 | \n", "ZACATECAS | \n", "ZACATECAS | \n", "17/07/1986 | \n", "32 | \n", "CASADA | \n", "ZACATECAS | \n", "3 | \n", "0 | \n", "3 | \n", "3 | \n", "VIVO | \n", "SI | \n", "3 | \n", "SI | \n", "PRIMERO | \n", "5 | \n", "SI | \n", "SECUNDARIA COMPLETA | \n", "HOGAR | \n", "NaN | \n", "24/05/2019 | \n", "16:55:00 | \n", "HOMBRE | \n", "37 | \n", "50 | \n", "3830 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "ZACATECAS | \n", "0000 | \n", "0000 | \n", "
| 5873374 | \n", "ZACATECAS | \n", "ZACATECAS | \n", "16/01/2000 | \n", "19 | \n", "CASADA | \n", "ZACATECAS | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "NO HA TENIDO OTROS HIJOS(AS) | \n", "NaN | \n", "1 | \n", "SI | \n", "PRIMERO | \n", "5 | \n", "SI | \n", "SECUNDARIA COMPLETA | \n", "HOGAR | \n", "NaN | \n", "24/05/2019 | \n", "23:13:00 | \n", "HOMBRE | \n", "42 | \n", "56 | \n", "4460 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "ZACATECAS | \n", "0000 | \n", "0000 | \n", "
| 5873375 | \n", "ZACATECAS | \n", "ZACATECAS | \n", "26/06/2000 | \n", "18 | \n", "UNIÓN LIBRE | \n", "ZACATECAS | \n", "2 | \n", "0 | \n", "2 | \n", "2 | \n", "VIVO | \n", "SI | \n", "2 | \n", "NO | \n", "NO RECIBIO | \n", "0 | \n", "SI | \n", "BACHILLERATO O PREPARATORIA INCOMPLETA | \n", "HOGAR | \n", "NaN | \n", "25/05/2019 | \n", "01:47:00 | \n", "HOMBRE | \n", "39 | \n", "49 | \n", "3090 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "ZACATECAS | \n", "0000 | \n", "0000 | \n", "
| 5873376 | \n", "ZACATECAS | \n", "ZACATECAS | \n", "24/09/2002 | \n", "16 | \n", "UNIÓN LIBRE | \n", "SAN LUIS POTOSI | \n", "1 | \n", "0 | \n", "1 | \n", "1 | \n", "NO HA TENIDO OTROS HIJOS(AS) | \n", "NaN | \n", "1 | \n", "SI | \n", "PRIMERO | \n", "9 | \n", "SI | \n", "SECUNDARIA INCOMPLETA | \n", "HOGAR | \n", "NaN | \n", "25/05/2019 | \n", "08:53:00 | \n", "MUJER | \n", "40 | \n", "54 | \n", "3300 | \n", "9 | \n", "0 | \n", "ÚNICO | \n", "ZACATECAS | \n", "0000 | \n", "0000 | \n", "
5873377 rows × 32 columns
\n", "