¿Por qué el Censo de los EE. UU. transfiere deliberadamente la población a los bloques censales vecinos?

Participo un poco tanto en la redistribución de distritos de Vermont House como en la redistribución de distritos del Concejo Municipal de Burlington.

He notado, al menos en dos bloques del censo, que el Censo está claramente por encima de la población informada. Ambos son visibles usando District Builder en este mapa de Burlington Vermont .

Un bloque censal es el Bloque #16005, que es parte de la Universidad de Vermont "Green" . Absolutamente ningún edificio, residencial o de otro tipo, y el Censo reporta 20 personas.

ingrese la descripción de la imagen aquí

El otro es el Bloque #4460, que es Ethan Allen Homestead con un cuidador (y tal vez un cónyuge o pareja) que vive en la propiedad. Sin embargo, el censo lo informa como 12 personas. Sé, con certeza, que es falso.

ingrese la descripción de la imagen aquí

Supongo que están transfiriendo conteos de bloques vecinos para que los conteos generales de ciudades, condados y estados sigan siendo correctos. Me imagino que están tratando de proteger cierta información privada sesgando estos números. ¿Pero es esa la razón por la que lo están haciendo? Realmente no entiendo completamente por qué están haciendo esto.

¿Alguien más ha notado algo así en su área? ¿Alguien sabe el flaco en él?

Hay otros bloques realmente tontos que han tallado, pero esa pregunta puede esperar más tarde.

Hago trabajo de censo para el gobierno local. Las formas tontas son la forma en que el Censo divide las áreas, es cada línea central de calle, límite administrativo, límites geográficos (ríos) todos combinados y luego utilizados como límite de bloque, lo que conduce a áreas pequeñas o áreas sin personas. Es muy poco probable que un hogar se extienda a ambos lados de estos límites, aunque puedo pensar en una excepción en mi propia ciudad.
Oh no, @RomaH, ni siquiera me he metido en las formas tontas todavía. Arriba, en el campus de UVM Redstone, hay algunas formas extremadamente tontas. Y hay todo tipo de pequeñas extensiones con población cero a las que se les asigna un bloque censal.
Gracias, @eps. Parece ser bastante relevante.

Respuestas (1)

La Oficina del Censo evita la divulgación para, como usted sospecha, proteger la privacidad de los encuestados individuales. La Oficina del Censo quiere asegurarse de que un consumidor de los datos que produce no pueda eliminar el anonimato de los datos que publica. Utilizan una variedad de técnicas para lograr eso, incluido el intercambio de datos y la inyección de ruido, cualquiera de los cuales podría presumiblemente explicar los problemas que está viendo.

La página vinculada sobre la evitación de la divulgación contiene una serie de documentos y otros recursos que detallan mucho más las diferentes técnicas que se utilizan si desea obtener más detalles.

Esto no explica por qué inyectarían ruido en un bloque con cero residentes, a menos que la ausencia de edificios no implique cero residentes (es decir, puede haber campamentos para personas sin hogar) o esté sugiriendo lo que podría considerarse un error en la aplicación del ruido.
@TechInquisitor: si está inyectando ruido o intercambiando datos, necesita que los resultados agregados sigan siendo correctos. Entonces, es muy posible que sacaron a 20 personas de un bloque vecino y simplemente aparecieron en el bloque vacante (no sé si tienen reglas especiales para manejar bloques completamente vacíos). Por supuesto, podría ser que había algunas personas sin hogar allí o que alguien ingresó la dirección de su calle incorrectamente y el software de mapeo los colocó en el bloque vacante.
Hay documentos disponibles públicamente que describen la metodología y más si continúa investigando, @TechInquisitor No debería poder explicar exactamente por qué hay 20 residentes allí en un bloque en particular porque la inyección de ruido debería ser aleatoria y más o menos inexplicable. de lo contrario, no es una ofuscación muy buena. PERO, los datos agregados aún deben ser correctos, útiles, con un nivel conocido de ruido o error.
@TechInquisitor Los campamentos para personas sin hogar son absolutamente una buena razón para hacerlo: de lo contrario, los datos del censo podrían usarse para rastrear a las personas sin hogar que acampan ilegalmente al observar solo las que tienen una población> 0.
Poner a 20 personas en un bloque vacío no tendría ningún valor para ocultar datos. Por lo tanto, sospecharía que se trata de personas sin hogar.
@LorenPechtel Como sugirió Joe, una práctica general de informar bloques vacíos y casi vacíos como si tuvieran un pequeño número de personas oculta cuáles de estos bloques están realmente vacíos y cuáles están casi vacíos. Si informa parques donde no encontró a nadie viviendo como cero y donde había alguien viviendo como 20, entonces los datos filtran exactamente qué parques tienen personas sin hogar viviendo en ellos.
@LorenPechtel, puedo garantizar absolutamente que no hay campamentos para personas sin hogar en UVM Green . No tiene sentido para mí que el censo intente decirnos que hay 20 personas viviendo allí.
@robertbristow-johnson: de alguna manera, marcar qué bloques vacíos son seguros para informar como vacíos requeriría un amplio conocimiento de los bloques, probablemente sería políticamente tenso y anularía el propósito por completo. Se podría suponer que cualquier bloque que no esté marcado como "seguro" tiene personas viviendo en él; Además: cualquier bloque eliminado de la lista "segura" ciertamente tendría personas viviendo en él. En ambos casos, el mayor interés del Censo por anonimizar los datos impide la existencia de dicho listado. Así: proteger la privacidad requiere que el Censo informe que la UVM Verde tiene alrededor de 20 residentes.
@robertbristow-johnson, el Censo no está tratando de decirle que 20 personas viven en UVM Green. Está tratando de decirle que hay cero o más personas viviendo en UVM Green y que el número real está dentro del margen de error permitido para ese bloque.
Lo siento, @ChristopherHarwood, esa explicación no me convence en absoluto. Cuando asignamos bloques a distritos o distritos usando District Builder, estamos asignando 20 personas a un distrito y nuestros distritos deben estar dentro del 10% uno del otro para no correr el riesgo de que un juez nos de una bofetada. Creo que la "evitación de la divulgación" debe pensarse más.
@robertbristow-johnson Se ha pensado mucho en esto: este es un debate muy activo para las agencias estadísticas de todo el mundo que publican datos de este tipo. Desafortunadamente, no existe una solución perfecta: se deben hacer concesiones entre la calidad de los datos, la dificultad computacional (algunos métodos requieren resolver problemas difíciles de optimización) y poder garantizar un cierto nivel de protección de la confidencialidad. 1/2
@robertbristow-johnson Otra consideración es que incluso sin el control de divulgación en juego, los datos en este detalle tienden a no ser confiables. Si alguien no responde al censo, o si se construye un nuevo bloque de apartamentos en lo que antes era un terreno vacío, los recuentos de 2020 pueden ser muy malos un par de años después. El conocimiento local puede ayudar a mitigar eso, pero se vuelve muy laborioso si lo haces a granel. 2/2
@GeoffreyBrent, "garantiza un cierto nivel de protección de confidencialidad", pero cuando una persona enumerada cumple 72 años, la Oficina del Censo (y los Archivos Nacionales) descartan esa 'protección de confidencialidad'. Parece que la protección tiene fecha de caducidad.
@BobE No creo que sea del todo correcto. No estoy en los EE. UU., pero entiendo que el Censo de EE. UU. mantiene la información de identificación personal confidencial durante 72 años después de recopilada, no hasta que el sujeto tenga 72 años. Por lo tanto, la divulgación más temprana posible de PII sobre una persona sería cuando cumpliera 72 años, pero eso solo permitiría la divulgación de datos recopilados cuando tenía cero años. Los 72 años más recientes de su vida aún estarían protegidos... 1/2
@BobE Muchos países tienen disposiciones similares que permiten la divulgación de PII mucho tiempo después de la recopilación; la razón es que después de que hayan pasado muchas décadas, es menos probable que siga siendo sensible, y es valioso para los historiadores, ya que contiene información que ha pasado de la memoria viva. Los diferentes lugares tienen reglas diferentes sobre la duración del período y sobre si se requiere consentimiento. El trabajo estadístico requiere muy a menudo encontrar un término medio entre maximizar el uso de la información y proteger la privacidad.
Donde viví en 1950, los nombres de mis padres, los nombres de mis hermanos, toda la información del censo de 1950 se ha considerado "protegida" durante los últimos 72 años. Sin embargo, en abril de 2022 ese PPI ya no está protegido. ¿Es porque tengo más de 72 años que mi PPI está disponible para el público? (¿Se esperaba que muriera?) Simplemente estoy señalando la inconsistencia en EE. UU. En cuanto al trabajo estadístico, tengo serias reservas en cuanto a la utilidad de mi nombre y los nombres de mis familiares ---- Hace 72 años.