Anomalies

Aquest projecte no treballa amb dades ideals, sinó amb dades reals. I en aquest terreny, la coherència no és una propietat de partida, sinó una construcció.

S’han detectat múltiples anomalies de denominació en entitats que comparteixen un mateix identificador fiscal. Un mateix CIF pot aparèixer sota formes lleugerament diferents — variacions de puntuació, ús d’accents, abreviatures o formes socials — que, si no es tracten, fragmenten artificialment la lectura. Per aquest motiu, s’ha optat per una normalització per identificador, preservant alhora les variants detectades com a rastre del comportament original de la dada.

També s’han identificat duplicacions de contractes i casos específics de contractes plurianuals imputats en un únic exercici. En aquests casos, s’han aplicat criteris de deduplicació i, quan ha estat necessari, una expansió temporal controlada per evitar distorsions en els totals anuals. No es tracta de corregir la dada, sinó d’evitar que la seva forma d’origen desfiguri la seva lectura.

En l’àmbit de subvencions, s’han trobat registres que corresponen a transferències internes entre òrgans municipals. Tot i aparèixer com a beneficiaris, aquests no responen a una lògica externa de recepció de fons, i han estat tractats com a casos específics per preservar la coherència analítica del conjunt.

Aquestes situacions no són excepcions, sinó patrons. El sistema ja incorporava mecanismes parcials per detectar-les — normalització de NIF/CIF, unificació de noms, deduplicació per camps clau i tractament d’àlies territorials — però no sempre estaven resolts de manera homogènia en totes les capes de dades. El treball de depuració ha consistit, precisament, a fer emergir aquestes fractures i donar-los una resposta comuna.

El resultat no és una base perfecta, sinó una base més llegible. I aquesta distinció és fonamental.