Asuntos Inconexos

Por José María Martín Luque

El Gobierno del Reino Unido culpa al límite de filas de Excel de la ausencia de 16 000 casos en sus registros

The Daily Mail:

The problems are believed to have arisen when labs sent in their results using CSV files, which have no limits on size. But PHE then imported the results into Excel, where documents have a limit of just over a million lines.

The technical issue has now been resolved by splitting the Excel files into batches.

Mi apuesta personal es que han incluido más de una fila por cada caso positivo, de forma que los casi 516 000 casos registrados han pasado a ocupar el millón de filas de las que dispone un archivo de Excel moderno.

Actualización — 6 de octubre de 2020

Dice la BBC:

The problem is that PHE’s own developers picked an old file format to do this - known as XLS.

As a consequence, each template could handle only about 65,000 rows of data rather than the one million-plus rows that Excel is actually capable of.

And since each test result created several rows of data, in practice it meant that each template was limited to about 1,400 cases.

Estaba en lo cierto sobre el uso de más de una fila sobre cada caso, pero:

  • el artículo anterior asumía que estaban usando el formato XLSX de Excel, cuyo límite de filas es aproximadamente veinte veces mayor que el formato XLS que aparentemente usan; y
  • el archivo no contienía todos los casos registrados, sino una parte de ellos, imagino que en parte debido de nuevo al límite de filas.