New York Times e Google hanno digitalizzato milioni di foto

New York Times e Google hanno digitalizzato milioni di foto

di Mattia Speroni, pubblicata il

“Il New York Times e Google hanno creato una partnership con l'intento di digitalizzare l'immenso archivio fotografico del giornale. Si parla di oltre cinque milioni di fotografie che ora sono sul cloud.”

Una nuova collaborazione tra il New York Times e Google ha portato alla riuscita digitalizzazione dell'enorme archivio fotografico del giornale. Si parla di oltre 5 milioni di fotografie con alcuni inediti mai pubblicati prima. Si è così passati dai supporti fisici a quelli digitali con l'aiuto del machine learning e del cloud.

All'interno dell'archivio soprannominato "the morgue" (l'obitorio) erano presenti fotografie di moltissimi anni fa, risalenti addirittura alla fine del diciannovesimo secolo. Ma non è finita qui, perché l'archivio comprendeva anche ritagli di giornale, microfilm e altri materiali che dovevano essere in qualche modo salvaguardati. Infatti oltre al tempo, anche le insidie come l'acqua hanno minato l'archivio del New York Times posto qualche piano sottoterra.

New York Times Google photos

Le informazioni (fotografie, microfilm, documentazione) verranno utilizzate per scrivere nuovi pezzi giornalistici e per andare a scavare nella storia passata. Per esempio, uno dei primi progetti del New York Times sarà dedicato alla California dei primi del '900 e di come fosse vista dall'altra parte degli Stati Uniti.

E qui entra in gioco Google e le sue unità dedicate allo storage su cloud e al machine learning. Perché non si voleva semplicemente salvare in digitale il materiale ma renderlo anche facilmente consultabile. Questo ha permesso di poter riconoscere sulle fotografie scritte fatte a mano, scarabocchi, immagini e altre informazioni utili per un'archiviazione corretta.

Il suo funzionamento prevede prima di tutto l'inserimento della fotografia o del documento all'interno dello storage cloud, a quel punto il New York Times insieme a Google ha realizzato un meccanismo che prevede il ridimensionamento delle immagini (con un servizio basato su Google Kubernetes Engine) e il salvataggio dei metadata in un database PostgreSQL.

Per rendere più semplice e meno dispendioso in termini di tempo e risorse il processo, ci si è affidati a soluzioni che sono completamente gestite da Google così da non dover pensare all'infrastruttura stessa ma solamente al risultato.

Nella foto che vedete sopra, dove sono state catturate la zona anteriore e posteriore, si comprende l'importanza del lavoro svolto con l'automazione. Infatti se l'immagine frontale non è abbastanza chiara, le scritte nella zona posteriore contestualizzano la fotografia. E non importa che siano scritte di giornale o a mano, in quanto si è comunque riusciti a digitalizzarle. Per quanto non siano perfette, si può capire come questo genere di soluzione si adattasse al meglio al New York Times e alle sue milioni di fotografie.


Commenti (1)

Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - Info
Per contattare l'autore del pezzo, così da avere una risposta rapida, si prega di utilizzare l'email personale (vedere in alto sotto il titolo). Non è detto che una domanda diretta inserita nei commenti venga verificata in tempi rapidi. In alternativa contattare la redazione a questo indirizzo email.
Commento # 1 di: Rubberick pubblicato il 14 Novembre 2018, 01:47
Beh questa è una bella cosa.