Datos crudos
De OCHA Colombia Wiki
Los datos crudos es un termino para los datos que se recogen desde una fuente. Datos crudos no han sido sujetos al procesamiento u otra manipulación; también se conocen como datos primarios. Es un termino relativo. Los datos crudos pueden ser insumos para un programa de computador o ser utilizados en un análisis manual de procedimientos como recogida de estadísticas de una encuesta. También puede hacer referencia a datos binarios en aparatos electrónicos tales como discos duros (referidos como datos de bajo nivel).
En computación, puede tener los siguientes atributos: posiblemente conteniendo errores, no validado; en diferentes formatos colquiales; no codificado o formateado; y sospechos, requeriendo confirmación o citación. Por ejemplo, una hoja de insumos de datos podría contener datos como datos crudos en multiples formatos: "31 de enero 1999", "31/01/1999", "31/1/99", "31 enero", o "hoy". Luego de ser capturados, estos datos crudos pueden ser procesados y almacenados en un formato único, de pronto la fecha juliana, para ser más facilmente accesible para los computadores y los seres humanos para interpretar en procesamiento posterior.
Los datos crudos (aveces reconocido como datos de "fuente") es el insumo de datos del procesamiento. Una distinción se hace aveces entre datos e información hasta el punto en que la información es la finalidad del producto de procesamiento de datos. Datos crudos que han sido procesados por ende se reconoce aveces como datos "cocidos".
Aunque los datos crudos tienen la potencial de volverse "información", requiere una extracción selectiva, organización y aveces análisis y formateo para su presentación.
Por ejemplo, un terminal de ventas en un supermercado recoge volumenes grandes de datos crudos a diario, pero estos datos no dan mucha información hasta que sean procesados. Luego de que son procesados, los datos pueden indicar los ítemes particulares comprados por clientes, cuando los compran, y a qué precio. Tal información podría volverse datos para procesar campañas de mercadeo. Como el resultado de procesamiento, los datos crudos aveces resultan en los bases de datos, que permite que los datos crudos vuelven accesibles para más procesamiento y análisis en otras formas.
Tim Berners-Lee (inventor del internet) propone que compartir los datos crudos es importante. Él exige que todos deben demandar que sus gobiernos y los comercios deben compartir su información como datos crudos. Argumenta que "los datos empujan una gran cantidad de qué pasa en nuestras vidas...porque alguien toma los datos y hace algo con ellos." Berners-Lee dice que es esencialmente de compartir estos datos crudos que los avances en las ciencias emergen.