Más

3.3: Búsqueda de datos - Geociencias


Objetivos de aprendizaje

  • El objetivo de esta sección es identificar y evaluar las consideraciones clave al buscar datos.

Ahora que tenemos un conocimiento básico de los datos y la información, ¿dónde podemos encontrar esos datos e información? Aunque una búsqueda en Internet sin duda arrojará innumerables fuentes y tipos de datos, la búsqueda de datos relevantes y útiles es a menudo un proceso desafiante e iterativo. Por lo tanto, antes de saltar en línea y descargar lo primero que aparece en una búsqueda web, es útil enmarcar nuestra búsqueda de datos con las siguientes preguntas y consideraciones:

  1. Qué exactamente Cuál es el propósito de los datos? Dado el hecho de que el mundo está nadando en grandes cantidades de datos, articular por qué necesitamos (o por qué no necesitamos) un conjunto de datos determinado agilizará la búsqueda de datos útiles y relevantes. Con este fin, cuanto más específicos seamos sobre el propósito de los datos necesarios, más eficiente será nuestra búsqueda de datos. Por ejemplo, si estamos interesados ​​en comprender y estudiar el crecimiento económico, es útil determinar las escalas temporal y geográfica. En otras palabras, ¿para qué períodos de tiempo (p. Ej., 1850-1900) e intervalos (p. Ej., Trimestral, anual) estamos interesados ​​y en qué nivel de análisis (p. Ej., Nacional, regional, estatal)? A menudo, la disponibilidad de datos, o más específicamente, la falta de datos relevantes, nos obligará a cambiar el propósito o alcance de nuestra pregunta original. Un propósito claro producirá una búsqueda de datos más eficiente y nos permitirá aceptar o descartar rápidamente los distintos conjuntos de datos que podamos encontrar.
  2. La segunda pregunta que debemos hacernos es ¿qué datos ya existen y a qué datos ya tenemos acceso? Antes de buscar nuevos datos, siempre es una buena idea hacer un inventario de los datos que ya tenemos. Dichos datos pueden ser de proyectos o análisis anteriores, o de colegas y compañeros de clase, pero el punto clave aquí es que podemos ahorrar mucho tiempo y esfuerzo utilizando datos que ya poseemos. Además, al identificar lo que tenemos, comprendemos mejor lo que necesitamos. Por ejemplo, aunque es posible que ya tengamos datos del censo (es decir, datos de atributos), es posible que necesitemos datos geográficos actualizados que contengan los límites de los estados o condados de EE. UU.
  3. A continuación, necesitamos evaluar y evaluar los costos asociados con la adquisición de datos. Los costos de adquisición de datos van más allá de los costos financieros. Tan importantes como los costos financieros de los datos son aquellos que involucran su tiempo. Después de todo, el tiempo es dinero. El tiempo y la energía que invierte en recopilar, encontrar, limpiar y formatear datos son tiempo y energía que le quitan el análisis de datos. Dependiendo de los plazos, las limitaciones de tiempo y los entregables, es fundamental aprender a administrar su tiempo al buscar datos.
  4. Finalmente, el formato de los datos que se necesitan es de vital importancia. Aunque muchos programas pueden leer muchos formatos de datos, existen algunos tipos de datos que solo pueden ser leídos por algunos programas y algunos programas que requieren formatos de datos particulares. Comprender qué formatos de datos puede usar y cuáles no lo ayudará en su búsqueda de datos. Por ejemplo, una de las formas más comunes de datos del sistema de información geográfica (SIG) se llama shapefile. No todos los programas GIS pueden leer o usar shapefiles, pero puede ser necesario convertir hacia o desde un shapefile o algún otro formato. Por lo tanto, como se señaló anteriormente, cuantos más formatos de datos conozcamos, mejor estaremos en nuestra búsqueda de datos porque comprenderemos no solo lo que podemos usar, sino también qué conversiones de formato se necesitarán realizar. si necesario.

Todas estas preguntas son de igual importancia y poder responderlas ayudará a una búsqueda de datos más eficiente y efectiva. Obviamente, hay varias otras consideraciones detrás de la búsqueda de datos, y en particular los datos GIS, pero las que se enumeran aquí proporcionan una ruta inicial para una búsqueda exitosa de datos.

A medida que la tecnología de la información evoluciona y se recopilan y distribuyen más y más datos, aumentan las diversas formas de datos que se pueden utilizar con un SIG. Generalmente, y como se discutió anteriormente, un SIG usa e integra dos tipos de datos: datos geográficos y datos de atributos. A veces, la fuente de datos geográficos y de atributos es la misma. Por ejemplo, la Oficina de Censos de EE. UU. (Http://www.census.gov) distribuye archivos de límites geográficos (p. Ej., Nivel de distrito censal, nivel de condado, nivel estatal), así como los datos de atributos asociados (p. Ej., Población, raza / etnia, ingresos). Además, estos datos están disponibles gratuitamente sin cargo. En muchos aspectos, los datos del censo de EE. UU. Son excepcionales: son gratuitos y completos. ¡Si tan solo todos los datos fueran gratuitos y completos!

Obviamente, todas y cada una de las búsquedas de datos variarán según el propósito, pero los datos de los gobiernos tienden a tener una buena cobertura y proporcionan un punto de referencia desde el cual se pueden agregar, comparar y evaluar otros datos. Ya sea que necesite datos de imágenes satelitales de la Administración Nacional de Aeronáutica y del Espacio (http://www.nasa.gov) o datos de uso de la tierra del Servicio Geológico de los Estados Unidos (http://www.usgs.gov), dichas fuentes gubernamentales tienden a ser confiable, respetable y consistente. Otro elemento clave de la mayoría de los datos gubernamentales es que son de libre acceso para el público. En otras palabras, no hay ningún cargo por usar o adquirir los datos. Los datos que son de uso gratuito generalmente se denominan datos publicos.

A diferencia de los datos disponibles públicamente, existen numerosas fuentes de privado o datos de propiedad. La principal diferencia entre los datos públicos y privados es que los primeros tienden a ser gratuitos y los segundos deben adquirirse con un costo. Además, a menudo existen restricciones sobre la redistribución y difusión de conjuntos de datos patentados (es decir, no se permite compartir los datos adquiridos). Nuevamente, dependiendo del tema, los datos de propiedad pueden ser la única opción. Otra razón para utilizar datos patentados es que los datos pueden formatearse y limpiarse según sus necesidades. La compensación entre el costo financiero y el tiempo ahorrado es una que debe considerarse y evaluarse seriamente cuando se trabaja con plazos.

La búsqueda de datos, y en particular los datos que necesita, es a menudo el aspecto que consume más tiempo de cualquier proyecto relacionado con SIG. Por lo tanto, es fundamental tratar de definir y aclarar sus requisitos y necesidades de datos, desde las escalas temporales y geográficas de los datos hasta los formatos requeridos, lo más claramente posible y lo antes posible. Dicha definición y claridad pagarán dividendos en su búsqueda de los datos correctos, lo que a su vez producirá mejores análisis y decisiones bien informadas.

RESUMEN CLAVE

  • Antes de buscar datos, hágase las siguientes preguntas: ¿Por qué necesito los datos? ¿En qué escala de tiempo necesito los datos? ¿A qué escala geográfica quiero los datos? ¿Qué datos ya existen? ¿En qué formato necesito los datos?

EJERCICIOS

  1. Identifique cinco posibles fuentes de datos sobre el producto interno bruto (PIB) de los países de África.
  2. Identifique dos fuentes de datos geográficos (archivos de límites) para África.
  3. ¿Qué tipo de datos geográficos proporcionan las Naciones Unidas?


Ver el vídeo: Búsqueda de Datos en Tiempo Real Live Search con C# y SQL Server (Septiembre 2021).