首页 | 本学科首页   官方微博 | 高级检索  
   检索      


Optimal Weights for Focused Tests of Clustering Using the Local Moran Statistic
Authors:Peter A Rogerson  Peter Kedron
Institution:1. Department of Geography, State University of New York–Buffalo, , Buffalo, NY, USA;2. Department of Biostatistics, State University of New York–Buffalo, , Buffalo, NY, USA
Abstract:Local spatial statistics measure and test for spatial association for a variable or variables of interest in a geographic neighborhood surrounding a predefined location. Most applications adopt a single scale of analysis but give little attention to the scale of the process generating the data. Alternatively, when the researcher is uncertain about the process scale, local statistics may examine a number of scales. In these cases, it is important to include a correction for multiple testing when evaluating the statistical significance of each local statistic, something that is rarely done. Consequently, local statistics are more likely to identify significant relationships, even when no meaningful spatial association exists. In this article, we develop a methodology for the local Moran statistic that provides both an empirical estimate of the spatial scale of association and an assessment of the significance of the statistic for that scale. The key idea is to test a number of possible choices for the statistic's weight matrix and then account for the multiple testing associated with the number of weight matrices examined. Unlike previous research, our statistic avoids the use of simulation to determine statistical significance in the presence of multiple testing. To test the validity of our approach, we constructed a numerical example to assess the statistic's performance and conducted an empirical study using leukemia data from central New York state. The developed statistic addresses the need for the empirical determination of weights and spatial scale. The test therefore addresses the common weakness of many applications, where weights are defined exogenously, with little or no thought given to either the definition or its implications. Los indicadores locales (local spatial statistics) evalúan la asociación espacial de una o varias variables de interés dada un área predefinida y sus áreas vecinas. La mayoría de dichas medidas utilizan una escala única de análisis y prestan poca atención a la escala del proceso de generación de los datos. En los casos en los que el investigador no está seguro de la escala del proceso, las los indicadores locales pueden ser evaluados a varias escalas. En dichos casos, cuando se hace la evaluación de la significancia estadística de cada indicador local, es importante incorporar una corrección para pruebas múltiples (multiple tests), un ajuste que raramente se realiza en la gran mayoría de estudios. Debido al problema de pruebas múltiples, los indicadores locales son más propensos a identificar relaciones significativas, incluso cuando no existe asociación espacial significativa alguna. En este artículo los autores desarrollan una metodología que produce un índice local de Moran que proporciona tanto una estimación empírica de la escala espacial de la asociación así como una evaluación de la importancia del indicador para dicha escala. La idea clave es poner a prueba una serie de opciones posibles para la definición de la matriz de pesos espaciales (spatial weight matrix) del índice y luego tomar en cuenta las pruebas múltiples asociadas con el número de matrices de peso examinadas. A diferencia de métodos anteriores, el indicador local propuesto evita el uso de simulaciones para determinar la significancia estadística con pruebas múltiples. Para probar la validez del enfoque propuesto, se construyó un ejemplo numérico con el fin de evaluar el desempeño del nuevo índice y se llevó a cabo un estudio comparativo a partir de datos del centro de leucemia del estado de Nueva York. El índice desarrollado responde a la necesidad de definir las ponderaciones (pesos) empíricamente y la escala espacial. De esta forma el método propuesto supera limitaciones comúnmente halladas de muchas aplicaciones en las cuales los pesos son definidos exógenamente, con poca o ninguna atención a su definición o su implicancias. 局部空间统计量可用于度量和检验预定地理区域周围邻域的空间关联。大多数情况下仅采用单一尺度的分析而较少关注数据生成过程的尺度。而当其过程尺度无法确定时,局部统计量却可能检测出多个尺度。在这些案例中,对单个局部统计量统计显著性评估建立多重检验的修正是重要的,而这却鲜有实施。因此,即使存在无意义的空间关联时,局部统计也更可能识别出显著的相关性。 本文发展了一种基于局部Moran统计的方法,提供了空间尺度关联性的经验估计以及对该尺度下统计显著性的评估。其核心思想是测试统计权重矩阵的可能选择,然后考虑与权重矩阵检验数量数目相关的多重检验。与以往研究不同,该方法在多重检验情况中避免了采用模拟来确定统计显著性。为检验其有效性,采用了数值案例来评估其统计性能,并基于纽约州中部的血癌数据进行比较研究。该方法解决了权重和空间尺度确定经验估计的需求,通过验证也相应地解决了很多应用中的普遍弱点,即权重被定义成外生变量,而很少或根本没有考虑其定义或含义。
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号