Индекс Морана

Эта статья была переведена из источника, распространяемого под свободной лицензией, и находится на начальном уровне проработки
Материал из энциклопедии Руниверсалис
Белый и черный квадраты идеально рассредоточены, поэтому индекс Морана был бы −1, используя определение соседей ладьи. Если белые квадраты были сложены в одну половину доски, а черные квадраты в другую, индекс Морана приближается к +1 по мере увеличения N. Случайное расположение квадратных цветов дало бы индекс Морана значение, близкое к 0

Индекс Морана (англ. Moran's I) ― мера пространственной автокорреляции, разработанная Патриком Альфредом Пирсом Мораномruen[1][2]. Пространственная автокорреляция характеризуется корреляцией в сигнале между ближайшими локациями в пространстве. Пространственная автокорреляция более сложна, чем одномерная автокорреляция, потому что пространственная корреляция многомерна (то есть 2 или 3 измерения пространства) и разнонаправленна.

Определение

Согласно БРЭ, индекс Морана ― это показатель, позволяющий выявлять региональные кластеры наряду с индексами Гири и Гетиса — Орда[3].

Глобальный индекс Морана

Глобальный индекс Морана является мерой общей кластеризации пространственных данных и определяется как:

[math]\displaystyle{ I = \frac N W \frac {\sum_{i=1}^N \sum_{j=1}^N w_{ij}(x_i-\bar x) (x_j-\bar x)} {\sum_{i=1}^N (x_i-\bar x)^2} }[/math]
где [math]\displaystyle{ N }[/math] ― число пространственных единиц, индексируемых [math]\displaystyle{ i }[/math] и [math]\displaystyle{ j }[/math]; [math]\displaystyle{ x }[/math] ― процент; [math]\displaystyle{ \bar x }[/math] ― средние значение [math]\displaystyle{ x }[/math]; [math]\displaystyle{ w_{ij} }[/math] являются элементами матрицы пространственных весов с нулями по диагонали (то есть [math]\displaystyle{ w_{ii} = 0 }[/math]); [math]\displaystyle{ W }[/math] ― сумма всех [math]\displaystyle{ w_{ij} }[/math] (то есть [math]\displaystyle{ W = \sum_{i=1}^N \sum_{j=1}^N {w_{ij}} }[/math]).

Определение матриц весов

Значение [math]\displaystyle{ I }[/math] может в значительной степени зависеть от допущений, встроенных в матрицу пространственных весов [math]\displaystyle{ w_{ij} }[/math]. Матрица необходима потому, что для решения проблемы пространственной автокорреляции, а также моделирования пространственного взаимодействия нам нужно наложить структуру, ограничивающую число рассматриваемых соседей. Это связано с первым географическим законом Тоблераruen, который гласит, что все зависит от всего остального, но более близкие вещи — другими словами, закон подразумевает функцию пространственного распада расстояния, так что, хотя все наблюдения оказывают влияние на все другие наблюдения, после некоторого порога расстояния этим влиянием можно пренебречь.

Идея состоит в том, чтобы построить матрицу, которая точно отражает ваши предположения о конкретном пространственном явлении, о котором идет речь. Общий подход заключается в том, чтобы дать вес 1, если две зоны являются соседями, и 0 в противном случае, хотя определение «соседей» может варьироваться. Другой распространенный подход может заключаться в том, чтобы дать вес 1 к [math]\displaystyle{ k }[/math] ближайшие соседи, 0 в противном случае. Альтернативой является использование функции распада расстояния для присвоения весов. Иногда длина общего края используется для присвоения разных весов соседям. При выборе матрицы пространственных весов следует руководствоваться теорией о рассматриваемом явлении. Значение [math]\displaystyle{ I }[/math] довольно чувствителен к весам и может влиять на выводы, которые вы делаете о явлении, особенно при использовании расстояний.

Ожидаемое значение

Ожидаемое значение индекса Морана при нулевой гипотезе отсутствия пространственной автокорреляции равно:

[math]\displaystyle{ E(I) = \frac{-1} {N-1} }[/math]

Нулевое распределение, используемое для этого ожидания, заключается в том, что [math]\displaystyle{ x }[/math] входные данные переставляются перестановкой [math]\displaystyle{ \pi }[/math] выбирается равномерно наугад (и ожидание превышает выбор перестановки).

При больших размерах выборки (то есть по мере приближения N к бесконечности) ожидаемое значение приближается к нулю.

Его дисперсия равна

[math]\displaystyle{ \operatorname{Var}(I) = \frac{NS_4-S_3S_5} {(N-1)(N-2)(N-3)W^2} - (E(I))^2 }[/math]

где

[math]\displaystyle{ S_1 = \frac 1 2 \sum_i \sum_j (w_{ij}+w_{ji})^2 }[/math]
[math]\displaystyle{ S_2 = \sum_i \left( \sum_j w_{ij} + \sum_j w_{ji}\right)^2 }[/math]
[math]\displaystyle{ S_3 = \frac {N^{-1} \sum_i (x_i - \bar x)^4} {(N^{-1} \sum_i (x_i - \bar x)^2)^2} }[/math]
[math]\displaystyle{ S_4 = (N^2-3N+3)S_1 - NS_2 + 3W^2 }[/math]
[math]\displaystyle{ S_5 = (N^2-N) S_1 - 2NS_2 + 6W^2 }[/math][4]

Значения I обычно колеблются от −1 до +1. Значения значительно ниже −1/(N-1) указывают на отрицательную пространственную автокорреляцию, а значения значительно выше −1/(N-1) указывают на положительную пространственную автокорреляцию. Для статистической проверки гипотез значения индекса Морана могут быть преобразованы в z-баллы.

Индекс Морана обратно связан с индексом Гири, но он не идентичен. Индекс Морана является мерой глобальной пространственной автокорреляции, в то время как индекс Гири более чувствителен к локальной пространственной автокорреляции.

Локальный индекс Морана

Глобальный анализ пространственной автокорреляции дает только одну статистику для суммирования всей области исследования. Другими словами, глобальный анализ предполагает однородность. Если это предположение не соответствует действительности, то наличие только одной статистики не имеет смысла, поскольку статистика должна отличаться в пространстве.

Более того, даже если нет глобальной автокорреляции или кластеризации, мы все равно можем найти кластеры на локальном уровне, используя локальный пространственный автокорреляционный анализ. Тот факт, что индекс Морана является суммированием отдельных векторных произведенией, используется локальными индикаторами пространственной зависимости (LISA) для оценки кластеризации в этих отдельных единицах путем вычисления локального индекса Морана для каждой пространственной единицы и оценки статистической значимости для каждой Ii. Из уравнения глобального индекса Морана мы можем получить:

[math]\displaystyle{ I_i = \frac{x_i-\bar x}{m_2} \sum_{j=1}^N w_{ij} (x_j-\bar x) }[/math]

где:

[math]\displaystyle{ m_2= \frac{\sum_{i=1}^N (x_i-\bar x)^2 }{N} }[/math]

тогда,

[math]\displaystyle{ I= \sum_{i=1}^N \frac{I_i}{N} }[/math]
где I ― глобальный индекс Морана, измеряющее глобальную автокорреляцию; Ii ― локальный индекс Морано; N — количество единиц анализа на карте

LISA могут быть рассчитаны, например, в GeoDa, который использует локальный индекс Морано[5], предложенный Люком Анселином в 1995 году[6].

Применение

Индекс Морано широко используется в области географии и географической информатики:

  • при анализе географических различий в переменных здоровья[7];
  • в характеристике влияния концентраций лития в общественной воде на психическое здоровье[8];
  • в диалектологии при измерении значимости региональных языковых вариаций[9];
  • в определении целевой функции для осмысленной сегментации местности при геоморфологических исследованиях[10].

См. также

Источники

  1. Moran P.A.P. (1950). «Notes on Continuous Stochastic Phenomena». Biometrika 37 (1): 17–23. doi:10.2307/2332142. PMID 15420245.
  2. Li Hongfei, Calder C.A. (2007). «Beyond Moran's I: Testing for Spatial Dependence Based on the Spatial Autoregressive Model». Geographical Analysis 39 (4): 357–375. doi:10.1111/j.1538-4632.2007.00708.x.
  3. Демидова О. А. Индекс Морана//БРЭ, 14.03.2023
  4. Cliff and Ord (1981), Spatial Processes, London
  5. Anselin, Luc Exploring Spatial Data with GeoDaTM: A Workbook 138. Spatial Analysis Laboratory (2005).
  6. Anselin L. (1995). «Local Indicators of Spatial Association—LISA». Geographical Analysis 27 (2): 93–115. doi:10.1111/j.1538-4632.1995.tb00338.x.
  7. Getis A. (3 Sep 2010). «The Analysis of Spatial Association by Use of Distance Statistics». Geographical Analysis 24 (3): 189–206. doi:10.1111/j.1538-4632.1992.tb00261.x.
  8. Helbich M., Leitner M., Kapusta N.D. (2012). «Geospatial examination of lithium in drinking water and suicide mortality». Int J Health Geogr 11 (1): 19. doi:10.1186/1476-072X-11-19. PMID 22695110.
  9. Grieve J. (2011). «A regional analysis of contraction rate in written Standard American English». International Journal of Corpus Linguistics 16 (4): 514–546. doi:10.1075/ijcl.16.4.04gri.
  10. Alvioli M., Marchesini I., Reichenbach P., Rossi M., Ardizzone F., Fiorucci F., Guzzetti F. (2016). «Automatic delineation of geomorphological slope units with r.slopeunits v1.0 and their optimization for landslide susceptibility modeling». Geoscientific Model Development 9: 3975–3991. doi:10.5194/gmd-9-3975-2016.