Геостатистичне моделювання. Просторова інтерполяція. Детерміновані методи просторової інформації. Глобальні методи інтерполяції
Розділ 8. Геостатистичний аналіз і моделювання
8.1. Геостатистичне моделювання
До геостатистичного моделювання в геоінформатиці, як правило, відносять діяльність, спрямовану на побудову (моделювання) безперервних поверхонь на основі масивів точкових даних, отриманих у результаті інструментальних вимірювань, відбору і обробки проб ґрунту, води, повітря та ін. або картометричних робіт з використанням вибіркового методу.
Процедури просторового моделювання реалізовані в багатьох спеціалізованих пакетах, що досить широко використовуються на практиці. До них належать, наприклад, пакети Surfer (Golden Software), Gstat (Pebesma, Wesseling, 1998), GST (Мальцев, 1993), TECHBASE (Minesoft, USA), MICROMINE (Micromine Pty Ltd, AUSTRALIA).
Останніми роками модулі геостатистичного аналізу і моделювання включаються до складу інструментальних ГІС з розвиненими аналітичними можливостями. Вони дають можливість дослідження структури дискретних наборів просторово-координованих даних, побудови на їх основі безперервних поверхонь і, таким чином, оцінки (прогнозу) значень змінної в точках (комірках растра), у яких вона не визначалася (не спостерігалася, не вимірювалася), і оцінки точності (або похибки) цієї побудови з використанням статистичних методів. Як приклад таких модулів наведемо розширення (extention) Geostatistical Analyst (Геостатичний аналіз), введене розробниками до складу ГІС-пакетів фірми ESRI, починаючи з пакетів сімейства ArcGIS версії 8.1, і модуль Surface Modeling and Geostatistics (Моделювання поверхонь і геостатистика), що ввійшов до складу останньої (2003) версії пакета Idrisi (Idrisi Kalimanjaro).
В основі методів побудови (моделювання) безперервних поверхонь на основі дискретних (точкових) масивів просторово-координованих даних лежать процедури просторової інтерполяції. При цьому використовуються як стохастичні, так і детерміністичні підходи.
8.2. Просторова інтерполяція
Інтерполяція — обчислення проміжних значень якої-небудь величини за деякими відомими її значеннями. Інтерполяція використовується в багатьох прикладних напрямках наук про Землю. У метеорології інтерполюються дані спостережень метеостанцій для одержання карт погоди на великі території, інтерполюються дані океанологічних і гідрологічних вимірювань, будуються поля концентрацій речовин у різних середовищах та ін. У геології інтерполяція застосовується для побудови двовимірних і тривимірних моделей підземних масивів за даними точкових шпар.
Для створення інтерпольованої карти як мінімум необхідний набір точок з даними про їх просторове положення (координати х, у в користувальницькій системі або у вигляді широти/довготи) і кількісне значення параметра (z) у цих точках — висота, тиск, температура, концентрація забруднювача та ін. У більшості практичних випадків мережа таких вихідних точок (data point) нерегулярна, має різну щільність, великі розриви тощо.
Завданням просторової інтерполяції є побудова на основі мережі вихідних точок суцільної поверхні з заданим розміром кроку сітки вузлів, що розраховуються. Залежно від необхідної просторової точності вибирається різний крок (наприклад, ділянка розміром 10x10 км може бути інтерпольована із кроком 100 м (100x100 вузлів сітки) або з кроком 10 м (1000x1000 вузлів). На підставі числових значень точок даних розраховується значення для кожного вузла мережі, що інтерполюється. Звичайно процедура інтерполяції виконується для області прямокутної форми — растра (рис. 8.1).
Рис. 8.1. Загальна схема просторової інтерполяції
В англомовній науковій літературі процедура побудови регулярної прямокутної сітки числових значень на основі мережі нерегулярних точок одержала усталене найменування gridding, масив інтерпольованих по регулярній сітці даних — grid, окремий вузол інтерпольованої сітки — node. На основі регулярного масиву даних х, у, z можливе проведення великої кількості аналітичних процедур, а також побудова різних видів графічних відображень поверхонь: ізолінійних зображень, блок-діаграм, напівтонових або градієнтних зображень.
Існуючі методи інтерполяції можна поділити на дві великі групи — глобальні і локальні. Локальні методи інтерполяції, у свою чергу, поділяються на локальні детерміновані і локальні стохастичні.
8.3. Детерміновані методи просторової інформації
8.3.1. Глобальні методи інтерполяції
Глобальні методи інтерполяції одночасно використовують всі наявні дані для виконання прогнозу для всієї даної території, тоді як локальні методи оперують у межах невеликих зон навкруги належних інтерполяції вузлів для того, щоб забезпечити виконання оцінки тільки за даними, розміщеними в безпосередній близькості від точок прогнозу або оцінювання.
Глобальні інтерполяції, як правило, використовуються не для безпосередньої інтерполяції, а для дослідження і можливого видалення ефекту глобальних варіацій (тренда), обумовлених зовнішніми чинниками. Після того як глобальні ефекти будуть видалені, відхилення від глобальних варіацій можуть інтерполюватися з використанням локальних методів.
Глобальні методи звичайно прості для обчислення і часто базуються на стандартних статистичних ідеях варіаційного аналізу і регресії. До них відносять (Burrough., McDonnel, 1998):
- класифікації з використанням зовнішньої інформації;
- поліноміальну регресію з геометричними координатами;
- регресійні моделі.
Класифікаційні методи використовують досяжну інформацію (таку, як ґрунтові типи або адміністративні території) для того, щоб поділити досліджувану територію на регіони, які можуть бути охарактеризовані статистичними моментами (середньою, дисперсією) атрибутів, виміряних у точках, розміщених у межах цих регіонів.
Методи поліноміальної регресії з геометричними координатами х, увикористовують поліноми різних ступенів вигляду
Формула
Перші чотири рівняння (8.1), тобто поліноми нульового, першого, другого і третього ступеня, є:
Формула
Поліном (8.1) є, по суті, рівнянням трендової поверхні для заданого набору точкових значень. Ціле р є порядком трендової поверхні, для якої існує (р+ 1)(р + 2)/2 коефіцієнтів brs, які потрібно підібрати для того, щоб мінімізувати функціонал:
Формула
Таким чином, горизонтальна поверхня має порядок нуль, похила плоска поверхня — перший порядок, квадратична поверхня — другий порядок, кубічна поверхня з десятьма коефіцієнтами має третій порядок. Знаходження коефіцієнтів brsє стандартною процедурою в задачах на множинну регресію, тому обчислення легко виконуються за допомогою стандартних статистичних пакетів.
Після знаходження коефіцієнтів brs трендова поверхня може бути відображена оцінкою значень z(x, у) у всіх точках регулярної мережі.
Порядок трендової поверхні р з формальної точки зору може бути скільки завгодно великим. Збільшення порядку полінома, як правило, призводить до збільшення ступеня його відповідності реальній поверхні. Проте при цьому, з одного боку, втрачається фізичне значення побудови, з іншого — різко збільшуються вимоги до обсягу даних, необхідних для знаходження коефіцієнтів brs.
Регресійні методи ґрунтуються на використанні можливого функціонального зв'язку між атрибутами, які легко вимірюються. Наприклад, концентрації забруднювача в ґрунті — від відстані до джерела забруднення, швидкості вітру — від шорсткості поверхні і т.п. Емпіричну регресійну модель часто називають трансформаційною функцією. Вона має вигляд
Формула