using of bayes belief networks for sustainable development analysis
TRANSCRIPT
Использование байесовских сетейдоверия для анализа устойчивого
развития
БОЛДАК АНДРЕЙ АЛЕКСАНДРОВИЧ05.08.2010 – КИЕВ
НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТУКРАИНЫ
“КИЕВСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ”
5-Я ЛЕТНЯЯ ШКОЛА AACIMP-2010
ПРОЦЕССЫ УСТОЙЧИВОГОРАЗВИТИЯ КАК ОБЪЕКТ
ИССЛЕДОВАНИЯ
НЕОБХОДИМОСТЬ СОГЛАСОВАНИЯ ДАННЫХ РАЗЛИЧНОЙПРИРОДЫ
3
Экономическаясоставляющая
Социальнаясоставляющая
Экологическая составляющая
ИНТЕГРАЛЬНАЯОЦЕНКА
УСТОЙЧИВОГОРАЗВИТИЯ
ИНТЕГРАЛЬНАЯОЦЕНКА
УСТОЙЧИВОГОРАЗВИТИЯ
МЕТОДИКА ИЗМЕРЕНИЯ УСТОЙЧИВОГО РАЗВИТИЯ (МИУР)4
qlsec IIjQ
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ЭКОЛОГИЧЕСКАЯСОСТАВЛЯЮЩАЯЭКОЛОГИЧЕСКАЯСОСТАВЛЯЮЩАЯ
ЭКОНОМИЧЕСКАЯСОСТАВЛЯЮЩАЯЭКОНОМИЧЕСКАЯСОСТАВЛЯЮЩАЯ
СОЦИАЛЬНАЯСОСТАВЛЯЮЩАЯСОЦИАЛЬНАЯ
СОСТАВЛЯЮЩАЯ
ИНДЕКСБЕЗОПАСНОСТИ
ИНДЕКСБЕЗОПАСНОСТИ
КВАТЕРНАЯМОДЕЛЬ УСТОЙЧИВОГОРАЗВИТИЯ
ИНДЕКС КАЧЕСТВАЖИЗНИ
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ИССЛЕДОВАНИЕ ЯВЛЕНИЙ НА РАННИХ СТАДИЯХ СИСТЕМНОГО АНАЛИЗА5
Объект
Объект
X1X1 X2X2 XmXm
СредаСреда
F1F1
……
Fm’Fm’
F2F2
nioO i ,1},{
-2.1431
-1.938
-1.7794-1.7389-1.7139
-1.616-1.5715
-1.4979-1.4304
-1.3596
-1.2684-1.2266-1.2084-1.2057
-1.0903
-1.0019-0.9917-0.9344-0.9161-0.9053
BI BD TD CM UG ZW DZ SN CI LK
-2.4
-2.2
-2.0
-1.8
-1.6
-1.4
-1.2
-1.0
-0.8
-0.6
X1
- выборка объектов
Класс 1 Класс 2 Класс 3
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
REST
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Ie
УпорядочиваниеУпорядочивание
Классификация
Классификация
ПОСТАНОВКА ЗАДАЧИ
ДАННЫЕ ДЛЯ ИССЛЕДОВАНИЯ7
Страна
Индексы устойчивого развития Глобальные угрозы
GDP Q Iql Iec Ie Is Isec ES BB GINI GD CM CP WA GW SFN
D
-2 -1 0 1 2 3 4 5 6X1
-1
0
1
2
3
4
5
6
7
X2
-4 -2 0 2 4 6 8 10 12 14X1
-2
0
2
4
6
8
10
12
14
16
X2
)(,
,j
jjiji X
Xxz
n
xX
n
iji
j
1
,
n
XxX
n
ijji
j
2
1, )(
)(
} 95 стран
ЦЕЛЬ ИССЛЕДОВАНИЯ8
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ЭКОЛОГИЧЕСКАЯСОСТАВЛЯЮЩАЯЭКОЛОГИЧЕСКАЯСОСТАВЛЯЮЩАЯ
ЭКОНОМИЧЕСКАЯСОСТАВЛЯЮЩАЯЭКОНОМИЧЕСКАЯСОСТАВЛЯЮЩАЯ
СОЦИАЛЬНАЯСОСТАВЛЯЮЩАЯСОЦИАЛЬНАЯ
СОСТАВЛЯЮЩАЯ
ИНДЕКСБЕЗОПАСНОСТИ
ИНДЕКСБЕЗОПАСНОСТИ
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ГЛОБАЛЬНЫЕУГРОЗЫ (10)
ИНДЕКСКАЧЕСТВАЖИЗНИ
ИНДЕКСКАЧЕСТВАЖИЗНИ
??
??
????
??
БАЙЕСОВСКИЕ СЕТИ ДОВЕРИЯ
СОВМЕЩЕНИЕ ЭКСПЕРТНЫХ ЗНАНИЙ И СТАТИСТИЧЕСКИХ ДАННЫХ
10
ОбъектОбъектОбъективные
количественныеизмерения
Объективныеколичественные
измеренияЭкспертизаЭкспертиза
Причинно-следственные
связи
Причинно-следственные
связиСтатистические
данныеСтатистические
данныеБСДБСД
ПРИМЕНЕНИЕ БСД
11
БСДБСД
МЕДИЦИНАPathFinder – 60 диагнозов130 переменных
КОСМОСИОБОРОНАЦентр управления полетами NASA“Operation Dardanelles” (Австралия)
ПРОГРАММНОЕОБЕСПЕЧЕНИЕMicrosoft Office
ОБРАБОТКАИЗОБРАЖЕНИЙВосстановление 3D сцен
ЭКОНОМИКАИФИНАНСЫОценка риска и прогноза доходностифинансовых инструментов
БСД – АЦИКЛИЧЕСКИЙ ГРАФ
12
XX
YYПРИЧИНА
ЭФФЕКТ
x1 x2
P(x1) P(x2)
x1 x2
y1 P(y1|x1) P(y1|x2)
y2 P(y2|x1) P(y2|x2)
БАЙЕСОВСКАЯ ВЕРОЯТНОСТЬ
13
XX YY
A : X=x1B : Y= y1 )(
)()|()|(BP
APABPBAP
априорнаявероятностьгипотезы A
априорнаявероятностьгипотезы A
вероятность гипотезы A принаступлении события B
(апостериорная вероятность)
вероятность гипотезы A принаступлении события B
(апостериорная вероятность)
вероятностьнаступления
события B приистинности гипотезы
A
вероятностьнаступления
события B приистинности гипотезы
A
вероятность наступлениясобытия B
вероятность наступлениясобытия B
СОВМЕСТНАЯ ВЕРОЯТНОСТЬ СОБЫТИЙ
14
n
ijj
jjj
BAPAP
APABPBAP
1)|()(
)()|()|(
Пусть A1,A2, …, An - система несовместных событий, тогда
n
iiin AparentAPAAAP
121 ))(|(),...,,(
Состояния всехпеременых-предков для
переменной Ai
Состояния всехпеременых-предков для
переменной Ai
ПРИМЕР15
ДождьДождь Поливалка
Поливалка
ГазонмокрыйГазон
мокрый
True False
0.2 0.8
Rain True False
False 0.4 0.6
True 0.01 0.99
Поливалка (S)
Sprinkler Rain True False
False False 0.0 1.0
False True 0.8 0.2
True False 0.9 0.1
True True 0.99 0.01
Газон мокрый (G)
Дождь (R)
)()|(),|(),,( RPRSPRSGPSRGP
)(),()|(
TrueGPTrueRTrueGPTrueGTrueRP
0.362.0*01.0*99.08.0*4.0*9.02.0*99.0*8.08.0*6.0*0
2.0*99.0*8.02.0*01.0*99.0
),,(),,(),,(),,(),,(),,(
TrueRTrueSTrueGPFalseRTrueSTrueGPTrueRFalseSTrueGPFalseRFalseSTrueGPTrueRFalseSTrueGPTrueRTrueSTrueGP
СТАДИИ16
ОПРЕДЕЛИТЬ ПЕРЕМЕННЫЕИ
ПРИЧИННЫЕСВЯЗИ
ОПРЕДЕЛИТЬ ПЕРЕМЕННЫЕИ
ПРИЧИННЫЕСВЯЗИ
ЗАПОЛНИТЬ ТАБЛИЦЫВЕРОЯТНОСТЕЙ
ЗАПОЛНИТЬ ТАБЛИЦЫВЕРОЯТНОСТЕЙ
ПРОВЕСТИМОДЕЛИРОВАНИЕПРОВЕСТИМОДЕЛИРОВАНИЕ
ОБОБЩИТЬ РЕЗУЛЬТАТЫОБОБЩИТЬ РЕЗУЛЬТАТЫ
СИНТЕЗ БСД
МЕТОДИКА ОЦЕНКИ СТАТИСТИЧЕСКОЙ ЗАВИСИМОСТИ ПОКАЗАТЕЛЕЙ
18
i
iis m
XIXI2log)()(
)(),(min)|()();(
ji
kiikis XHXH
XXHXHXXI
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ФАКТОРНЫЙ АНАЛИЗ ЭНТРОПИЙНЫЙ АНАЛИЗ
ЭНТРОПИЙНЫЙ АНАЛИЗ ПЕРЕМЕННЫХ
СОБСТВЕННАЯИНФОРМАЦИЯПЕРЕМЕННОЙ - усредненная количественная оценка степенинеопределенности (неожиданности) наступления событий, связанных с тем, что переменнаяпринимает значение .
)(log)()()(1
2jii
im
j
jiiii xXPxXPXHXI
iXjix
nimIXI ii ,1,log)( 2max
УДЕЛЬНАЯИНФОРМАТИВНОСТЬПЕРЕМЕННОЙ:i
iis m
XIXI2log)()(
ВЗАИМНАЯИНФОРМАЦИЯПЕРЕМЕННЫХ - статистическая функция двухслучайных величин, определяющая количество информации, содержащейся в однойслучайной величине относительно другой.
)|()();( kiiki XXHXHXXI )()()|( kkiki XHXXHXXH
)(),(min);( jiji XHXHXXI
)(),(min)|()();(
ji
kiikis XHXH
XXHXHXXI УДЕЛЬНАЯВЗАИМНАЯИНФОРМАТИВНОСТЬ:
19
УДЕЛЬНАЯ ИНФОРМАТИВНОСТЬ ПЕРЕМЕННЫХ20
Переменная Удельная информативность
GDP 0.57
Q 0.94
Iql 0.96
Iec 0.87
Ie 0.90
Is 0.95
Isec 0.88
ES 0.54
BB 0.69
GINI 0.80
GD 0.96
CM 0.73
CP 0.93
WA 0.52
GW 0.67
SF 0.73
ND 0.10
МАТРИЦА УДЕЛЬНОЙ ВЗАИМНОЙ ИНФОРМАТИВНОСТИ21
Глобальные
угрозы
Показатели устойчивого развития
GDP Q Iql Iec Ie Is Isec
ES 0.15 0.33 0.28 0.21 0.18 0.24 0.25
BB 0.23 0.26 0.25 0.21 0.17 0.30 0.25
GINI 0.17 0.06 0.10 0.08 0.04 0.15 0.08
GD 0.27 0.30 0.28 0.21 0.24 0.28 0.26
CM 0.18 0.47 0.42 0.24 0.38 0.42 0.30
CP 0.54 0.47 0.46 0.51 0.19 0.35 0.36
WA 0.14 0.46 0.39 0.22 0.32 0.36 0.40
GW 0.54 0.26 0.35 0.33 0.17 0.38 0.16
SF 0.08 0.13 0.09 0.09 0.07 0.07 0.13
ГРАФ БСД22
Глобальные
угрозы
Показатели устойчивого развития
GDP Q Iql Iec Ie Is Isec
ES 0.15 0.33 0.28 0.21 0.18 0.24 0.25
BB 0.23 0.26 0.25 0.21 0.17 0.30 0.25
GINI 0.17 0.06 0.10 0.08 0.04 0.15 0.08
GD 0.27 0.30 0.28 0.21 0.24 0.28 0.26
CM 0.18 0.47 0.42 0.24 0.38 0.42 0.30
CP 0.54 0.47 0.46 0.51 0.19 0.35 0.36
WA 0.14 0.46 0.39 0.22 0.32 0.36 0.40
GW 0.54 0.26 0.35 0.33 0.17 0.38 0.16
SF 0.08 0.13 0.09 0.09 0.07 0.07 0.13
ДИСКРЕТИЗАЦИЯ ИСХОДНЫХ ДАННЫХ23
Переменная
Дискретные значения
Low Medium High
GDP 0.75<= (0.75, 2.51] >2.51
Q -1.06<= (-1.06, 0.37] >0.37
Iql -0.82<= (-0.82, 0.56] >0.56
Iec -0.74<= (-0.7, 40.71] >0.71
Ie -0.95<= (-0.95, 0.47] >0.47
Is -1.01<= (-1.01, 0.29] >0.29
ES 0.78<= (0.78, 2.42] >2.42
GD -0.99<= (-0.99, 0.32] >0.32
CM -1.58<= (-1.58, -0.36] >-0.36
CP -0.12<= (-0.12, 1.01] >1.01
WA -2.62<= (-2.62, -0.95] >-0.95
GW -2.34<= (-2.34, -0.65] >-0.65
МОДЕЛИРОВАНИЕ
ПРОГРАММЫ ДЛЯ МОДЕЛИРОВАНИЯ БСД24
ВЕРОЯТНОСТНЫЙ ВЫВОД В БСД25
СвидетельстваIql=High & Isec=HighСвидетельстваIql=High & Isec=High
ГипотезыCM=High, p=0.99WA=High, p=0.99Is=High, p=0.95
ГипотезыCM=High, p=0.99WA=High, p=0.99Is=High, p=0.95
ТИПЫ ГИПОТЕЗ26
СвидетельстваЗначения индексовустойчивого развития
СвидетельстваЗначения индексовустойчивого развития
ГипотезыЗначения глобальныхугроз
ГипотезыЗначения глобальныхугроз
СвидетельстваЗначения глобальныхугроз
СвидетельстваЗначения глобальныхугроз
ГипотезыЗначения индексовустойчивого развития
ГипотезыЗначения индексовустойчивого развития
,,,,,,,3,0,,,
,3,0,,,,)(:),(:),(:),(: secsec
HighMediumLowUndefinedxxxxlkji
lkjixIExIExIExIE
lkji
lqllIqlk
kjq
jIqiGDP
iGDP
HighMediumLowUndefinedxxxxlkji
xGWHxWAExCPExCME
lkji
llGWk
kWAj
jCPi
iCM
,,,,,,3,0,,,
,)(:),(:),(:),(:
ТИП 1
ТИП 2
ВСЕГО: 512 СТРОК В ТАБЛИЦЕ РЕЗУЛЬТАТОВМОДЕЛИРОВАНИЯ
ОБОБЩЕНИЕ РЕЗУЛЬТАТОВМОДЕЛИРОВАНИЯ
МЕТОД ОБОБЩЕНИЯ РЕЗУЛЬТАТОВ29
Q=“High” ES=“Low”512 -> 85
ПРОВЕРКА ОБОБЩЕНИЯ РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ30
Австрия
Бельгия
Бразилия
Швейцария
ЧилКолумбия
Коста-Р
Чехия Германия
Дания
ЭстонияИспания
Финляндия
ФранцияВеликобританияГреция Хорватия
Венгрия
ИрландияИзраилИталия
Япония
Лит
Люксембург
ЛатвияНидерланды
Новая Зеландия
Пан
Польш
Португалия
Швеция
СловенияСловакия
США
Уругвай
0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0Q
-2.0
-1.8
-1.6
-1.4
-1.2
-1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
ES
-3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
Q
-2
-1
0
1
2
3
4
5
ES
Q=“High” ES=“Low”
ПРОВЕРКА ОБОБЩЕНИЯ РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ31
LowMedium High
Албания
Армения
Аргентин
Австрия
Австралия
Азербайджан
Босния и Герцеговин
Бангладеш
Бельгия
Болгария
Бенин Боливия
Бразилия
Ботсван
Канад
Швейцария
Чил
Камерун Китай
Колумбия
Коста-Р
Чехия
Германия
Дания
Доминиканская Республ
Ал
Еквад
ЭстонияЕгипет
Испания
Эфиопия
Финляндия
Франция
Великобритания
Грузия
Греция
ГватемалГондурас
Хорватия
Венгрия
Индонезия
Ирландия
Израил
Индия
Италия
Ямай
Иордания
Япония
КенияКиргизия
Камбод
Южная Корея
Казахстан
Лит
Люксембург
Латвия
Молд
МексМалайзия
Мозамб
Намибия
Нигерия
Никарагу
Нидерланды
Норвегия
Непал
Новая Зеландия
Пан
Перу
Пакистан
Польш
Португалия
Румыния
Россия
Швеция
Словения
Словакия
Сенегал
Ель Сальвад
Таиланд
Таджикистан
Туниc
Турция
Тринидад и ТобагТанзанияУкраин
США
Уругвай
Узбекистан
Венесуел
Вьетн
ЮАРЗамбия
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5Iql
-3
-2
-1
0
1
2
3
Isec
Если показатели качества ибезопасности жизни людей имеют
низкий или средний уровень, тодля таких стран наблюдается
высокая уязвимость к влияниюкоррупции. Если хотя бы один изэтих показателей имеет высокое
значение, то это связано соснижением уязвимости к влиянию
коррупции.
Если показатели качества ибезопасности жизни людей имеют
низкий или средний уровень, тодля таких стран наблюдается
высокая уязвимость к влияниюкоррупции. Если хотя бы один изэтих показателей имеет высокое
значение, то это связано соснижением уязвимости к влиянию
коррупции.
Австрия
Австралия
Бельгия
Канад
Швейцария
Германия
Дания
Испания
Финляндия
Франция
Великобритания Ирландия
Израил
Италия
Япония
Люксембург
Нидерланды
Норвегия
Швеция
США
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0GDP per capita
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
CP
ПРОВЕРКА ОБОБЩЕНИЯ РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ32
Для стран с высоким уровнем GDP наблюдается низкий уровень
уязвимости к коррупции
Для стран с высоким уровнем GDP наблюдается низкий уровень
уязвимости к коррупции
ВЫВОДЫ
МЕТОДИКА АНАЛИЗА ПРИЧИННО-СЛЕДСТВЕННЫХ ОТНОШЕНИЙ МЕЖДУФАКТОРАМИ И ПОКАЗАТЕЛЯМИ УСТОЙЧИВОГО РАЗВИТИЯ
34
Синтез Байесовской сетидоверия
Синтез Байесовской сетидоверия
ОбобщениерезультатовОбобщениерезультатов
Моделирование
Моделирование
В частности, для стран с высокими значениямииндексов устойчивого развития Q(Ie,Iec,Is)характерны высокие значения подиндексовэкономического (Ie) и социального (Is) развития(строки 1-10). Также можно говорить о том, чтовысокий уровень защищенности от детскойсмертности наблюдается в тех странах, длякоторых характерными являются высокие илисредние показатели индексов устойчивогоразвития, качества жизни (Iql) и безопасностижизни (Isec) (строки 12-16).
В частности, для стран с высокими значениямииндексов устойчивого развития Q(Ie,Iec,Is)характерны высокие значения подиндексовэкономического (Ie) и социального (Is) развития(строки 1-10). Также можно говорить о том, чтовысокий уровень защищенности от детскойсмертности наблюдается в тех странах, длякоторых характерными являются высокие илисредние показатели индексов устойчивогоразвития, качества жизни (Iql) и безопасностижизни (Isec) (строки 12-16).
Экспертная модель причинно-следственных отношений
Экспертная модель причинно-следственных отношений
Выборка данныхВыборка данных
ИНФОРМАЦИЯ О ДОКЛАДЧИКЕ
БОЛДАК АНДРЕЙ АЛЕКСАНДРОВИЧк.т.н., доцент кафедры вычислительной техники НТУУ«КПИ», с.н.с. Мирового центра данных погеоинформатике и устойчивому развитию.
Адрес электронной почты: [email protected]
ОБЛАСТЬНАУЧНЫХИНТЕРЕСОВПрименение формальных методов многомерного статистическогоанализа и причинно-следственных моделей для анализа процессовустойчивого развития, проблемы согласования данных различнойприроды в рамках информационных системных моделей, проектирование и разработка распределенных информационныхсистем.