neural network를 이용한 도시침수 위험기준 예측 · 2019-11-25 · [그림 4] neural...

3
- 5 - ž ž Neural Network를 이용한 도시침수 위험기준 예측

Upload: others

Post on 11-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Neural Network를 이용한 도시침수 위험기준 예측 · 2019-11-25 · [그림 4] Neural Network를 이용한 한계강우량 예측결과 지속시간(분)3060180평균 정확도(%)89.3584.4573.0882.29

2019년 한국산학기술학회 추계 학술발표논문집

- 5 -

1. 서론

우리나라는집중호우와태풍등으로매년도심지의침수피

해가 발생하고 있으며, 침수피해의 빈도 및 규모가 증가하고

있다. 이러한 이유로 침수피해를 사전에 예방·대비하기 위한

시스템이 구축ž운영되고 있지만 예·경보 발령을 위한 위험기

준이설정되어있지않아도시침수예방에어려움이있는실

정이다. 이에본연구에서는도시침수예·경보위험기준을제

공하기위해침수를발생시키는강우량인한계강우량과유역

특성을 인공지능 알고리즘의 학습자료로 활용하여 위험기준

을 예측하기 위한 연구를 수행하였다.

2. 자료 수집 및 분석

2.1 한계강우량 산정

침수를발생시키는강우량의기준이되는한계강우량은환

경적 변화가 빠른 도심지의 특성을 반영하기 위하여 최근 5

년간의피해신고자료와피해발생의원인이되는강우자료를

이용하여산정하였다. 침수피해자료는행정안전부 NDMS 사

유시설 피해자료를 이용하였으며, 수집된 피해자료 중 강우

로인한도시유역의침수위험기준산정을위하여호우, 태풍

등으로 인한 침수 피해자료만을 이용하였다.

강우자료는 기상청에서 제공하는 AWS, ASOS 및 항공기

상관측소의 1분 단위 강우자료를 수집하였으며, 수집기간은

피해이력자료 수집기간과동일하게 최근 5년으로하였다. 수

집된 강우자료를 이용하여 지속시간별 최대누적강우량을 산

정하였으며, 피해를발생시킨최소강우량과피해를발생시키

지 않은 최대강우량을 비교ž분석하여 지속시간 30분, 60분,

180분에 대한 한계강우량을 설정하였다.

2.2 유역특성 수집·구축

침수에 영향을 미치는 유역특성 자료를 구축하기 위하여

지자체별 수치지형도, 토지이용도, 우수관거, 건물정보, 빗물

받이및맨홀정보를수집하였다. 수집된지형정보는 GIS프로

그램을 이용하여 관거밀도, 유역경사, 불투수율 및 빗물받이

밀도로추출하였다. 유역경사와불투수율은행정동별평균값

을 이용하였으며, 관거밀도는 직경 600mm이상의 관거 길이,

빗물받이 밀도는 행정동 내의 빗물받이 개수를 각각 행정동

의 면적으로 나누어 산정하였다.

2.3 학습자료 구축

피해이력기반 지속시간별 한계강우량과 유역특성자료를

산정한 후 표 1과 같이동일 행정동에 대하여 매칭하였을 경

우총 112개의 자료를구축할수있었으며, 이를 인공지능알

고리즘 지도학습을 위한 학습자료로 활용하였다. 즉,

를만족시키는함수 를학습한후유역특성인자()를 대입하여 지속시간별 한계강우량()을 예측하고자 하

는 것이다.

Neural Network를 이용한 도시침수 위험기준 예측이한승*, 조재웅**, 강호선***, 황정근****, 문혜진*****

*국립재난안전연구원e-mail:[email protected]

Estimation of Urban Flood Inundation Warning CriteriaUsing Neural Network

Han-Seung Lee*, Jae-Woong Cho**, Ho-Seon Kang***,Jeong-Geun Hwang****, Hye-Jin Moon*****

*National Disaster Management Research Institute

요 약집중호우와태풍등으로인해도심지의침수피해가해마다증가하고있지만침수피해를줄이기위한예·경보기준이미흡한실정이다. 이에 도심지의예·경보기준을설정하기위하여침수를발생시키는강우량인한계강우량 개념 도입을 통해 도시침수 위험기준 연구를 수행하였다.피해이력을기반으로피해시기와강우에대한관계분석을통하여한계강우량을산정하였으며, 동일유역의유출특성을반영할수있는인자를이용하여인공지능알고리즘의학습자료를구성하였다. 한계강우량예측을위하여 Neural Network 알고리즘을이용하였으며, 교차검증알고리즘의하나인 K-fold를 이용하여모델별성능을평가하였다. 향후 학습자료의 추가, 전처리 및매개변수조정을통하여 예측성능을 높일 수있을것으로 판단된다.

Page 2: Neural Network를 이용한 도시침수 위험기준 예측 · 2019-11-25 · [그림 4] Neural Network를 이용한 한계강우량 예측결과 지속시간(분)3060180평균 정확도(%)89.3584.4573.0882.29

2019년 한국산학기술학회 추계 학술발표논문집

- 6 -

행정동유역특성 한계강우량(mm)

관거밀도 불투수율 유역경사 빗물받이밀도 30분 60분 180분A 0.0009 1.20 0.01 0.000006 38.9 52.3 83.7B 0.0052 9.30 0.43 0.000208 32.8 47.1 83.2C 0.0122 70.57 18.55 0.000212 45.0 63.2 108.1

[표 1] 학습자료의 구성

3. Neural Network를 이용한 위험기준 모델

3.1 Neural Network를 이용한 모델 설계

본연구에서는 Neural Network 알고리즘을이용하여한계강우량 예측 모델을 설계하였다. 데이터 예측 모델링 과정은그림 1과 같이 전처리, 학습, 평가 및 예측의 과정으로 나눌수 있다.

[그림 1] 예측 모델링 순서

전처리는특정형식으로지정되지않거나분류되지않은데이터를동일한스케일로만들거나이상치를제거하는과정으로본연구에서는식. 1을 이용하여학습자료를 0.0~1.0 사이의 값으로 변환하는 정규화 과정을 거쳐 모델의 학습자료로이용하였으며, 학습자료의 개수가 112개로 적은수준이라 이상치 제거과정은 거치지 않았다. 전처리된 학습자료를 이용하여 인공지능 알고리즘에 학습시킨 후 예측된 결과에 대한오차를 평가하고 최적모델을 선정하여 예측하고자하는 데이터를 예측한다.

maxmin min

식. 1

모델의 오차산출은 절대평균오차를 이용하였으며, 교차검증 알고리즘의 하나인 K-fold를 이용하여 모델의 성능을 평가하였다. K-fold는 그림 2와 같이 전체데이터를 k개의 집합으로 나누어 (k-1)개의 집합을 훈련데이터로 사용하고 나머지 1개의집합을검증데이터로사용하여 k번반복후모델의성능을 평가하는 교차검증 방법이다. 이러한 방법으로 모델을평가하게되면모든데이터가학습및검증자료에사용되며, 오버피팅이일어날확률이적다는장점이있어최적의모델을 구하기 위한 모델 평가에 사용된다.

[그림 2] K-fold 교차검증

한계강우량 예측에 사용된 Neural Network는 사람 뇌의

기본단위인뉴런이다른뉴런들과연결되어있는거대한생물

학적 네트워크로 이 구조를 이용하여 문제를 해결하는 알고

리즘이다. 뉴런은 다른 뉴런들로부터 정보를 받아 고유한 방

식으로 처리하고, 그 결과를 다른 뉴런에 전달한다.

[그림 3] Neural Network

뉴런의 계산을 위하여 ReLU 활성화 함수를 이용하였다.

ReLU 함수는 입력값이 특정값(0)을 넘으면 입력된 값을 출

력하고 0이하의값은 0으로반환한다. 손실함수의값을가능

한 낮추는 매개변수 값을 찾는 최적화 함수로는 Adam 함수

를이용하였다. Adam은 Momentum과 AdaGrad를혼합한방

법으로Momentum은 경사하강을통해이동하는과정을더욱

빠르게 해주는 것이고 AdaGrad(Adaptive Gradient)는 변수

들을 갱신할 때 변수마다 step size를 다르게 설정해서 이동

하는 방식이다.

Neural Network의주요변수는뉴런과은닉층의개수로표

2와 같이 은닉층은 1, 2, 3층, 층별 뉴런의 개수는 5, 10개로

설정하였다. K-fold의 경우 폴드의 수를 3, 5, 10으로 설정하

여 총 18개의 모델에 대하여 성능을 비교하였다.

Page 3: Neural Network를 이용한 도시침수 위험기준 예측 · 2019-11-25 · [그림 4] Neural Network를 이용한 한계강우량 예측결과 지속시간(분)3060180평균 정확도(%)89.3584.4573.0882.29

2019년 한국산학기술학회 추계 학술발표논문집

- 7 -

Case 뉴런 수 은닉층 수 Case 뉴런 수 은닉층 수1-1 5 1 2-1 10 11-2 5 2 2-2 10 21-3 5 3 2-3 10 3

[표 2] Case 별 매개변수 설정

3.2 결과 비교를 통한 최적 모델 설계

K-fold를 이용하여 지속시간 30분 한계강우량에 대한 교

차검증을수행한결과폴드의수가작을수록절대평균오차는

증가하였으며, 동일한 폴드의 수일 경우 절대평균오차의 차

이는 크지 않았다. 절대평균오차는 Fold의 수가 10일 경우

Case 2-1, 2 모델이 가장 작게 나타났다(표 3 참조).

Case Fold의 수10 5 3

1-1 4.68 4.70 4.731-2 4.68 4.70 4.741-3 4.68 4.70 4.742-1 4.67 4.69 4.742-2 4.67 4.70 4.742-3 4.70 4.75 4.82Min. 4.67 4.69 4.73

[표 3] 지속시간 30분 한계강우량 예측결과(절대평균오차, mm)

지속시간 60분한계강우량에대한교차검증을수행한결과

폴드의수가작을수록절대평균오차는증가하였고동일한폴

드의 수일 경우 절대평균오차의 차이는 크지 않았지만 Fold

의 수가 3일 경우를 제외하고는 뉴런의 수가 많을수록 절대

평균오차는소폭감소하는것으로나타났다. 절대평균오차는

Fold의 수가 10에서 Case 2-3 모델이가장작게나타났다(표

4 참조).

Case Fold의 수10 5 3

1-1 10.13 10.17 10.251-2 10.13 10.17 10.251-3 10.12 10.17 10.252-1 10.08 10.14 10.222-2 10.12 10.14 10.282-3 10.07 10.17 10.33Min. 10.07 10.14 10.22

[표 4] 지속시간 60분 한계강우량 예측결과(절대평균오차, mm)

지속시간 180분 한계강우량에 대하여 교차검증을 수행한

결과폴드의수가작을수록절대평균오차는증가하였고동일

한폴드일경우 Fold의 개수가 3인 Case 2-1~3을 제외하고는

뉴런과은닉층의수가많을수록대부분절대평균오차는유사

하거나 감소하는 경향을 나타냈다. 절대평균오차는 Fold의

수가 10에서 Case 2-3 모델이가장작게나타났다(표 5 참조).

Case Fold의 수10 5 3

1-1 33.16 33.35 33.511-2 33.17 33.25 33.431-3 32.97 33.16 33.282-1 33.07 33.22 33.332-2 32.98 33.25 33.372-3 32.77 32.99 33.67Min. 32.77 32.99 33.28

[표 5] 지속시간 180분 한계강우량 예측결과(절대평균오차, mm)

4. 결론

Neural Network를 이용하여 지속시간별 한계강우량을 예

측하였을 경우 가장 좋은 성능을 나타낸 모델을표 6에 제시

하였다. K-fold의 결과, 모델별 절대평균오차의 차이는 크지

않았지만뉴런의 수가많고 Fold의 개수가 10인 모델들이많

이 선정되었다.

지속시간 (분) (CV) Case 절대평균오차30 (10) 2-1 4.6760 (10) 2-3 10.07180 (10) 2-3 32.77

[표 6] Neural Network 최적모델 선정 결과

최적모델의정확도를평가하였을때평균적으로목표성능인정확도 80%이상을보여주었으며매개변수를다양하게조정하거나학습자료의전처리과정을거쳐이상치를제거하게된다면 모델의 성능을 더욱 높힐 수 있을 것이라 판단된다.(그림 4, 표 7 참조).

[그림 4] Neural Network를 이용한 한계강우량 예측결과

지속시간(분) 30 60 180 평균정확도(%) 89.35 84.45 73.08 82.29

[표 7] Neural Network 최적모델별 정확도

참고문헌[1] 국립재난안전연구원, 딥러닝 기반 도시침수 위험기준 추

정 모델 설계, 2018.