문화관광 빅 데이터 분석대회 - report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕...

67
외래 관광객 1200, TrackTrack하다. - 로밍 데이터 분석을 통한 시티투어버스 노선 개선 개발 - Report 65

Upload: others

Post on 07-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만, Track을 Track하다. - 로밍 데이터 분석을 통한 시티투어버스 노선 개선 및 개발 -

Report 65

Page 2: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

1. 문제인식

프로젝트 분석계획

서울시티투어버스의 현 주소

[한국 여행 시 불편사항] (한국문화관광연구원, 2012)

언어와 교통문제 해결을 시티투어로!

[서울시티투어버스 이용경험] (서울시, 2013)

서울시티투어버스의 낮은 이용률

Page 3: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

2. 요약

프로젝트 분석계획

과학적 노선: 어디를 ,어떻게 방문하는가?

군집분석과 연관성 분석 → 실제 외래관광객의 행동패턴 파악

A

B

어디를 많이 방문할까? 어디와 어디를 함께 갈까? 낮과 밤은 어떻게 다를까?

(9:00~18:59) (19:00-1:00)

Page 4: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

3. 로밍 콜 수 분석

프로젝트 분석계획

어느 ‘동’을 많이 갈까? - 로밍 통화 발생 수

(9:00~18:59) (19:00-1:00)

명동

신당동

낮의 “명동”, 밤의 “신당동”

Page 5: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

프로젝트 분석계획

4. 로밍 콜 수 연관성분석

연관성 분석: 어디와 어디를 같이 갈까?

(9:00~18:59)

강남

2.9

신당동

동대문

명동

1.61 1.44

시청

신당동

명동 신당동 신당동

동대문

(19:00-1:00)

Page 6: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

5. 군집분석

프로젝트 분석계획

어느 지역에 많이 갈까? 군집분석

(9:00~18:59) (19:00-1:00)

낮과 밤의 다른 분포

명동 근처 : 명동 강남 근처 : 압구정, 삼성동, 역삼동

명동 근처 : 광화문, 명동, 용산 강남 근처 : 신사동, 역삼동

Page 7: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

6. 군집바탕의 연관성분석

프로젝트 분석계획

연관성 분석: 어디와 어디를 같이 갈까?

강남

명동

0.46

(9:00~18:59)

* 밤(19:00~1:00)은 유의미한 결과가 나오지 않음

Page 8: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

7. 분석 결과

시티투어버스 개선 방안

사람들이 많이 방문하는 곳을 지나는 노선

1. 환승역으로 거점화

√ 낮: 명동, 동대문, 신당동, 강남

(19:00-1:00)

(19:00-1:00)

+ 29% 명동

신당동 신당동

√ 밤: 명동, 신당동 중심

(19:00-1:00)

+ 29% 명동

명동

강남

신당동

명동

신당동

동대문

명동

(9:00~18:59) (19:00-1:00)

명동

이상적인 노선

Page 11: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

현행 노선 파악

√ 1층 버스 도심고궁(낮) √ 2층 버스 낮

8. 개선 방안

√ 특정 테마 중심의 노선

하나의 노선에서 명동, 동대문, 신당동을 가는 노선은 없음

현행 시티투어버스 노선

Page 12: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

결론

9. 결론

시티투어버스의 이용률 향상 외래관광객의 불편함 감소

외래관광객이 많이 가는 곳과

함께 가는 곳을 파악

현행 시티투어버스와 비교 후

개선점 제안

외래관광객 불편함 해소 방안으로서의

시티투어버스

시티투어버스의 낮은 이용률

결론

Page 13: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

감사합니다

Q&A

Page 14: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

Appendix

Page 15: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

Appendix

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석 분석 결과 개선 방안 및 결론

Page 16: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석 분석 결과 개선 방안 및 결론

서울은 국내 관광지 중 가장 유명하지만, 서울

시티투어버스의 이용률은 저조하다. 우리는 군집

분석과 연관성분석을 통해 현행 시티투어버스의

노선과 실제 관광객의 방문 패턴의 차이를 확인하고

데이터에 기반한 새로운 시티투어 버스 노선을 제안

한다.

요약

Page 17: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약

프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석 분석 결과 개선 방안 및 결론

Page 18: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 외래 관광객의 로밍 정보 - 콜 발생 순간의 위치정보 (위도, 경도, 우편번호) - 시간 정보 (날짜, 시간) - 개인정보 (로밍 아이디, 국가코드)

√ 과학적 증거 기반의 관광 정책 수립, 상품 개발, 마케팅 활동 등을 통해 사업의 생산성 및 부가가치 창출 √ 맞춤형 관광 서비스 제공을 통해 서비스 품질 향상 및 생산성 향상

√ 창의적 관광산업 발전 전략 및 관광 정보 분석기술 개발

분석 대상 Data

분석 목적

분석 목표

프로젝트 개요

프로젝트 파악

Page 19: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

2) 서울시는 전체 외래 관광객 82.5%의 방문지역으로서 한국 내 대표적인 관광 지역으로 부각됨

자료2 : 외래 관광객 실태조사 (2012) / 중복응답

늘어나는 외래 관광객 (2013년은 예상치, 단위:만명)

외래 관광객의 지역 방문율

1) 외래 관광객이 증가하고 있음

외래 관광객 현황

자료1 : 외래관광객 실태조사(2013), 문화체육관광부

프로젝트 개요

사전 조사

Page 20: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

자료3 : 닐슨컴퍼니, 2010

중국 일본 태국

1 서울 (16.4%) 서울 (10.6%) 서울 (19.0%)

2 도쿄 (11.0%) 호놀룰루 (10.2%) 도쿄 (16.8%)

3 시드니 (9.4%) 파리 (5.4%) 몰디브 (9.8%)

4 파리 (8.6%) 괌/사이판 (5.2%) 싱가포르 (4.7%)

5 몰디브 (6.6%) 뉴욕 (5.0%) 시드니 (4.4%)

1년 이내 가장 가보고 싶은 도시

외래 관광객 현황

3) 중국, 일본, 태국 외래 관광객 설문조사 결과 서울은 가장 가고 싶은 도시 1위로 집계됨

4) 문화체육관광부 외래관광객 실태조사에 따르면 외래 관광객의 3년 내 서울 재방문율은 2005년 44.7%

에서 2012년 41.8%로 “감소 추세” But

프로젝트 개요

사전 조사

Page 21: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

언어소통과 교통 혼잡 문제를 해결하기 위한 방안은?

자료4 : 한국문화관광연구원(2012년 1~11월)

한국 여행 시 불편사항 (외국인 1만 1035만명 설문)

5) 주요 불만 요인으로 언어소통, 교통혼잡 문제가 지목됨

서울 외래관광객의 재방문율이 높아질 것임

외래 관광객 현황

언어소통과 교통혼잡 문제가

개선된다면?

6) 외래 관광객을 위한 맞춤형 교통수단

즉, “시티투어버스”가 해결책이 될 수 있음 !

City Tour Bus

프로젝트 개요

사전 조사

Page 22: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

서울 시티투어버스 현황

8) 서울 시티투어버스의 노선이 실제 외래 관광객이 방문 하는 곳과 다르기 때문에 이용이 적을 것이라 예상

자료5 : 2013 서울시 외래관광객 실태조사 보고서

7) 서울시에서 운용하는 ‘서울시티투어버스’ 이용 실태를 조사한 결과, 시티투어버스를 ‘이용했다’는 응답은 4.9%로 나타남

서울 시티투어버스 (이용 경험 여부)

이용 하지 않음

이용 함

프로젝트 개요

사전 조사

4.9%

95.1%

Page 23: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석 분석 결과 개선 방안 및 결론

Page 24: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

분석 계획

프로젝트 분석계획

√ 서울을 방문하는 외래관광객은 증가, 하지만 재방문율은 감소 √ 언어소통과 교통혼잡에 대한 불만족도가 높음 √ 시티투어버스는 언어소통과 교통혼잡 문제를 해결하는 좋은 방안이 될 수 있음 √ 낮은 시티투어버스 이용률은 노선의 개선으로 해결될 수 있을 것이라 예상함

사전조사 결과를 바탕으로 현 관광서비스에 대한 문제점 파악

“ 한국을 방문하는 외래 관광객의 위치정보를 기반으로 그 패스(Path)를 추적(Track) → 기존의 시티투어버스의 노선과 비교∙분석 ”

Page 25: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 히스토그램, 히트맵 등 기초 분석 √ Clustering 군집 분석 √ Association Rule 연관성 분석

데이터 분석 방법

분석 계획

프로젝트 분석계획

데이터 가정

√ 순수 관광목적의 외래 관광객은 전화 통화를 많이 하지 않을 것이라고 가정 따라서, 전화 통화 건수가 많은 사람들은 제외함 √ 통화 한 사람은 통화 발생 시간과 위치에서 활동을 하고 있다고 가정

Page 26: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획

데이터 준비 기본 분석 추가 분석 분석 결과 개선 방안 및 결론

Page 27: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

데이터 준비

데이터 처리

기본 데이터

√ 시간정보 세분화(월, 일, 요일, 시간) 필요 √ 위도(latitude), 경도(longitude) 만으로는 정확한 위치 파악 불가 √ 위치정보 주소로 변환 필요

데이터 추출

call20 = as.data.frame(table(merged$id)) call20 = subset(call20, call20$Freq < 20) Less20= subset(merged, merged$id %in% call20$Var1)

√ 기본 데이터(roaming_sample_final.csv)에서 “20콜 이하” 데이터만 추출

Page 28: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

데이터 분할하기

√ 데이터(roaming_sample_final.csv)의 time열에서 시(hour)를 분리 √ 데이터(roaming_sample_final.csv)의 date열에서 월(month), 일(day), weekday(요일)분리

roaming$date = as.character(roaming$date) roaming$month = substr(roaming$date, 5, 6) roaming$day = substr(roaming$date, 7, 8) roaming$time = as.character(roaming$time) roaming$hour = ifelse(roaming$time > 1000 , substr(roaming$time, 1, 2), ifelse(roaming$time>99, substr(roaming$time, 1,1), 0)) roaming$date = as.character(roaming$date) roaming$weekday = weekdays(as.Date(roaming$date, '%Y%m%d')) roaming$weekday = factor(roaming$weekday, levels=c("일요일", "월요일", "화요일", "수요일", "목요일", "금요일", "토요일"))

데이터 준비

데이터 처리

Page 29: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

데이터 준비

데이터 처리

우체국 데이터와의 통합

+

Roaming_sample_final data

우체국 data

merged data

merged = join(roaming, zipcode, by="zip", type="left") Seoul_less_20 = subset(Less20, Less20$sido == "서울특별시")

√ 우체국 홈페이지에서 우편번호 DB 다운로드 √ 이를 기본 데이터와 병합 √ 또한 그 중, “서울특별시” 데이터만 추출

Page 30: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

날씨 데이터와의 통합

√ 기상청으로부터 2013년 12월, 2014년 1월, 2월의 날씨 데이터 획득 √ 이를 우리의 서울의 로밍 데이터와 매치 시킴

weather = read.csv("weather.csv") seoul20weather = join(seoul_less_20, weather, by="date", type="left")

Seoul data

기상청 data

merged data

+

데이터 처리

데이터 준비

데이터 처리

Page 31: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

파일 변환

√ SAS Enterprise Guide로 CSV 파일 Import

데이터 처리

콜 수 분포 그래프

√ 시간 별 √ 나라 별 √ 요일 별 √ 시∙도 별 √ 아이디 별 √ 날씨 별

데이터 준비

데이터 처리

Page 32: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비

기본 분석 추가 분석 분석 결과 개선 방안 및 결론

Page 33: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

기초 탐색

기본 분석

시도별 콜 수의 분포

√ 서울지역에서 최대 콜 수 발생 √ 많은 관광객이 서울을 방문 하므로, 관광객들의 재방문율을 높이기 위해서는 서울에 대한 집중적인 분석이 요구됨

Page 34: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

전체 데이터 1774618 중 1.096.187(61.77%)이 20콜 이하

분석대상 Data

x축 : ID당 콜을 한 사람의 빈도수 Y축 : ID 빈도수

√ 우리 조사에서는 한 아이디 당 20콜 이하의 데이터만 사용 - 방한 후 통화를 많이 한 사람은 관광 목적보다는 비즈니스 목적이 강하다고 짐작됨 - 20 통화 이상의 사람은 전체 7% 차지, 그러나 전체 통화발생에서 38%를 담당 - 20이상을 한 ID를 제외 함으로써, 이상치에 의해 전체 분석이 왜곡되는 것을 방지

ID 당 통화 빈도수

기초 탐색

기본 분석

Page 35: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 전국

√ 서울

시간에 따른 콜 발생 수

√ 전국의 콜 발생 추이와 서울의 콜 발생 추이를 비교 했을 때, 서울의 주야간 활동인구와 전국의 주야간 활동인구가 다르지 않음 √ 낮, 밤 그리고 새벽을 구분했을 때, 낮과 밤에 사람들의 활동이 많이 나타났지만, 새벽에는 나타나지 않아 새벽 데이터는 제외 하고 분석을 진행 하기로 함

√ 서울 낮 ( 9:00a.m.~ 6:59p.m.)

√ 서울 밤 (7:00p.m ~ 12:59a.m.)

√ 시간 별 데이터 구분 - 1am-8:59am : 투어버스 운행 안 함 / 데이터 제외 - 9am-6:59pm : 주간 투어버스 노선 데이터 분석 - 7pm-12:59am : 야간 투어버스 노선 데이터 분석

기초 탐색

기본 분석

Page 36: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 전국 √ 서울

√ 서울 낮 √ 서울 밤

요일에 따른 콜 발생 수

√ 전국, 서울, 서울의 낮과 밤 이 모든 상황에서 요일에 따른 콜 발생 수는 매우 비슷한 형태를 보임

기초 탐색

기본 분석

Page 37: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 전국, 서울, 서울의 낮과 밤 이 모든 상황에서 국가에 따른 콜 발생 수는 대체적으로 비슷한 형태를 보임 √ N02 국가는 밤에 활동이 약해짐

√ 전국 √ 서울

√ 서울 낮 √ 서울 밤

국가코드에 따른 콜 발생 수

기초 탐색

기본 분석

Page 38: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 서울 밤 √ 서울 낮

√ 서울 √ 서울의 낮과 밤은 비슷해 보이지만 약간의 차이가 있음 - 명동에 사람이 집중되는 공통점

- 하지만, 밤에 신당동에 사람이 많이 방문하는 차이점

신당동

명동

동 별 통화 발생 빈도

기초 탐색 기초 탐색

기본 분석

Page 39: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

히트맵 (Heat Map)

√ 상위 10개 동 과해동 광장동 명동2가 삼성1동 신당동 신사동 을지로2가 충무로1가 충무로2가 태평로2가

√ 콜 발생 빈도 수가 가장 많은 10개 동을 선정하여 시간에 따른 콜 발생 빈도를 알아봄 √ 오전 11시부터 21시 까지 콜이 많이 일어나는 시간 - 대부분의 동에서 발생된 콜은 이 시간에 집중됨 √ 신당동에서는 23시에서 1시 사이에 콜 발생이 집중됨

기초 탐색

기본 분석

Page 40: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

군집

관광객이 모

여 있는 곳

연관성

관광객이 이

동하는 패턴

관광객이

선호 하는

이동 패턴

시티투어 버스 노선이 필요한 곳

낮과 밤

날씨별

주요국가별

요약도

모델링

기본 분석

Page 41: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

군집 분석

√ 군집 분석 - input: 위도, 경도 - ID: 이용자 ID - 어느 위치에 사람들이 얼마나 모였는지 확인 √ 군집의 차이점 판단 기준 - 사람들이 많이 방문한 주요 장소(명동, 강남)을 거점으로 하여 군집의 구성의 차이를 확인 √ 절대값이 아닌 상대값으로 비교 √ 군집을 서울의 낮과 밤, 국가, 날씨 별로 분석

기본 분석

모델링Ⅰ.

Page 42: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

기본 분석

모델링Ⅰ.

군집분석 결과표

1. 서울 전체

Segment ID 사람수 lat long address

1 30490 37.56261211 126.8014251 방화2동(김포공항)

2 2904 37.65198789 127.0433304 쌍문 2동

3 26903 37.55606259 126.9268214 서교동(홍대)

4 2309 37.48671115 127.1105868 가락 1동(가락시장, 수서역)

5 11035 37.48592912 126.9010906 대림2동(구로 디지털 단지)

6 21788 37.55110352 127.1015105 광장동(쉐라톤 워커힐 호텔)

7 3136 37.46648979 126.8969851 독산1동

8 239538 37.56442402 126.988153 저동1가(명동)

9 55735 37.51570871 127.0456636 삼성2동(청담)

10 6945 37.54704404 126.8594442 등촌동(sbs)

11 7600 37.47833757 127.018641 서초동(여술의 전당)

12 19703 37.52212022 126.9174912 여의동(kbs, 여의도공원)

13 11486 37.57748787 127.0362044 용두동(경동시장)

14 4323 37.60592764 127.0496203 상월동

15 21578 37.51108108 127.1016197 잠실3동(잠실)

16 29795 37.53675957 126.9806925 용산2동(국립중앙박물관)

17 5454 37.50508205 126.8753798 구로2동

18 38360 37.50220337 127.0245245 서초4동(논현, 강남)

19 2303 37.60894382 126.9382715 녹번동

20 4305 37.58144096 126.9105014 북가좌2동

Page 43: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

기본 분석

모델링Ⅰ.

군집분석 결과표

2 서울 낮

Segment ID 사람수 Lat Long address

1 25774 37.56259892 126.8033372 방화2동(김포공항)

2 1641 37.65376199 127.0440983 창동

3 4446 37.5904534 126.9202674 응암3동

4 5114 37.50135298 126.8857984 구로5동

5 8701 37.48348413 127.0198486 서초동(남부터미널)

6 19184 37.52320476 127.0345855 신사동(가로수길)

7 2105 37.46684122 126.8957253 독산1동

8 19443 37.55636791 126.9262764 서교동(홍대)

9 13477 37.55171425 127.1033727 광장동(워커힐)

10 3869 37.5406936 126.8657442 목3동

11 1680 37.48664002 127.1103266 가락동

12 139547 37.5622848 126.9888813 충무로2가(명동)

13 39221 37.50623259 127.0399613 역삼동(강남)

14 16099 37.51098524 127.1014471 잠실3동(롯데월드)

15 29796 37.57358756 126.9811903 수송동(광화문)

16 2061 37.60984473 127.0472676 장위2동

17 5337 37.58214646 127.042816 청량리

18 12074 37.52162945 126.9201037 여의도동

19 16173 37.53496678 126.9790286 용산1동

20 6015 37.48274704 126.9007805 구로3동(구로디지털단지)

Page 44: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

기본 분석

모델링Ⅰ.

군집분석 결과표

3. 서울 밤

Segment ID 사람수 Lat Long address

1 1000 37.47706814 127.0525422 개포4동

2 8125 37.5511596 126.9310429 서강동(홍대근처)

3 1057 37.57559169 126.9036761 북가좌동

4 11548 37.52691011 127.0172475 압구정동

5 6292 37.52374645 126.9089481 영등포동

6 1499 37.60320359 127.0409059 월곡2동

7 8 37.6435942 126.927148 진관동

8 156 37.66951467 127.0480569 도봉동

9 5316 37.56101895 126.8100486 공항동

10 60931 37.56410903 126.9899631 저동2가(명동)

11 2030 37.47630787 126.8979813 독산동

12 4656 37.51324743 127.1057454 잠실6동(롯데월드)

13 765 37.6047844 126.9349813 녹번동

14 11023 37.50254496 127.0257707 역삼동(강남)

15 3551 37.5765364 127.0394711 용두동

16 7843 37.5092659 127.0606138 삼성동(코엑스)

17 2444 37.49962477 126.8804534 구로동

18 1426 37.49013614 126.9665574 사당3동

19 912 37.64512916 127.0423549 창1동

20 5628 37.5525189 127.1003745 광장동(워커힐)

Page 45: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 서울

√ 서울 낮

√ 서울 밤

군집 분석 (서울 낮/밤)

기본 분석

모델링Ⅰ.

√ 낮과 밤의 군집 분포가 다름 - 낮 명동 근처 : 광화문, 명동, 용산, 이 세 군집으로 나뉘 어진 분포 강남 근처 : 신사동, 역삼동 이 두 군집으로 나뉘어진 분포 - 밤 명동 근처 : 하나의 군집으로 이루어진 분포 강남 근처 : 압구정, 삼성동, 역삼동 이 세 군집으로 나뉘어진 분포

Page 46: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ N01 √ N02

군집분석 (주요국가)

√ 국가코드 별 콜 발생 수에서 상위 2개 국가만을 비교 √ 국가코드 별 군집 분포 양상은 비슷함(명동과 강남이 많은 군집을 이루는 점에서) - 화양동(건대)은 N01 국가에서만 군집을 이룸

기본 분석

모델링Ⅰ.

Page 47: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 비 안 옴 √ 비 옴

군집분석 (강수)

√ 강수의 유무에 따라서 군집 분포의 차이를 보임 - 비가 안 올 때 잠실동에 더 많은 콜 발생 - 명동 근처에서 비가 온 날에는 광화문, 비가 오지 않은 날에는 동대문에 군집이 생성

기본 분석

모델링Ⅰ.

Page 48: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 체감온도 영상 √ 체감온도 영하

군집 분석 (체감온도)

√ 체감온도에 따라서 군집 분포의 차이를 보이지 않음 - 명동과 강남을 기준으로 확인을 했을 때, 특이점이 보이지 않음

기본 분석

모델링Ⅰ.

Page 49: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 연관성 분석 - target: 동 - ID: 이용자 ID - 사람들이 간 동 사이의 연관성을 확인 √ 동 사이의 연관성을 서울의 낮과 밤, 국가, 날씨 별로 분석

연관성 분석

기본 분석

모델링 Ⅱ.

Page 50: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

Confidence(%) Support(%) Lift TransactionCount Rule

43.23 4.02 2.26 6353 을지로2가 ==> 명동2가

21.06 4.02 2.26 6353 명동2가 ==> 을지로2가

35.16 1.11 1.84 1751 약수동 ==> 명동2가

33.68 1.88 1.76 2970 충무로1가 ==> 명동2가

30.94 1.64 1.62 2592 신당동 ==> 명동2가

29.51 1.49 1.55 2347 충무로2가 ==> 명동2가

29.28 1.37 1.53 2170 태평로2가 ==> 명동2가

26.11 1.09 1.37 1720 광희동1가 ==> 명동2가

20.89 1.14 1.09 1802 신사동 ==> 명동2가

연관성 분석 (서울 전체)

연관성 분석 (서울 낮/밤)

Confidence(%) Support(%) Lift TransactionCount Rule

39.73 3.38 2.13 4374 을지로2가 ==> 명동2가

18.08 3.38 2.13 4374 명동2가 ==> 을지로2가

30.16 1.08 1.61 1394 약수동 ==> 명동2가

29.15 1.49 1.56 1925 충무로1가 ==> 명동2가

26.94 1.12 1.44 1456 태평로2가 ==> 명동2가

25.41 1.05 1.36 1365 충무로2가 ==> 명동2가

√ 서울 낮 √ 서울 밤

Confidence(%) Support(%) Lift TransactionCount Rule

11.72 0.76 2.9 550 신당동 ==> 광희동1가

18.82 0.76 2.9 550 광희동1가 ==> 신당동

23.78 1.44 1.97 1044 을지로2가 ==> 명동2가

11.98 1.44 1.97 1044 명동2가 ==> 을지로2가

15.35 0.63 1.27 459 충무로2가 ==> 명동2가

√ 서울 낮 : 태평로2가(시청)에 간 사람 중에 명동2가에 간 사람이 많음

√ 서울 밤 : 신당동이 자주 나타남, 신당동을 방문한 사람 중, 동대문(광희동1가)을 방문한 사람이 아주 많음

√ 관광객들의 허브는 명동 - 유명 관광지인 약수동, 신당동 태평로2가(시청), 광희동(동대문), 이 동들과 명동의 연관성이 높음

기본 분석

모델링 Ⅱ.

Page 51: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

Confidence(%) Support(%) Lift TransactionCount Rule

31.69 2.16 3.71 1072 장충동1가 ==> 약수동

25.3 2.16 3.71 1072 약수동 ==> 장충동1가

16.6 1.5 3.21 742 신당동 ==> 광희동1가

28.97 1.5 3.21 742 광희동1가 ==> 신당동

58.98 7.34 1.99 3637 을지로2가 ==> 명동2가

24.73 7.34 1.99 3637 명동2가 ==> 을지로2가

49.85 2.03 1.68 1005 태평로2가 ==> 명동2가

49.52 3.04 1.67 1507 충무로1가 ==> 명동2가

10.25 3.04 1.67 1507 명동2가 ==> 충무로1가

47.42 1.91 1.6 945 충무로2가 ==> 명동2가

13.95 1.73 1.55 860 을지로2가 ==> 신당동

19.24 1.73 1.55 860 신당동 ==> 을지로2가

40.86 3.68 1.38 1826 신당동 ==> 명동2가

12.42 3.68 1.38 1826 명동2가 ==> 신당동

38.34 1.98 1.29 982 광희동1가 ==> 명동2가

37.64 3.22 1.27 1595 약수동 ==> 명동2가

10.84 3.22 1.27 1595 명동2가 ==> 약수동

35.77 2.44 1.21 1210 장충동1가 ==> 명동2가

34.38 2.26 1.16 1120 신사동 ==> 명동2가

√ 주요 국가별로 동의 연관성을 살펴봄 √ 국가별 콜 발생 수에서 NO1, NO2의 비율이 두드러짐 : NO1,NO2 국가에 대해 살펴봄

√ 태평로2가(시청) 방문한 사람은 명동을 방문함 √ 광희동(동대문)을 방문한 사람은 신당동을 방문함 √ 장충동1가(남산 가는 길)을 방문한 사람은 약수동(동대문근처) 을 방문함 √ 신당동을 방문한 사람은 명동을 방문함

연관성 분석 (주요국가)

NO1

Confidence(%) Support(%) Lift TransactionCount Rule

14.79 0.94 2.66 542 충무로1가 ==> 남대문로5가

16.85 0.94 2.66 542 남대문로5가 ==> 충무로1가

40.13 1.04 2.39 600 방화2동 ==> 과해동

14.05 0.98 2.22 566 충무로2가 ==> 충무로1가

15.44 0.98 2.22 566 충무로1가 ==> 충무로2가

34.96 3.03 2.11 1751 을지로2가 ==> 명동2가

18.26 3.03 2.11 1751 명동2가 ==> 을지로2가

28.13 1.78 1.7 1031 충무로1가 ==> 명동2가

10.75 1.78 1.7 1031 명동2가 ==> 충무로1가

25.92 1.27 1.56 735 태평로2가 ==> 명동2가

24.7 1.72 1.49 995 충무로2가 ==> 명동2가

10.38 1.72 1.49 995 명동2가 ==> 충무로2가

21.7 1.21 1.31 698 남대문로5가 ==> 명동2가

√ 충무로1가, 명동2가(명동)을 방문한 사람은 남대문로5가 (남대문)을 방문함 √ 태평로2가(시청)을 방문한 사람은 명동2가를 방문함

NO2

기본 분석

모델링 Ⅱ.

Page 52: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

연관성 분석(날씨)

√ 비가 온 날과 비가 오지 않은 날을 구분하여 연관성을 살펴봄

Confidence(%) Support(%) Lift TransactionCount Rule

33.21 2.26 2.28 1117 을지로2가 ==> 명동2가

15.52 2.26 2.28 1117 명동2가 ==> 을지로2가

22.68 0.92 1.56 453 충무로1가 ==> 명동2가

20.62 0.79 1.42 390 태평로2가 ==> 명동2가

Confidence(%) Support(%) Lift TransactionCount Rule

41.39 3.59 2.31 4927 을지로2가 ==> 명동2가

20.07 3.59 2.31 4927 명동2가 ==> 을지로2가

32.19 0.92 1.8 1268 약수동 ==> 명동2가

31.52 1.63 1.76 2243 충무로1가 ==> 명동2가

28.24 1.4 1.58 1928 신당동 ==> 명동2가

27.81 1.33 1.56 1831 충무로2가 ==> 명동2가

26.88 1.19 1.5 1635 태평로2가 ==> 명동2가

23.57 0.91 1.32 1249 광희동1가 ==> 명동2가

√ 명동이 규칙에서 많이 발견 됨 √ 시청과 명동 사이에 연관성이 발견됨

√ 약수동(신당동 근처), 신당동과 명동이 규칙에서 많이 발견 됨 √ 태평로2가와 명동 사이에 연관성이 발견 됨

√ 비가 온 날

√ 비가 안 온 날

기본 분석

모델링 Ⅱ.

Page 53: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석

추가 분석 분석 결과 개선 방안 및 결론

Page 54: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

군집 분석 & 연관성 분석

√ 군집 분석의 실행 결과로 각각의 관측치에 세그먼트 ID를 병합 한 후에 연관성 분석을 함 - 군집 간의 연관성을 확인

추가 분석

모델링 혼합Ⅰ.

Page 55: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

군집 분석 & 연관성 분석

Confidence(%) Support(%) Lift TransactionCount Rule Rule

51.02 5.46 0.9 8620 3 ==> 8 서교동(홍대) ==> 저동1가(명동)

48.73 5.09 0.86 8045 16 ==> 8 용산2동(국립중앙박물관)==> 저동1가(명동)

46.44 3.45 0.82 5447 15 ==> 8 잠실3동(잠실)==> 저동1가(명동)

36.34 4.44 0.64 7010 1 ==> 8 방화2동(김포공항) ==> 저동1가(명동)

35.76 5.15 0.63 8137 9 ==> 8 삼성2동(강남구청, 청담) ==> 저동1가(명동)

29.79 3.17 0.52 5003 18 ==> 8 서초4동(논현, 강남) ==> 저동1가(명동)

Confidence(%) Support(%) Lift TransactionCount Rule Rule

44.46 6.57 0.91 8506 15 ==> 12 수송동(광화문) ==>충무로2가(명동)

13.44 6.57 0.91 8506 12 ==> 15 충무로2가(명동) ==> 수송동(광화문)

39.66 4.04 0.81 5233 8 ==> 12 서교동(홍대) ==> 충무로2가(명동)

38.69 2.98 0.79 3863 19 ==> 12 용산1동 ==> 충무로2가(명동)

37.61 2.72 0.77 3526 14 ==> 12 잠실3동(롯데월드) ==> 충무로2가(명동)

36.02 2.99 0.74 3878 6 ==> 12 신사동(가로수길) ==> 충무로2가(명동)

28.87 3.72 0.59 4813 1 ==> 12 방화2동(김포공항) ==> 충무로2가(명동)

22.08 3.04 0.45 3942 13 ==> 12 역삼동(강남)==> 충무로2가(명동)

√ 서울 밤은 유의미한 결과가 나오지 않음

√ 서울

√ 서울 낮

√ 서울 전체에서 강남과 명동간의 연관성은 매우 낮은 것으로 확인

√ 서울 낮에는 강남 (신사동, 역삼동), 잠실과 명동 사이의 연관성이 매우 낮은 것으로 확인 됨

추가 분석

모델링 혼합Ⅰ.

Page 56: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

√ 군집분석 후 연관성 분석 √ VAR22 = 세그먼트ID

명동 군집&연관성 분석

√ 명동만 그 주변 지역만 집중적으로 조사 - 선행된 조사로, 명동의 중요성이 대두 - 경도 37.584~37.544, 위도 127.016~126.963에 포함됨 지역 √ 군집 분석의 실행 결과로 각각의 관측치에 세그먼트 ID를 병합 한 후에 연관성 분석을 함 √ 그 다음, 군집을 target으로 지정하여 군집 간의 연관성을 확인

√ 군집분석 변수 설정

추가 분석

모델링 혼합Ⅱ.

Page 57: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

추가 분석

모델링 혼합Ⅱ.

군집 분석(명동의 낮/밤)

√ 명동을 중심으로 낮에는 서쪽으로, 밤에는 동쪽으로 군집이 형성되는 양상을 보임

√ 명동

√ 명동 낮

√ 명동 밤

Page 58: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

추가 분석

모델링 혼합Ⅱ.

Confidence(%) Support(%) Lift TransactionCount Rule

42.90 10.95 0.95 9961.0 을지로1가(시청) 명동2가

24.28 10.95 0.95 9961.0 명동2가 을지로1가(시청)

35.00 5.21 0.78 4741.0 을지로7가(동대문역사문화공원) 명동2가

11.55 5.21 0.78 4741.0 명동2가 을지로7가(동대문역사문화공원)

33.86 4.18 0.75 3802.0 남대문로5가(서울역) 명동2가

10.03 2.56 0.67 2330.0 을지로1가(시청) 을지로7가(동대문역사문화공원)

17.20 2.56 0.67 2330.0 을지로7가(동대문역사문화공원) 을지로1가(시청)

√ 명동

연관성 분석 (명동 낮/밤)

Confidence(%) Support(%) Lift TransactionCount Rule

16.94 3.54 0.33 1263.0 을지로7가(동대문역사문화공원) 명동2가

Confidence(%) Support(%) Lift TransactionCount Rule

19.82 2.14 1.18 1563.0 남대문로5가(서울역) 충무로1가(명동)

12.69 2.14 1.18 1563.0 충무로1가(명동) 남대문로5가(서울역)

35.03 2.21 0.82 1620.0 신당3동(약수역) 명동1가

12.66 5.38 0.75 3937.0 명동1가 충무로1가(명동)

31.96 5.38 0.75 3937.0 충무로1가(명동) 명동1가

30.53 3.21 0.72 2347.0 서소문동(시청) 명동1가

26.17 2.43 0.62 1776.0 을지로7가 명동1가

26.12 2.67 0.61 1954.0 도렴동(광화문) 명동1가

22.81 2.46 0.54 1799.0 남대문로5가(서울역) 명동1가

√ 명동 낮

√ 명동 밤

√ 같은 명동 안에서 군집들이 서로 음의 연관관계에 있기 때문에, 이 결과를 보고 의미있는 해석을 도출하기에는 다소 어려움이 있음

연관성 분석 (명동 군집 분석)

Page 59: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석

분석 결과 개선 방안 및 결론

Page 60: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

분석 결과 정리

분석 결과

1. 기초탐색 √ 서울의 낮과 밤은 명동에 사람이 집중되는 공통점이 있지만, 밤에 신당동에 사람이 많이 방문하는 점에서 약간의 차이를 보임 2. 군집분석 1) 낮과 밤 √ 명동과 강남에 모여 있는 것은 같음 √ 밤에 신당동에 모여 있음 2) 국가코드 √ 국가코드 별 군집 구성의 양상은 큰 차이가 없음

3) 날씨 √ 날씨에 따라 명동근처와 강남 근처의 군집구성의

차이를 보 임

3. 연관성 분석 √ 관광객들의 허브는 명동 √ 동대문과 명동, 신당동과 명동 사이에 높은 연관관계를 보임 √ 서울 낮: 시청과 명동 사이에 높은 연관성이 있음 √ 서울 밤: 신당동을 방문한 사람 중, 동대문(광희동1가)을 방문 한 사람이 아주 많음 4. 군집 분석 & 연관성 분석 √ 군집들 간의 연관성 분석에서 명동과 강남 사이에 낮은 연관성이 발견됨 5. 명동 군집 분석 & 연관성 분석

데이터 분석 결과

Page 61: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

외래 관광객 1200만을 위한 데이터 기반 맞춤형 시티투어버스

현행 시티투어 버스의 효율적 운행이 필요

요약 프로젝트 개요

분석 계획 데이터 준비 기본 분석 추가 분석 분석 결과

개선 방안 및 결론

Page 62: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

현행 노선 파악

현행 서울시티투어버스 노선

√ 1층 버스 도심고궁(낮) √ 2층 버스 낮

1. 광화문 2. 청계광장 3. 명동입구 4. 애니메이션센터 5. 남산케이블카 6. 밀레니엄 힐튼호텔 7. 남산도서관 8. 하얏트호텔 9. 63빌딩(한강유람선) 10. 여의나루역 11. 홍대앞(관광안내소) 12. 홍대앞(공항철도역) 13. 신촌역(이대앞) 14. 세종문화회관

1. 광화문 2. 덕수궁 3. 남대문시장 4. 서울역 5. USO 6. 용산역 7. 국립중앙박물관 8. 전쟁기념관 9. 미군용산기지 10. 이태원 11. 크라운호텔 12. 명동 13. 남산골 한옥마을 14. 그랜드엠버서더 호텔 15. 국립중앙극장 16. N서울타워 17. 하얏트호텔 18. 반얀트리클럽앤스파서울 19. 신라호텔 20. 동대문시장 21. 대학로 22. 창경궁 23. 창덕궁 24. 인사동 25. 청와대 앞 26. 경복궁

개선 방안 및 결론

√ 고궁버스 투어는 강북의 여러 고궁들과 박물관이 중심이 되어 운행 √ 파노라마 버스투어는 광화문, 명동, 신촌, 여의도, 남산 등을 순환하여 운행 √ 전통시장 투어는 서울 강북의 전통시장들을 중심으로 순환하여 운행 √ 이 외에 다른 시티투어 노선(야간 노선)이 있지만 우리의 조사 취지에는 맞지 않아 제외

Page 63: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

이상적 노선이 실제 노선과 다름

√ 사람들이 많이 방문하는 곳을 지나는 노선 1) 낮: 명동, 동대문, 신당동, 강남 2) 밤: 신당동 중심

√ 서로 연관성이 높은 곳을 잇는 노선 → 명동, 동대문, 신당동

√ 서로 연관성이 낮은 지점을 피하는 노선 → 명동, 강남

이상적 노선 실제 노선

√ 특정 테마 중심의 노선 → 종류: 고궁투어, 이층버스, 전통시장 등 → 한계: 많은 정거장을 지나치기 하지만, 테마위주의 노선이기 때문에, 실제 수요를 반영 하지 못함

√ 하나의 노선에서 명동, 동대문, 신당동을 가는 노선은 없음

개선 방안 및 결론

개선 방안

Page 64: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

실제노선 이상적인 노선

√ 서로 연관성이 높고 방문 빈도가 높은 지점을 골라 노선 지정 √ 명동을 주요 환승역으로 지정 → 명동은 방문빈도가 가장 높은 곳 √ 명동을 중점으로 순환하는 명동, 동대문, 신당동을 잇는 노선 신설 → 방문빈도 높음 → 연관성 높음 : 동대문 ~ 명동, 신당동~ 명동 √ 시티투어 노선 지정 시 명동과 강남을 같이 두지 않는 것이 좋음 → 명동과 강남의 연관성은 역의 상관관계를 가짐

√ 시티투어버스의 이용률 향상 √ 관광객들의 쇼핑 지출 확대 → 중점적 지역이 쇼핑에 특화된 지역이므로

기대 효과

제안

개선 방안

개선 방안 및 결론

Page 65: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

개선 방안 및 결론

√ 가정의 불확실성 - 통화 한 사람은 통화 발생 시간과 위치에서 활동을 하고 있다는 가정의 불확실성 - 통화 발생을 20건 이상의 사람들을 제외 한 이이유에 대한 불확실성

√ 데이터 자체의 한계 - 겨울 데이터로 한정되어 있음, 봄, 여름, 가을에 대한 분석 결과가 데이터가 없으므로 우리의 분석 결과가 계절에 의해 왜곡 되었을 가능성이 있음

한계점

Page 66: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

개선 방안 및 결론

결론

시티투어버스 사업의 서비스 품질 향상 및

생산성 향상

데이터 분석을 통한 맞춤형 시티투어버스

개발

데이터 기반의 시티투어버스의

현황 파악

“관광 산업의 생산성 및 부가가치 창출”

- 시티투어의 이용률 향상 - 외래 관광객들의 쇼핑지출 확대

Page 67: 문화관광 빅 데이터 분석대회 - Report 65 · 2017. 6. 21. · 5 몰디브 (6.6%) 뉴욕 (5.0%) ... √ 순수 관광목적의 외래 관광객은 전화 통화를 많이

감사합니다