[분석]텔레마틱스를 이용한 자동차 운전자 프로필 생성
TRANSCRIPT
Drvier Telematics Analysis
kaggle competition
All rights reserved by BOAZ 3rd HYM.
텔레마틱스데이터를이용한운전자프로필생성
All rights reserved by BOAZ 3rd HYM.
3.1. 분석 목적 3.3. 분석 기획
3.2. 데이터 설명 3.4. 분석
Driver Telematics
Analysis
Conclusion
All rights reserved by BOAZ 3rd HYM.
BOAZ HYM 대회 소개
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
“Use Telematics Data to Identify a Driver Signature”
+
대회 주제
BOAZ HYM 텔레마틱스
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
텔레마틱스
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
GPS데이터 생성 / 전송 데이터 저장
데이터정규화 & 분석 분
석결과
전송
고객화서비스 제공
상용화
BOAZ HYM
BOAZ HYM
Usage-Based Insurance (운전습관연계보험)
운전자의나이, 성별, 운전경력등이아닌
운전자의운전성향을텔레마틱스를활용하여측정
UBI
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
BOAZ HYM
2736명 운전자와 그들의 각각 200개의 경로
운전자 개개인의 특성을 반영시킬 수 있는 프로필 생성
Prob=1Prob=0
분석 목적
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
BOAZ HYM 제공 데이터
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
(0,0)
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초
1
2
3
.
.
10
20
.
180
189
X
0
-12.4
-25.9
.
.
-118.7
-255.5
.
-960.8
-962.0
Y
0
-4.2
-8.8
.
.
-48.3
-53.1
.
-308.4
-308.8
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
1개 경로 1명 운전자 = 200개 경로
200 경로 X 2736 운전자= 총 547,200 개 data frame 존재
제공 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Prob=1Prob=0
제공 데이터
1명 운전자 = 200개 경로
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
분석 기획
기존과는 다른 형태의 데이터(2차원 좌표 데이터)
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
분석 기획
기존과는 다른 형태의 데이터(2차원 좌표 데이터)
지도를 활용하여 같은 운전자를 찾아보자!
Geometry Matching
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
분석 기획
운전자의 운전 성향을 더 구체적으로 파악할 수 있을까?
기존과는 다른 형태의 데이터(2차원 좌표 데이터)
지도를 활용하여 같은 운전자를 찾아보자!
Geometry Matching
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
분석 기획
기존과는 다른 형태의 데이터(2차원 좌표 데이터)
지도를 활용하여 같은 운전자를 찾아보자!
파생변수를 생성하여 모델링을 해보자!
Driver Modelling
Geometry Matching
운전자의 운전 성향을 더 구체적으로 파악할 수 있을까?
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching
분석 기획
Driver Modelling
여행 경로회전
데이터분할
경로 비교
파생변수생성
모델링
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
Original trips
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
Original trips
출발점
출발점과 도착점이x축에 위치하도록 회전
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
Original trips Rotated trips
출발점과 도착점이x축에 위치하도록 회전
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
Original trips Rotated trips
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
Original trips Rotated trips
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
최대 X축 길이
최대
축
길이
Y
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사점수
기준선으로부터 가까워질수록유사점수가 낮다
즉, 경로패턴이 유사하다
X 1.2
X 0.8
유사경로 구간
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사점수 0.0경로 154 & 171
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사점수 0.1경로 31 & 58
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사점수 0.2경로 31 & 152
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사점수 0.3경로 96 & 165
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
유사 점수가0.1 이하일 때유사 경로패턴
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
이상치유사경로로 분류되지 않은 그룹에서
유사패턴 발견
경로 비교만으로 운전자 지문을 판단할 수 없다 모델학습
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Geometry Matching 여행 경로 회전 경로 비교
이상치유사경로로 분류되지 않은 그룹에서
유사패턴 발견
경로 비교만으로 운전자 지문을 판단할 수 없다 모델학습
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
다른 운전자운전자 데이터
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
다른 운전자운전자 데이터
경로매칭으로유사경로 선별
유사경로만큼샘플링
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
TRAIN data
다른 운전자운전자 데이터
Prob=0Prob=1
경로매칭으로유사경로 선별
유사경로만큼샘플링
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
TRAIN dataTEST data
다른 운전자운전자 데이터
Prob=0Prob=1
경로매칭으로유사경로 선별
유사경로만큼샘플링
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
운전자의 특징을어떻게 나타낼 수 있을까?
Driver Modeling파생 변수 생성데이터 분할 모델링
1. 장거리인가? 단거리인가?
2. 고속도로인가? 국도인가?
3. 정지 또는 출발할 때 평균속력?급정지하는가? 급출발 하는가?
4. 커브를 돌 때 빠르게 도는가?
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
운전자의 특징을어떻게 나타낼 수 있을까?
운전자의 특징을 나타내는파생변수 생성
이동시간 & 이동거리
구간 속력평균속력 & 최고속력
정지횟수총 정지시간 & 평균 정지시간
출발 평균 속력정지 평균 속력
커브 구간 평균속력커브 구간 평균가속도
Driver Modeling파생 변수 생성데이터 분할 모델링
1. 장거리인가? 단거리인가?
2. 고속도로인가? 국도인가?
3. 정지 또는 출발할 때 평균속력?급정지하는가? 급출발 하는가?
4. 커브를 돌 때 빠르게 도는가?
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
총 이동 시간
1. 장거리인가? 단거리인가?
총 이동 거리
Driver Modeling파생 변수 생성데이터 분할 모델링
두 점 사이의 거리 = (𝑥𝑖−1 − 𝑥𝑖)2+ (𝑦𝑖−1 − 𝑦𝑖)
2
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
평균 속력=1
(1𝑠1
+1𝑠2
+⋯+1𝑠𝑛
)
𝑛
JUMP?
조화평균을 통해 해결!
Driver Modeling파생 변수 생성데이터 분할 모델링
평균속력
2. 고속도로인가? 국도인가?
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
각 구간별 평균속력
1 2 3 4
Driver Modeling파생 변수 생성데이터 분할 모델링
최고속력
2. 고속도로인가? 국도인가?
평균속력
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
4초 이상정지한 경우
정지횟수
3. 정지 또는 출발할 때 속력? 급정지하는가? 급출발하는가?
총 정지시간평균 정지시간
출발평균속력정지평균속력
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
커브 구간 평균 속력
커브 구간 평균 가속도
기울기가 변하는 구간
4. 커브를 돌 때 빠르게 도는가?
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
이동시간 이동거리
구간 속력평균속력 최고속력
정지횟수총 정지시간
평균 정지시간
출발 평균 속력정지 평균 속력
커브 구간 평균속력커브 구간 평균가속도
지도학습 기법
앙상블 기법
X, Y 좌표
Raw data Variables Modeling
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
변수선택 지도학습 기법 앙상블 기법
보루타
랜덤포레스트 분류기의반복학습으로
변수들 중 영향력 있는변수를 찾아내는
알고리즘.
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
변수선택 지도학습 기법 앙상블 기법
로지스틱 회귀분석
나이브 베이즈
신경망
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
변수선택 지도학습 기법 앙상블 기법
랜덤 포레스트
LASSO
GBM
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
모델명Accuracy (train data -> valid data 예측)
driver1 driver2 driver3
로지스틱 0.661 0.9032 0.7647
나이브 베이즈 0.6271 0.8871 0.7647
신경망 0.7119 0.8548 0.7451
랜덤포레스트 0.8136 0.9355 0.8431
Lasso 0.661 0.9194 0.8325
GBM 0.7458 0.9355 .0.7255
모델평가
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
Logit 72 125
NB 111 89
NNET 91 109
RF 70 130
Lasso 70 130
GBM 57 143
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
Driver Modeling파생 변수 생성데이터 분할 모델링
Logit 0.70363
NB 0.69957
NNET 0.70547
RF 0.72897
Lasso 0.71301
GBM 0.71300
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
지도매칭에서 유사경로로 분류되지 않은 경로가
최종 모델학습 결과 동일한 운전자의 경로로 분류되었다
Driver Modeling파생 변수 생성데이터 분할 모델링
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
활용방안1 타입별 운전자 보험
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
장거리 운전자
운전시간
속력
운전거리
정지시간
활용방안1 타입별 운전자 보험
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
초보운전자
운전시간
속력
급출발
정지시간
활용방안1 타입별 운전자 보험
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
속력
가속운전
급출발
급제동
위험운전자
활용방안1 타입별 운전자 보험
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
운전시간
속력
운전거리
정지시간
안전운전자
활용방안1 타입별 운전자 보험
BOAZ HYM
Driver Telematics
Analysis
Conclusion
분석기획
분석목적
데이터 설명
분석
GPS
계절적 조건
운전자 특성
타이어 특징
활용방안2 타이어 교체시기 알리미
GPS DATA
v
Thank You