insight korea big data solution: insight deep mining...

47
Insight Korea Big Data Solution: Insight Deep MininG Service

Upload: others

Post on 01-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Big Data Solution:

Insight Deep MininG Service

Page 2: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

What is Big Data?

Page 3: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 3 -

What is Big Data?

Naver 빅데이타 검색 Trend

Page 4: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 4 -

What is Big Data?

Page 5: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 5 -

What is Big Data?

Page 6: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Big Data Solution :

Insight Deep MininG Service System

Page 7: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 7 -

Insight Korea Big Data Solution System

Deep Learning 기반Big Data Solution

Platform & SI SystemPartner

Marketing Research& Consulting

Deep Learning기반Mining(STT, TTT)

Technology Partner

• 한국전자통신연구원(ETRI)의 뛰어난텍스트마이닝 특허 기술 적용(국내특허 10건, 국제특허 6건)

• 한국전자통신연구원(ETRI)의 뛰어난음성인식 특허 기술 적용(국내특허 11건, 국제특허 6건)

Insight KoreaBig Data Service

Page 8: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 8 -

전화상담

비정형데이터를 정형데이터와 결합하여 빅데이터 인프라를 통해 사용자 요구에 맞는 서비스 결과를 제공합니다.

∙∙∙∙∙∙∙∙∙∙∙∙

∙∙∙∙∙∙

Customer

Virtual Agent(가상상담원)

녹취서버

ARS

Crawl(정보수집)

MINDs Insight(텍스트분석)

Market Insight(데이터가공)

User-DrivenAnalysis

(데이터분석)

Batch

Real-time

STT(음성인식)

TA(텍스트분석)

Legacy

채팅상담

이메일상담

게시판상담

Deep Neural Network

음성인식

음성학습

NLP

Text Mining대화관리

대화생성

음성합성

Detection

빅데이터 분석 인프라

고객DB 상품DB 거래DB

Hadoop

Impala/Spark

Machine LearningSolr

Python R

∙∙∙

Analysis Model

STT/TA 결과 소셜빅데이터

정형데이터Call

SNS

e-mail

Web

사용자 UI

분석가 의사결정자

사용자주도분석 Dashboard

설정

수집

저장

NLP

Text Mining

Issue/Risk Detect

목적/관점

키워드 정제

데이터 추출

목적/관점

키워드 기준

데이터 추출시각화

Insight Korea Big Data Solution System Framework

Page 9: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 9 -

활용분석수집 / 전처리원천 Data

내부 Data

외부 Data

블로그

까 페

지식인

Text Mining (Unstructured)

④ Keyword 추출

⑤ Classification ⑥ 감성 분석(긍정/부정,선호도)

③ 자연어 처리(NLU)

Text

VoC

Dashboard Report

Risk 대응

위기 감지

불만요인 분석

경영층 보고서

:

Web Crawling

컨택센터, A/S센터E-Mail, 제품정보 등

Data Mining (Structured)

⑩ Predictive Analysis (예측 분석)

⑨ Risk Scoring

⑦ Statistics ⑧ Association

Marketing

활용

제품개선

마케팅 효율화

SCM 운영 개선

:

Pre-Processing

① Taxonomy

② Speech to Text

MINDs STT

Insight Deep MininG

MINDs Lab

Insight Deep MininG

Insight Deep MininG

SI Partner

SI Partner

VOC 분석을 위한 핵심 기술 – 음성인식 및 텍스트마이닝

Technology Partner사와 R&R

Page 10: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Big Data Solution Technology Partner:

MINDs Lab. Solution 차별점

Page 11: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 11 -

MINDs Lab. Solution 차별점

최고의 STT 인식률1

음성 톤 분석 통합2

강력한 탐지력을 가진 다중탐지 사전3

딥러닝 감성분석 및 분류 엔진4

자동 사전보강 프로세스5

최고 성능 한국어 NLP6

실시간 음성인식 및 텍스트 분석7

빅데이터 분석 인프라8

Power User 용 Flexible UI9

자연어 검색엔진 Solr 내장10

최신 머신러닝 분석툴 H2O 내장11

표준 End User UI 및 시각화 도구 I/F12

Big Data Platform 제공13

Page 12: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 12 -

舊버전100시간 학습

인식률

新버전100시간 학습

normal

STT 新버전(DNN)

STT음절기준

STT키워드기준

300시간 학습

평균음절 인식률

90%이상현재시점 음절 최고기록 :

94.78%

77.3%

현재시점 키워드 최고기록 95% 평균키워드 인식률

95%이상

新버전100시간 학습

최고 기록

85%

1. 최고의 STT 인식률

현재까지 달성한 인식률 분석결과 도메인별 분리학습을 실시할 경우 평균 인식률이 음절단위 85%이상, 키워드 단위 95%이상 도달. DNN의 로직으로 볼 때 인식률의 한계선은 없으며 학습에 의해서 계속 개선.

Page 13: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 13 -

Raw Data (pcm)

Pitch 산정 위한 가공데이터

Spectrum Analyzer (저/중/고음)

Volume

최종판정

Pitch & Volume Data by Time

음성의 Volume / Pitch 분석 등을 추가해서 고정밀 감성분석 가능

2. 음성 톤 분석 통합

Page 14: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 14 -

3. 강력한 탐지력을 가진 다중탐지 사전

다중 탐지어 사전(HMD)은 마인즈랩의 Text Analytics 엔진인 i-VOC TA에 의해서 지원됩니다.

Hierarchical Multiple Dictionary (다중 탐지어 사전)

중요 어휘도 기술 세부감성 분석 내용기반 자동 분류 기술

i-VOC

TA

<마인즈랩 i-VOC를 활용한 다중탐지어 구현>

+ +

Page 15: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 15 -

Data set Model Accuracy

Mobile

Train: 4543

Test: 500

SVM (word feature) 85.58

RAE (word feature) )+Word embedding 87.57

CNN(relu,kernel3,hid50)

+Word embedding (word feature)91.20

CNN(relu,kernel3,hid50)+Random init. 89.00

4. 딥러닝 감성분석 및 분류 엔진

기존의 알고리즘 대비 높은 성능을 보이는 딥러닝 감성분석엔진과 분류엔진을 내장

Page 16: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 16 -

국민연급

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해연명할 수밖에 없다는 우려가 제기됐다.

딥러닝(Deep Learning)엔진

Output

Feature Extractor

Classifier

InputData, Label

재해

일본 화산 폭발' '아소산 분화' 일본 각지에서 자연재해가 잇따르고 있다.

어휘분류체계(Taxonomy)

L1 재해 L2 화산 폭발

국민연금 부과방식 고갈

레저 수상스포츠 한강홀릭

쇼핑 백화점 홈쇼핑

다중탐지어사전 (HMD)

L1 국민연금 국민연금 $ 보험료

국민연금$국채발행

인상@시기@놓치

원문 (연금)

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해연명할 수밖에 없다는 우려가 제기됐다. 국민연금은 현재 9%인 국민연금보험료율을 유지할 경우 오는 2060년기금이 고갈될 것으로 추산되고 있다.

원문 (연금)

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해연명할 수밖에 없다는 우려가 제기됐다. 국민연금은 현재 9%인 국민연금보험료율을 유지할 경우 오는 2060년기금이 고갈될 것으로 추산되고 있다.

원문

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해연명할 수밖에 없다는 우려가 제기됐다.

일본 화산 폭발' '아소산 분화' 일본 각지에서 자연재해가 잇따르고 있다.

재해

일본 기상청은 15일 이 분화가 땅속의마그마에 닿은 지하수 등이 수증기가돼 폭발하는 '마그마 수증기 폭발'일 가능성이 높다고 발표했다.

종합

사전방식과기계학습 방식이 결합된

종합분석결과

5. 자동 사전보강 프로세스

데이터가 쌓일수록 정확해지는 딥러닝 & 탐지사전간 자동 사전 보강프로세스 내장됨

사전작업1엔진 실행 결과사전 반영

6

사전기반탐지

2

딥러닝 학습3

학습이미지 획득

4

분류엔진실행

5

Page 17: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 17 -

형태소분석

수집 문서를 가장 작은 의미 단위인 형태소 단위로 분할

대한/nc+은행/nc+이/jc 인터넷/nc+을/jc 통하/pv+어/ec 중도금/nc 대출/nc 서류/nc 작성/nc+을/jc 편리/nc+하/xsm+게/ec 하/px+ㄹ/etm 수/nb 있/pa+는/etm 서비스/nc+를/jc 마련/nc+하/xsv+었/ep+다/ef

수집 문서를 기계 학습에 기반한 문장 분리 모델을 통해 문장 단위로 분리

“대한은행이 인터넷을 통해 중도금대출 서류 작성을 편리하게 할 수 있는 서비스를 마련했다”“복잡한 중도금대출을 온라인으로 신청·접수할 수 있는 중도금대출 온라인 신청 서비스를 시행한다고 25일밝혔다”

문장에 포함된 인물명, 기업명, 장소, 숫자 표현 등의 개체명(Named-entity)인식

<<OGG_Economy:대한/nc+은행/nc>>+이/jc 인터넷/nc+을/jc 통하/pv+어/ec 중도금/nc 대출/nc 서류/nc 작성/nc+을/jc 편리/nc+하/xsm+게/ec 하/px+ㄹ/etm 수/nb 있/pa+는/etm 서비스/nc+를/jc 마련/nc+하/xsv+었/ep+다/ef

구문분석

문장에서 주어, 목적어, 서술어 등의 수식 관계 문장구조 식별

((((((대한은행이/NP_SBJ 인터넷을/NP_OBJ 통해)/VP (((중도금/NP 대출)/NP 서류)/NP 작성을)/NP_OBJ 편리하게/VP_AJT 할)/VP_MOD 수)/NP_SBJ 있는)/VP_MOD 서비스를)/NP_OBJ 마련했다)/ROOT

문장분리

개체명인식

제안 NLP 특장점

• 국립국어원의 세종계획말뭉치, 국내외대학/연구소의 다양한언어자원 및 언어처리 기술성과를 바탕으로연구/개발된 ETRI의 한국어언어처리 기술 및 노하우반영

• 170여 분류의 개체명 인식성능 제공(개체명 분류 관련세계 최다 분류체계 구축)

• 각 단계에 걸쳐, 전처리/ 후처리를 위한 각종 사전, 규칙 등이 적용 가능하여신조어 등에 효과적으로 대응가능

“대한은행이 인터넷을 통해 중도금대출 서류 작성을 편리하게 할 수 있는 서비스를마련했다. 복잡한 중도금대출을 온라인으로 신청·접수할 수 있는

중도금대출 온라인 신청 서비스를 시행한다고 25일 밝혔다.”

6. 최고 성능 한국어 NLP(자연어처리)

1

2

3

4

마인즈랩 NLP는 국책연구기관인 한국전자통신연구원(ETRI)에서 30여간 연구/개발한 한국어처리 핵심기술로서 한국어 처리를 위한 대용량의 분석 사전과 정확성 향상을 위한 기계학습 기반의 기술이 포함되어 있음.

Page 18: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 18 -

• 기본 사전 30만 어휘

• 기분석 사전(부분 어절에 대한 형태소 분석 결과를 미리 구축하고 다양한 복합 명사에 대한 복합어 분해 사전 포함) 160만 어휘

• 인명 및 기타 분석 사전으로 약 10만 어휘 구축

• 15개 대분류: PERSON, STUDY_FIELD, THEORY, ARTIFACTS, ORGANIZATION, LOCATION, CIVILIZATION, DATE, TIME,

QUANTITY, EVENT, ANIMAL, PLANT, MATERIAL, TERM

• 170여 유형에서 약 360만 어휘에 대하여 개체 유형을 부착한 사전을 구축

• 축약형(건국대학교 -> 건대), 혼용형(국민학교 -> 초등학교), 약칭형(미래창조과학부 -> 미창부), 별칭형, 이동형, 생략형

등 다양한 이형태 표현에 대하여 원형 복원 사전을 통해 일관성 있는 어휘 관리를 지원함

• 약 8만 어휘에 대한 분석 사전 구축

6. 최고 성능 한국어 NLP(자연어처리)

산업 도메인 및 고객 특성에 유연한 대처가 가능하도록 대용량 기본사전 및 사용자 사전을 제공

Page 19: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 19 -

Real-Time STT-TA : 실시간 Text 전환, Keyword 분석, 패턴분석,감성분석 및 콜 분류와 요약

마인즈랩 iVOC는 실시간 STT 뿐만 아니라 실시간 TA까지 완벽히 지원됨

7. 실시간 음성인식 및 텍스트 분석

수집/분배서버

STT

음성인식 서버

STT

STT

STT

ImpalaSolr

Hadoop

결과 처리∙분석 서버 Web/WAS

녹취파일

Dashboard

VOC 전사QA 평가상담요약

분류

실시간 이슈Keyword

n대

수집

분배

NLP

키워드

패턴

감성분석

콜분류

요약

TA 서버

REC

Page 20: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 20 -

8. 빅데이터 분석 인프라

i-VOC는 비정형(음성/텍스트)과 정형 데이터, 내부와 외부 VOC를 아우르는 통합 플랫폼입니다.

내부

시스템

외부

시스템

내부

데이터

I/F

외부

데이터

I/F

정형

데이터

비정형

데이터

실시간 분석

사용자

정형분석

음성모델학습

언어모델학습

음성인식결과

문장분리

형태소분석

개체명인식

구문분석

어휘중요도분석

연관어분석

감성 분석

내용기반자동분류

고객사 정형 DW

STT NLP TM

Streaming 영역

H

D

F

S

Impala

R

배치분석

H2O Prediction Engine

SDK/API

Rapids Query R-engine

Nano Fast Scoring Engine

In-Mem Map Reduce

Distributed fork/join

Memory ManagerColumnar

Compression

Deep Learning

Ensembles

Clu

ster

Cla

ssify

Regre

ssio

n

Tre

es

Boost

ing

Fore

sts

Solv

ers

Gra

die

nts

STT/TA 영역

Spark

Page 21: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 21 -

9. Power User 용 Flexible UI

Power User나 프로젝트 수행인력을 위한 Flow 구조의 UI 제공

Page 22: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 22 -

10. System Infra & 자연어 검색엔진 Solr 내장

Page 23: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 23 -

11. 최신 머신러닝 분석 알고리즘 제공

• 선형 모델 (GLM)

• Cox Proportional Hazards

• Naïve Bayes

• Random Forest

• Distributed Trees

• GBM

• R 패키지- Super Learner Ensembles

• Multi-layer Feed-Forward Neural Network

• Auto Encoder

• Anomaly Detection

• Deep Features

• K-Means

• Principal Component Analysis

• Generalized Low Rank Models

• Generalized ADMM Solver

• L-BFGS (Quasi Newton Method)

• Ordinary Least-Square Solver

• Stochastic Gradient Descent

• Integrated R-Environment

• Slice, Log Transform

Page 24: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 24 -

HMD 토픽별 언급 문장 현황

12. 표준 End User UI 및 시각화 도구 I/F

iVOC 탐지 결과는 Web 기반의 표준 End User UI 또는 Tableau 등 BI Tool과 Interface됩니다.

1

제품별 언급 토픽 현황2

대시보드로 구성3

Page 25: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 25 -

13. Big Data Analytics Platform 제공

Page 26: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Big Data Solution:

Insight Deep MininG Service 분야

Page 27: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 27 -

Data Mining & Analysis Contents

문장 분리

형태소 분석

어절 단위 구문 분석

개체명 인식

어휘 중요도 분석

연관어 분석

감성/속성 분석

이슈 군집 분석

이벤트 분석

Risk 탐지

경쟁 관계 분석

Page 28: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 28 -

빅데이터 딥러닝 질의응답

음성인식 자연어처리 감성분석 이미지분류 데이터마이닝

What is Big Data?

산업

비즈니스 활용영역

콜센터 효율화빅데이터 분석

빅데이터 기반광고

금융기관 리스크관리

헬스케어 빅데이터

소비재산업 마케팅

IoT홈오토메이션

Page 29: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 29 -

Consumer

Needs

• Customer Unmet

Needs

• Consumer Usage

Behavior

• Category

Definition

• Key Buying

Factor 분석

• 상품/서비스 사용

후 만족/불만족

• 고객 경험 관리단

계별 Trigger &

Barrier

• User Journey

Mapping

NPD

• 신상품/서비스

Idea 도출

• New Recipe 발굴

• 신상품 출시 후 초

기 반응 및 개선점

도출

• 경쟁사 신상품 반

응 분석

• Product Design

반응 및 벤치 마킹

디자인 발굴

• 소재/원료/성분

소비자 효익 표현

언어개발

• 융복합 상품

아이디어 seed 도

• 신상품/서비스

Concept

Development

AD/Campaign/

Promotion

• 단계별 매체 인지

경로 분석

• Media Planning

• 광고/캠페인 등의

모델 이미지 분석

• 효과

/Performance

분석

• Communication

Concept

Development

• Brand Image &

Positioning 영향

력 분석

• 효율성 분석

• 광고/캠페인 구성

요소별 진단

상담/Call센타

• Consumer

Experience

Management

분석

• Customer

Loyalty

Management

• 인바운드 상담업

무 효율화

• TM 업무 효율화

• QA 업무 효율화

• RISK 관리(상품

불만징후 감지, 영

업/마케팅 불만

요인 감지, 서비스

불만 요인 감지 등)

• Operation 개선

(상품 기획 정보,

고객서비스 운영

개선 정보,

영업활동 개선 정

보 등)

Marketing/

Brand 전략

• Brand Buzz량

변화 모니터링

• Brand Image &

Positioning 변화

및 원인 분석

• 경쟁브랜드 및

경쟁력 비교

• 각 브랜드 이슈

발생 후 위험 요인

초기 모니터링

• 가격인상/인하에

따른 고객반응

• 온라인 몰

유통상에서

판매 가격 파악

Lifestyle/Trend

• Consumer Life

Style 변화 및 영

향 요인 파악

• Issue Trend 분석

• OL 특성 및

Key Issue 진단

• 거시경제 지표와

Life Style

관계 분석

기업 이미지

•기업이미지

• 기업 이미지

변화 방향

• 각종 기업 이슈

발생에 따른 위험

요인 도출 및

리스크 예측

Insight Deep MininG Services의 Marketing 활용 분야

Page 30: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 30 -

Insight Deep MininG Services 상담 VOC 분석 세부 활용 분야

인바운드

상담업무

효율화

1) 콜내용 요약

2) 통화내용에 의한 자동분류

3) 고객 불만의 근본원인 분석

4) 통화내용 파악을 통한

업무 프로세스 개선점 제공

상담업무 효율화

TM업무

활용

1) 불완전 판매 여부 분석(필수 고지사항, 본인 동의, 조건 등)

2) 상담원별 상담 패턴 분석 정보 제공

3) 상담 내역에 대한 각종 키워드 분석

QA업무

효율화

1) 상담 스크립트 준수 여부 검출(금칙어/규칙어)

2) 통화내용 전수 검사를 통한QA업무 효율성 향상

3) 실시간 모니터링 정보 제공

4) 상담원 성과 차이 분석

1

2

3

Risk

관리

1) 상품 불만 징후 감지 및 분석

2) 영업/마케팅 불만요인 감지 및 분석

3) 고객/서비스 불만요인 감지 및 분석

4) 대외 민원 불만요인 감지 및 분석

5) Compliance Risk 징후 감지

VOC 빅데이터 분석

5. Operation

개선

1) 고객 니즈 기반 상품 기획 정보 제공

2) 고객 서비스 운영 개선 정보 제공

3) 영업활동 운영 개선 정보 제공

4

5

Page 31: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Deep MininG Service를

활용한 통합 VOC Management

Page 32: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 32 -

통합 VOC 관리의 의미 Ⅰ

콜센터VOC

Blog커뮤니티

SNS

홈페이지Q&A

Portal검색

Social Data 통합VOC콜센터 중심 VOC 관리

콜센터VOC

Blog 커뮤니티

SNS

홈페이지Q&A

Portal검색

소셜 데이터 포함,기업 내·외부 VOC

통합관리

통합 VOC란 Call Center 등 경로로 유입된 고객의 직접적 Voice 뿐만 아니라

Social Network상에서 교환되고 있는 간접적 Voice까지

‘통합’ 관리하는 모델을 말합니다.

Integrated VOC Management

과거 대부분의 기업들은 수집된 VOC 데이터를 제대로 활용하지 못하고 VOC 해소 여부만을

모니터링 하였으나 이제는 Big data 분석, 가공 및 활용 방안을 도입하여 진정으로 고객이 원하는 것이 무엇인지 확인할 수

있게 됨

VOC 관리체계에 Big data가 활용된 배경

Page 33: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 33 -

• Insight추출

제품/서비스 개발 마케팅 고객관리 리스크관리

• 관련부서 활용

‘Customer Experience’체계 연계

부정적 평판 조기대응

서비스 불만요인 및 추가필요기능정의

캠페인ROI 평가체계구축

고객응대개선

마케팅전략

신상품개발

상품/서비스개선포인트

도출

조기경보

담당부서로의 적극적인 피드백 및활용 프로세스 구축

Integrated VOC Management

통합 VOC 관리의 성공의 열쇠는 Technology 측면의 접근만이 아닌 정보를 어디에 활용할 수 있는지 명확하게 정의하는 것

통합 VOC 관리의 성공 요소

통합 VOC 관리의 의미 Ⅱ

‘통합’관리의 두 번째 측면은 Insight 추출 후 관련부서로의 피드백 프로세스까지

포함한다는 것입니다.

Page 34: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 34 -

마인즈랩이 보유하고 있는 VOC 분석엔진과 Tool을 활용한 분석 및 인사이트리포트 제공 서비스

• 마인즈랩이 보유하고 있는 VOC 분석엔진과 Tool을 활용하여 콜데이터또는 SNS상의 데이터를 분석하여 찾아낸 인사이트를 리포트로 제공하는서비스.

• 월별 또는 분기별 등 다양한 주기로 정기적인 분석서비스를 제공

고객사의 자체적인 VOC 분석체계 구축을 지원하는 서비스

• VOC를 수집/가공/분석/활용하는 체계를 자체적으로 구축하고자 하는고객사를 종합적으로 지원하는 서비스

• 진단 및 마스터플랜, 개별 고객사 맞춤형 통합 VOC 분석체계 설계, 분석엔진 및 툴 도입 지원, 시스템 구축 지원

+

Integrated VOC Management

고객사의 규모와 요구사항, VOC 활용목적에 따라 통합 VOC 관리체계 및 데이터 분석 플랫폼을 고객사에 직접 도입하거나

분석 서비스 형태로 제공받는 크게 두 가지 방식으로 서비스 유형을 선택하시거나, 두 가지 방식을 결합한 하이브리드 방식의

도입도 가능

Our Service Category_서비스 유형

VOC분석서비스 제공

(Analysis as a Service)

VOC 분석체계도입 지원

(Embedding)

Page 35: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 35 -

Data

Processing

EXTERNAL DATA INTERNAL DATA

CONNECTCOLLECT

Analyse

Activate

CONTEXT EMOTION AUDIENCE ROOT-CAUSE PREDICTIVE

고객 이탈방지 리스크 관리 서비스개선

잠재 고객 발굴 신규 상품개발

Management HMDTEXONOMY사용자사전 키워드

MINDs STT MINDs TA MINDs InsightMINDs

Machine Learning

감성분석

TextMining

자연어처리

음성인식

음성인식학습

산업별 트렌드

이벤트/리스트

키워드/연관어분석

지도학습

비지도학습

Voice

(음성)

Social

(SNS)

Web

Crawling

Log

(로그)

Structured

Date

(정형데이터)

Page 36: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 36 -

Keyword 빈도수

상품 312

계약 255

보험 100

2016-01-01 ▼

총 콜 건수 : 500(2016-03-07 14:11), 콜 처리건수: 350(2016-03-07 14:11), 평균 콜 처리시간: 3Min(2016-03-07 15:11)

불만_45%

고불만_30%

계약_42%

보상금신청_33%해지처리_24%

업무유형별

불만유형별

현재일 기준으로 한달 전 기간-현재일의 기본 통계가 중심-기간검색은 빅데이터 분석에서 가능

키워드는 TOP 10개 까지Keyword 클릭 시 빈도추이 표시- 화면 로딩 시 첫 Keyword 빈도 추이 표시

많이 사용한 키워드 순위로 표시업무유형 별 Keyword 빈도 비율

불만유형 별 Keyword 빈도 비율

기본 통계 > Dashboard(Keyword)

Page 37: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 37 -

Volume of the Callsfor the current selection

12

Volume of the Calls for the current selection

8

Category

12

2

1

Calls Count

# PID DID Date File 유형 Sentence

1 hli_data2 20160222 2000011U^KGIQ07811369_CONV RC교체

여보세요. 네 여보세요. 네 고객님 여기 아까. 방금 전에 통화했던 한화 생명 김현정인데요. 네도 현진님되실까요. 네 네 고객님 다름이 아니고 고객님 아까. 외환 은행으로 약관 대출 이자 변경해드렸는데 네 부분 고객님 이십오일 날까. 구월달 이십오 일부터 이자 부분 출금이 되세요. 그러세 지금네 확인해 보니까. 고객님 아까. 가상 계좌 말씀해 주셨는데요. 네 약관 대출은 고객님 그 가상 계좌가 있습니다. 우리은행요. 네 네 예 알겠습니다. 고객님 근데 우리 은행 계좌 번호하구요. 금액도 같이문자로 좀 보내드릴까. 알겠습니다. 네 김현정었습니다. 늘 건강하세요.

2 hli_data2 20160222 2000110UW$TK$10411368_CONV 자동이체 행복을 전하는 상담원 김은영입니다

3 hli_data2 20160222 200021-MQL2KA11311371_CONV 카드수납 행복을 전하는 상담원 아라입니다

4 hli_data2 20160222 200031-G$HH($09911370_CONV 서비스불만 고객과 함께 하는 상담원 조희주입니다

문서리스트

Category

해지 처리

보상금 신청

계약

없음

RC교체

보험_대출

보험_계약

고객 요구사항

업무유형

없음

불만

고불만

Period

2016.03.01~2016.03.07

고객 불만사항

해지처리

보상금신청

계약

해지처리 30%

보상금신청 24%

업무유형 별 키워드 비율

업무유형 클릭 시 키워드 수 표시

키워드 기준 업무유형 별 전체 Count, 업무유형별 고객요구사항, 업무유형별 고객불만사항표시

고객요구사항 or 고객불만사항 Count

업무유형 별 고객요구사항과 불만사항 표시-업무유형 클릭 시 달라짐

차트 or Count 수를 클릭 했을 때 해당 문서리스트를 표시

문서리스트를 클릭 했을 때 팝업 형태로 표시

화살표를 이동하여 기간조정 가능

체크한 부분만 화면에 표시됨- 업무유형은 Default로 1개

이상 체크되어야 함

빅데이터 분석 > Keyword

고객요구사항

7

1

1

2

1

1

고객불만사항

Page 38: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 38 -

Category

해지 처리

보상금 신청

계약

없음

교체_RC

보험_대출

보험_계약

고객 요구사항

업무유형

고객 불만사항

Period

2016.03.01~2016.03.07

없음

불만-설명미흡

불만-수령금과소

고불만_민원

1 132 1

2

5

1

1

4

2

3

0

5

10

15

해지처리 보상금신청 계약

기타

보험 계약

보험 대출

RC교체

1 1

32

1

2

5

1

1

0

2

4

6

8

10

해지처리 보상금신청 계약

고불만_민원

불만_보험

불만_계약

업무유형별 고객불만사항 업무유형별 고객요구사항

해지처리 보상금신청 계약

말@없안내@안하

불만 상담@없 말@없얘기@없

항의

보험@얘기@없

사망$전화@안되

소@소송

설명@없오래@걸리

지금@얘기@아니 빨리@

하 어주

빨리 @ 부탁

얘기@없

이해@못하

얘기@없 이해@없환급 금@

차이얘기@아니시냐구

전화@얘기@없

잘못 알

문장

홍길동 >> 지금$얘기$아니내가 얘기하는 거는 유지를 원하는 것이 아니고 지금 한 칠년 동안육만얼마하는 건데...

업무유형별 HMD탐지어

고객:홍길동HMD탐지어:소@소송Sum: 2

고불만_민원: 5

# PID DID Date File 업무유형 분류1 분류2 HMD Sentence

1hli_data2

20000 20160222 11U^KGIQ07811369_CONV 해지처리 불만 해지환급금 관소 수령금 / 과소 / 부족여보세요. 네 여보세요. 네 고객님 여기 아까. 방금 전에 통화했던 한화 생명 김현정인데요. 네도 현진님되실까요. 네 네 고객님 다름이아니고 고객님 아까.

2hli_data2

20001 2016022210UW$TK$10411368_CONV

해지처리 불만 해지환급금 설명 부족 설명 / 과소 / 부족 행복을 전하는 상담원 김은영입니다

3hli_data2

20002 201602221-MQL2KA11311371_CONV

보상금신청 불만 보상금 신청 복잡 보상금 / 신청 / 복잡 행복을 전하는 상담원 아라입니다

4hli_data2

20003 20160222 1-G$HH($09911370_CONV 보상금신청 고불만 보상금 과소 보상금 / 과소 고객과 함께 하는 상담원 조희주입니다

4hli_data2

20004 20160222 1-G$HH($09911370_CONV 계약 대출 보험금 대출 신청 보험 / 신청 / 조회 고객과 함께 하는 상담원 조희주입니다

HMD탐지 문장

14Page Audio Player 연결

업무유형 별 불만사항 표시

업무유형 별 고객 요구사항 표시

상위 차트에 표시되는 고객의 HMD 탐지어를 TreeMap으로 표시

HMD 탐지어 클릭 시 문장을 보여줌

차트 or Count 수를 클릭 했을 때 해당문서리스트를 표시

체크한부분만화면에표시됨-업무유형은Default로1개이상체크되어야함

빅데이터 분석 > 업무유형별 Call 분석

문서리스트를 클릭 했을 때 팝업 형태로 표시

Page 39: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 39 -

해지 처리

보상금 신청

계약

없음

교체_RC

보험_대출

보험_계약

고객 요구사항

업무유형

고객 불만사항

Period

2016.03.01~2016.03.07

없음

불만-설명미흡

불만-수령금과소

고불만_민원

Category

0

20

40

60

해지처리 보상금신청 계약 기타 업무 1 업무 2 업무 3

해지처리

보상금신청

계약

기타

업무 1

업무 2

1 1

3

2

4

2

1

3

2

3

1

0

1

2

3

4

5RC교체

보험 대출

보험 계약

요구 3

요구 4

요구 5

요구 6

요구 7

업무 유형

고객 요구 사항

10%

20%

30%

negative

neutral

positive

# PID DID Date File 유형 Sentence

1 hli_data2 20160222 2000011U^KGIQ07811369_CONV 불만_설명미흡

여보세요. 네 여보세요. 네 고객님 여기 아까. 방금 전에 통화했던 한화 생명김현정인데요. 네도 현진님되실까요. 네 네 고객님 다름이 아니고 고객님 아까. 외환 은행으로 약관 대출 이자 변경해드렸는데 네 부분 고객님 이십오일날까. 구월달 이십오 일부터 이자 부분 출금이 되세요. 그러세 지금네 확인해보니까. 고객님 아까. 가상 계좌 말씀해 주셨는데요. 네 약관 대출은 고객님그 가상 계좌가 있습니다. 우리 은행요. 네 네 예 알겠습니다. 고객님 근데 우리 은행 계좌 번호하구요. 금액도 같이 문자로 좀 보내드릴까. 알겠습니다. 네김현정었습니다. 늘 건강하세요.

2 hli_data2 20160222 2000110UW$TK$10411368_CONV 불만_수령금과소 행복을 전하는 상담원 김은영입니다

Volume of the Sentiment Type for the current

selection

50

Percentage of Emotion

업무유형 별 HMD 개수

업무유형에 해당하는 고객요구사항 표시

업무유형별 or 고객요구사항별 감성 비율

차트 or Count 수를 클릭 했을 때 해당문서리스트를 표시

빅데이터 분석 > 감성 분석

Page 40: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 40 -

빅데이터 분석 > Audio Player

Page 41: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Big Data Solution:

Technology Partner MINDs Lab. 소개

Page 42: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 42 -

2015. 12 삼성화재 Data 분석 기반 혁신 과제 추진 프로젝트 수주

2015. 12 현대카드 '콜센터 음성인식율 검증 POC 프로젝트

2015. 11 건강보험심사평가원 '지식기반 심사시스템 고도화사업' 텍스트분석 부문 수주

2015. 11 '딥러닝 기반의 스마트홈 음성인식 장치 기술 개발' 연구소기업 R&BD 프로젝트

수주

2015. 10 LG전자 콜센터 효율화 프로젝트(실시간 STT)

2015. 10 CJ쇼핑 음성분석시스템 구축 프로젝트 참여

2015. 9 GS쇼핑 콜센터 STT PoC 프로젝트

2015. 9 인사이트코리아 소셜빅데이터 분석플랫폼 구축 프로젝트

2015. 8 VC로부터 투자유치 성공

2015. 8 ING생명 Big Data PoC 프로젝트

2015. 8 삼성화재 STT 솔루션 PoC 프로젝트

2015. 6 국민권익위원회 행정심판 내용분석 프로젝트

2015. 4 스타벅스코리아 트렌드센싱 프로젝트

2014. 12 한화생명 빅데이터 Assessment 수행 POC

2014. 12 MINDs Seminar II 성과창출의 New Agenda 빅데이터로 찾아내는 고객의 소리

2014. 9 한국환경정책평가연구원 보도자료를 활용한 우리나라 과거 기후변화 관측영향

자료구축 및 분석

2014. 7 미래창조과학부 국가연구개발 우수성과 100선 선정

2014. 7 덴츠코리아 소셜빅데이터를 통한 토요타 캠리 KBF 분석 프로젝트

2014. 7 HS애드 LG전자 페이스북 분석리포트 용역

회 사 명 ㈜마인즈랩 대 표 자 유 태 준

사 업 분 야음성인식, 텍스트분석 소프트웨어 및 빅데이터 분석 컨설팅

서비스 제공

주 소

[본사] 대전광역시 유성구 가정북록 96, 307호(장동,대전경제통상진흥원)

[기술센터] 경기도 성남시 분당구 대왕판교로 660 유스페이스 1-B동 12층

전 화 번 호 031-625-4340

회사 설립년도 2014 년 1 월

해당부문 종사기간 2014 년 1 월 ~ 2015 년 7 월 (1년 7개월)

Minds Lab 소개

마인즈랩은 머신러닝과 빅데이터 기술을 기반으로 다양한 솔루션과 서비스를 제공하는 ETRI연구소기업입니다

ETRI 맞춤형기술지원지정기업

국가연구개발우수성과 선정

Page 43: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 43 -

Minds Lab 소개

한국전자통신연구원과 기술협력 파트너십을 통해 엑소브레인 SW개발 프로젝트에 공동 참여하여 상시적인

핵심연구의 공동협력체계를 구축하고 있습니다.

엑소브레인 연구

엑소브레인 과제는 ‘세계 최고인공지능 기술 선도’라는 비전을 달성하기 위하여 미래창조과학부 소프트웨어 분야의 국가 혁신기술 개발형 R&D 과제임. 과제의 목표는 ‘자연어를 이해하여 지식을 자가학습하며, 전문직종에 취업 가능 수준의 인간과 기계의 지식소통이 가능한 지식과 지능이 진화하는 SW’인 엑소브레인SW를 개발하는 것으로 현재 엑소브레인 연구 과제 참여기업으로 연구중임.

엑소브레인 SW개발 프로젝트 마인즈랩 공동 참여

< 관련기사>

단계별 연구목표와 연구결과

지능 진화형 WiseQA 개념도

세부과제별 역할

Page 44: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 44 -PwC컨설팅

마인즈랩은 Big Data와 Deep Learning을 결합한 첨단 Solution과 Service를 제공하고 있습니다.

44

Minds Lab 소개

Page 45: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 45 -

다중음향공간 GMM을이용한음향모델생성방법

음성인식을위한실시간채널정규화방법

Weighted Finite State Transducer 기반의끝점검출

KUS

불확실성을이용한잡음환경에서의음성인식방법및장치

자동음성인식을위한새로운동적특징추출방법

KUS

자동음성인식을위한새로운동적특징추출방법

음성인식에있어유사어휘및어휘패턴을사용하는화자군에기반하는

언어모델적응방법

언어모델군집화 기반음성인식리스코링기술

K

연속어음성인식장치및방법 음성인식방법및이를위한시스템한국어연속음성인식을위한컨퓨젼네트워크리스코어링장치및이를이용한컨퓨젼네트워크생성방법및리스코어링방법

K

화자변이정규화방법에기반한강인한음성인식시스템

음성인식장치및방법발화검증기반대용량음성데이터

자동처리장치및방법

K

실내측위기술을사용한잡음제거방법및장치

엔베스트인식단어계산량감소를위한 2단계발화검증구조를갖는

음성인식장치및방법채널정규화 장치및방법

K

ETRI 특허기술

한국전자통신연구원(ETRI)의 뛰어난 음성인식 특허 기술 적용 (국내특허 11건, 국제특허 6건)

: 국제(미국)특허 : 국내특허KUS

Page 46: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

- 46 -

감성어휘정보구축방법및장치

KUS

언어처리장치및그방법

K

토픽별오피니언과소셜영향력자를기반으로토픽을탐지하고추적하는

시스템및방법

KUS

상품정보자동추출방법및장치

KUS

이슈템플릿추출기반의웹동향분석방법및장치

KUS

소셜미디어에서영향력있는사용자를검색하기위한장치, 시스템및그

방법

K

소셜웹콘텐츠에서의예측기반리스크관리장치및그방법

K

텍스트기반감성분석결과를제공하기위한장치,시스템및그

방법

K

: 국제(미국)특허 : 국내특허KUS

소셜미디어분석을기반으로복합이슈를탐지하기위한장치,

시스템및그방법

KUS

이슈일지를제공하는단말기, 이슈일지를생성하는서버 및이슈일지제공및생성방법

KUS

ETRI 특허기술

한국전자통신연구원(ETRI)의 뛰어난 텍스트마이닝 특허 기술 적용 (국내특허 10건, 국제특허 6건)

Page 47: Insight Korea Big Data Solution: Insight Deep MininG …new.insight-korea.com/download/Insight_Korea_Deep_Mining...음성인식 자연어처 감성분석 이미지분류 데이터마이닝

Insight Korea Ltd.

137-040 서초구 반포4동 96-8 대선빌딩 2층/ 3층

2F/3F Daesun B/D 96-8 Banpo4-Dong, Seocho-Gu,

Seoul 137-040, Korea

T (82 2) 3483 0500 F (82 2) 3481 9033

http://www.insight-korea.com/