predicting personality with social media

12
Predicting personality with social media + CHI EA ’11 -Jennifer Golbeck et al. /최진한 x 2014 Winter

Upload: jinhan-choi

Post on 29-Jun-2015

261 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: predicting personality with social media

Predicting personality with social media + CHI EA ’11 -Jennifer Golbeck et al. /최진한 x 2014 Winter

Page 2: predicting personality with social media

Predicting Personality with Social Media

Jennifer Golbeck Human-Computer Interaction Lab University of Maryland

Cristina Robles University of Maryland College Park

Karen Turner University of Maryland College Park

!!

최진한 1/22/2014

CHI 2011 alt.chi

Page 3: predicting personality with social media

Purpose of Paper

Research Question

social media 프로필로 성격을 예측할 수 있을까?

!Social media에 가입하면서, 사용하면서 추가되는

self-description, status updates, 사진, interests 등의

성격을 드러내는 정보들이 흘러나온다.

!페이스북의 프로필에 idealized된 버전보다는

actual한 성격을 반영한다고 함 M. Back, J. Stopfer, S. Vazire, S. Gaddis, S. Schmukle, B. Egloff, and S. Gosling. Facebook Profiles Reflect Actual Personality, Not Self-Idealization. Psychological Science, 21(3):372, 2010.

Page 4: predicting personality with social media

The Big Five Personality Inventory

1. Openness to Experience 개방성 모험적, 능동적 새로운 가치 수용 Vs. 인습적, 보수적, 경직

상상력, 문호, 정서, 경험추구, 지적호기심

2. Conscientiousness 양심성(성실성)

성실, 솔선수범, 지구력 강함 Vs. 게으름, 신뢰하기 어려움

유능감, 조직화 능력, 책임감, 목표지향성, 자기통제성, 완벽성

3. Extroversion 외향성

사교적, 활동적 흥미 추구 Vs. 냉정, 독립적, 조용한 경향

온정성, 사교성, 리더십, 적극성, 긍정성

4. Agreeableness 호의성

친절, 감정이입적 Vs. 적대적, 냉소적, 비협조적, 무례

호감, 타인에 대한 믿음, 도덕성, 타인에 대한 배려, 수용성, 겸손, 휴머니즘

5. Neuroticism 정서적 안정성과 신경증성

정서적 적응 Vs. 불안정의 만성적 수준

불안, 분노, 우울, 자의식, 충동성, 스트레스, 취약성

“Big Five” 모델은 성격을 측정하는데 많이 사용되는 구조

성격을 5가지 요인으로 분류하고, 각 요인은 하나의 범주에 포함되는 많은 특성을 가지고 있음

http://tste.tistory.com/29

Page 5: predicting personality with social media

Data Collection > Personal Information

이름, 생일, 연애중, 종교, 학력, 성별, 고향 등 가능한 모든 정보를 수집

!정보가 없는 경우가 많기때문에,

각 feature에 정보가 있는지 없는지도 수집

각 feature에 몇개를 적었는지

!예, 전체 279명 중 111명이 서로다른 82개의 종교를 적었다.

통계적으로 분석할 수는 없지만,

종교를 공개했는지 아닌지로 어떤 정보를 공개하기 원하는지 파악할 수 있음

Page 6: predicting personality with social media

Data Collection > Activities and Preferences

TV shows, 영화, 음악, 책, quotes, 정치관 등의 정보도 수집

!종교란의 경우와 마찬가지로 통계적으로 분석할 수 있는 데이터가 아님

!favorite things와 activity는 적힌 글자의 수를 셈

Organizational affiliation은 리스트 수를 셈

political affilation은 공개했는지 아닌지 여부 기록

Page 7: predicting personality with social media

Data Collection > Language Features

언어적 특이점으로 성격을 예측한 선행 연구를 참고

!페이스북의 status update, about me, blurb의 텍스트를 분석

적지 않았거나 10글자 미만은 제외

!Linguistic Inquiry and Word Count (LIWC)로 텍스트 분석

LIWC는 5개의 카테고리에서 81개의 특징에 대한 통계를 제공함

Standard Counts (word count, words longer than six letters, number of prepositions, etc.)

Psychological Processes (emotional, cognitive, sensory, and social processes)

Relativity (words about time, the past, the future)

Personal Concerns (such as occupation, financial issues, health)

Other dimensions (counts of various types of punctuation, swear words).

Page 8: predicting personality with social media

Personality and Profile Correlations

Conscientiousness 양심성

음의 상관관계 : frequency of swear word

인지과정을 설명하는 단어 (seeing, hearing, feeling)

seeing의 subset 단어들

양심적인 사람일 수록 본 것, 들을 것에 대한 것은 쓰지 않는구나.

양의 상관관계 : 사회, 문화가 변화 발전해 가는 과정에 관련 단어

사람을 묘사하는 단어

양심적인 사람일 수록 사람들과 토론하는 것을 좋아하는구나.

!

Page 9: predicting personality with social media

Personality and Profile Correlations

긍정적인 감정 단어와 Aggreeableness 호의성은 양의 상관관계를 가짐

!걱정, 고민을 표현하는 단어와 neuroticism 신경증성도 양의 상관관계를 가짐

!Activity의 수가 많을 수록 extraversion 외향성이 강함

!favorite book list가 길수록 openness 개방성이 강함

!last name이 길수록 neurotism 신경증성이 강해짐

Page 10: predicting personality with social media

Personality and Profile Correlations

Page 11: predicting personality with social media

Predicting Personality

사용자 당 74개의 feature를 사용하여 test된 personality 점수를 예측

!M5’Rules와 Gaussian Processes을 사용하여 회귀 분석

!실제 feature 데이터의 11%만 있어도 personality 점수 예측 가능

Page 12: predicting personality with social media

Predicting Personality

bold: p < 0.05