predic’ve)modeling)for) navigang)social)media - …€™ve)modeling)for) navigang)social)media...

64
Predic’ve Modeling for Naviga’ng Social Media Disserta’on Defense by HU Meiqun School of Informa’on Systems Singapore Management University November 30, 2011

Upload: vuquynh

Post on 23-Jun-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Predic've  Modeling  for  Naviga'ng  Social  Media  

Disserta'on  Defense  by  HU  Meiqun  

School  of  Informa'on  Systems  Singapore  Management  University  

November  30,  2011  

Page 2: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Disserta'on  CommiFee  

LIM  Ee-­‐Peng  Professor  of  Informa'on  Systems,  Chair  

JIANG  Jing  Assistant  Professor  of  Informa'on  Systems  

David  LO  Assistant  Professor  of  Informa'on  Systems  

Christopher  KHOO  Soo  Guan  Associate  Professor,  Division  of  Informa'on  Studies,  

Wee  Kim  Wee  School  of  Communica'on  and  Informa'on,  Nanyang  Technological  University  

Page 3: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tagging  on  Delicious  

3  

Tags  

Page 4: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tagging  on  Last.fm  

4  

Tags  

Page 5: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

5  

Tagging  on  CiteULike  

Page 6: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tagging  Widely  Adopted  in  Social  Media  

6  Images  from  the  Web  

Page 7: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Social  Tagging  Space  

7  

Users  

Resources   Tags  

Annota'on  Assignment  Rela'onship  

Page 8: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Naviga'on  in  Social  Tagging  Space  

8  

Find  resources  via  tags.  

Discover  popular  resources.  

Page 9: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Challenges  for  Effec've  Naviga'on  

•  Challenge  1:  Tag  Sparseness  

•  Challenge  2:  Personaliza'on  

•  Challenge  3:  Resource  Ranking  

9  

Page 10: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Challenge  1:  Tag  Sparseness  

•  Many  resources  are  untagged.  

•  Many  resources  have  few  tags.  •  Tag  sparseness  affects  finding  relevant  resources.  

•  Task  1:  Tag  Predic'on  

10  

Study   Resource  Type   Amount  Untagged  

[Abel  et  al.  2008]   URLs,  Photos,  Publica'ons,  etc.   ≥50%  (GroupMe!)  

[Hu  et  al.  2010]   News  Ar'cles   ≥65%  (Delicious)  

Page 11: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tag  Recommenda'on  on  Delicious  

Recommended  Tags  

11  

Page 12: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Challenge  2:  Personaliza'on  

•  Tag  Recommenda'on  – Target  User    – Target  Resource  

•  Ease  tagging;  But  •  Low  u'lity  without  personaliza'on.  –  Individual  Tagging  Preference  

•  Task  2:  Personalized  Tag  Recommenda'on  

12  

internet  

www  

web  

web  

Page 13: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Challenge  3:  Resource  Ranking  

•  Tag  assignments  are  useful  for  resource  ranking:  – Popularity  =  number  of  annota'ons  

– Recency  =  'me  of  the  latest  annota'on  

•  Tags  are  assigned  at  different  'me.  

•  Temporal  profiles  are  not  analyzed.  

•  Task  3:  Trend  Discovery  

13  Time  

Page 14: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Main  Contribu'ons  

•  Study  three  predic'on  tasks  that  address  the  current  challenges  for  naviga'ng  the  social  tagging  space.  – Tag  Predic'on  – Personalized  Tag  Recommenda'on  – Trend  Discovery  

•  Propose  and  develop  holis'c  methods  for  solving  these  predic'on  tasks.  

14  

Page 15: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Outline  

•  Mo'va'on  •  Studies  and  Results:  – Tag  Predic'on  – Personalized  Tag  Recommenda'on  – Trend  Discovery  

•  Conclusion  

15  

Page 16: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tag  Predic'on  Task  

16  

Target  Resource  with  Textual  Content  

Predicted  Tags  

poli'cs   economy   health  .  .  .  

Page 17: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

An  Example  

17  

security  cyber  cybersecurity  cyberaFack  cyberwarfare  …  nato  otan  sota  u.s.  europe  dossier_otan  …  bbc  

Topic:  security  

Topic:  nato  

Tags  on  Delicious  

Page 18: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Intui'ons  and  Research  Ques'ons  

•  Tags  ≠  Content  Words  •  Tags  form  topics.  

•  Research  Ques'ons:  – How  to  solve  tag  predic'on  using  topics?  

– How  to  model  the  topics  of  tags?  – How  to  relate  the  topics  of  tags  to  the  target  resource?  

18  

security  cyber  cybersecurity  cyberaIack  cyberwarfare  …  nato  otan  sota  u.s.  europe  dossier_otan  …  bbc  

Page 19: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Topic  Mixture  of  Tags  

Topic  Mixture  of  Words  

19  

Correspondence  

security  cyber  cybersecurity  cyberaIack  cyberwarfare  …  nato  otan  sota  u.s.  europe  union  dossier_otan  …  bbc  

Page 20: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

LDAtgg  Model  Assump'ons  

20  

Word  Distribu'on  for  Topics  

Topics  for  Content  Words  

Tag  Distribu'on  for  Topics  

Topics  for  Tags  Correspondence  

cyber       0.3  security     0.3  secrets     0.1  

...  

nato         0.5  na'ons     0.2  union       0.2  

...  

technology  0.3  security     0.2  cyberwar     0.2  

...  

nato       0.4  otan       0.3  u.s.         0.1  

...  

.  .  .  

A  Resource  with  Known  Tags  

Page 21: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

LDAtgg  Approach  Overview  

21  

Formula'on  

Training  Data  

Model  Inference  

Tag  Predic'on  

Encodes  the  latent  variables  and  rela'onship  that  generate  the  training  data.  

.  .  .  

Word  Distribu'on  for  Topics  

Tag  Distribu'on  for  Topics  

.  .  .  

Page 22: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Tag  Predic'on  using  LDAtgg  

22  

Topic  1  

Topic  2  

Topic  3  

Topic  4  

Word  Distribu'on  for  Topics  

Topic  Mixture  for    Target  Resource  

1  1  

Topic  1  

Topic  2  

Topic  3  

Topic  4  

Tag  Distribu'on  for  Topics  

2  2  

Probability  for  Predicted  Tags  

Target  Resource  

Page 23: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Methods  Compared  

•  Methods  Compared  

23  

Method  Group  

Method  Source  of  Candidate  Tags  

AssumpRons  on  the  Coupling  between  Topics  of  Tags  and  Topics  of  Words  

Content-­‐based  o   Words  

None  o-­‐idf   Words  

Topic-­‐model-­‐based  

tagLDA   Tags  Condi'onal  Independence  

LDAtgg   Tags   Correspondence  

Our  Proposed  Method  

Page 24: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Dataset  from  Delicious  

Data  collected  during  April  2009.  

We  split  the  dataset  into  5  folds  for  cross-­‐valida'on.  

24  

Dataset  StaRsRcs  

News  Ar'cles   BBC,  CNN,  USAToday  

Number  of  Resources   4,493  

Average  word  tokens  per  resource   344  

Average  tag  tokens  per  resource   17  

Size  of  word  vocabulary   24,322  

Size  of  tag  vocabulary   12,468  

Page 25: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

R-­‐precision  and  Significance  Test  for  Tag  Predic'on  Performance  

25  

LDAtgg  outperforms  other  methods  significantly.  

Page 26: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Contribu'ons  for  Study  1  

•  Proposed  LDAtgg  Model  – Model  topics,  tags  and  words.    

– Assume  correspondence  between  the  topics  of  tags  and  topics  of  words.  

•  Evaluated  Tag  Predic'on  – Online  news  ar'cles.  – Tags  from  Delicious.  – LDAtgg  outperforms  baselines.  

26  

Page 27: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Outline  

•  Mo'va'on  •  Studies  and  Results:  – Tag  Predic'on  – Personalized  Tag  Recommenda'on  – Trend  Discovery  

•  Conclusion  

27  

Page 28: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Personal  Tagging  Preferences  

28  

internet  

www  

web  

web  

Page 29: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Deriving  Preference  PaFerns  P(  personal  tag  |  resource  tag  ,  user  )  

29  

web  

u2  

web  

internet  

u1  

web  

P(web|web,u2)  

P(internet|web,u1)  

Page 30: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Applying  Preference  PaFerns  

P(  internet  |  web  ,  uq  )  

30  

web  

Target  Resource  

internet  uq  web  

Target  User  

internet  

Page 31: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

When  Preference  PaFerns  are  Missing...  

P(  ?  |  cat  ,  uq  )  is  not  seen  for  the  target  user.  

31  

cat  

Target  Resource  

internet  uq  web  

Target  User  

?  

Page 32: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Borrowing  Preference  PaFerns  

Intui'on:  Borrowed  tagging  preference  paFerns  can  help  recommend  more  tags  to  the  target  user.  

32  

internet  u1  web  

kiFen  cat  

internet  uq  web  

kiFen  cat  

borrow  paFerns  

Page 33: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Finding  Like-­‐minded  Users  

33  

Page 34: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Like-­‐minded  Users  

Assump'on:  Users  are  like-­‐minded  if  they  show  similar  tagging  preference  paFerns.  

34  

internet  u1  web  

kiFen  cat  

internet  uq  web  

Page 35: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Profiling  Users  by  Preference  PaFerns  

35  

P(internet|web,u1)  

P(social|web,u1)  

u1  P(cute|cat,u1)  

P(kiFen|cat,u1)  

Page 36: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Measuring  Similarity  Between  Users  

36  

u1   uq  

Distribu'onal  Divergence  

Page 37: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Methods  Compared  

•  Methods  Compared  

37  

Methods  IntuiRons  

Extract  Tagging  Preference  PaFerns  

Leverage  Like-­‐minded  Users  

knn   ✔  

trans-­‐U   ✔  

trans-­‐N   ✔   ✔  

Our  Proposed  Method  

Page 38: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Dataset  from  BibSonomy  

38  

•  Users  in  the  test  set  are  those  –  who  appear  in  both  training  and  valida'on  sets.  –  whose  tags  used  in  the  test  are  seen  in  the  training  set,  but  may  not  be  used  by  themselves.  

TRAIN   VALIDATION   TEST  

Time  Frame  FEB  06  ~  DEC  08  

JAN  09  ~    JUN  09  

JUL  09  ~  DEC  09  

Number  of  Users   1,185   136   57  

Number  of  Bookmarks   64,120   775   279  

Page 39: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Precision-­‐Recall  Curve  for  Recommenda'on  Performance  

39  

Page 40: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Contribu'ons  for  Study  2  

•  Proposed  a  probabilis'c  framework.  – Extract  tagging  preference  paFerns.  – Find  like-­‐minded  users.  – Borrow  tagging  preference  paFerns.  

•  Evaluated  Tag  Recommenda'on  – Dataset  from  BibSonomy.  

–  trans-­‐N  outperforms  baselines.  

40  

internet  u  web  

kiFen  cat  

Page 41: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Outline  

•  Mo'va'on  •  Studies  and  Results:  – Tag  Predic'on  – Personalized  Tag  Recommenda'on  – Trend  Discovery  

•  Conclusion  

41  

Page 42: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Intui'ons  

•  Tags  arrive  at  different  'mes…  

– Tagging  captures  interest  in  the  annotated  resources.  – Tags  carry  interpreta'ons  of  the  annotators.      From  different  aspects  of  interest.  

42  

E.g.  Social  Media   E.g.  Educa'on  

Time  

Page 43: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Mo'va'ng  Ques'ons  

Given  an  annotated  resource,  – How  trending  (amount  of  interest)  are  the  resources?  

– When  did  the  trends  emerge?  – How  fast  was  the  emergence?  – Which  aspect  of  trends  (e.g.  topics)?  

43  

Time  

Page 44: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Research  Objec'ves  

Task:  Trend  Discovery  using  Social  Annota'ons  

Research  Ques'ons:  

•  How  to  discover  emerging  trends  of  the  resource  using  social  annota'ons?  

•  How  to  use  the  discovered  trends  to  perform  resource  ranking  tasks?    

44  

Page 45: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Proposed  Trend  Discovery  Process  

45  

Social  Annota'ons  

Topic  Modeling  

Social  Annota'on  Profiles  

Trend  Es'ma'on  

Emerging  Trends  

1.  Topic  Modeling:  To  analyze  the  mul'ple  aspects  of  interest  in  the  annota'on  content.  

2.  Trend  EsRmaRon:  To  parameterize  the  characteris'cs  of  emerging  trends.  

We  adopt  latent  Dirichlet  alloca'on  (LDA).  

Page 46: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Social  Annota'on  Profiles  (SAP)  

Corpus-­‐wise  SAP  By  Target  Resource  

Regardless   Specific  

By  Target  Topic  Regardless   -­‐   Resource-­‐specific  SAP  

Specific   Topic-­‐specific  SAP   Resource-­‐Topic-­‐specific  SAP  

46  

Corpus-­‐wise  SAP  

To  slice  the  corpus-­‐wise  SAP  by  two  dimensions.  

Time  

Page 47: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Resource-­‐specific  SAP  

•  All  tags  are  assigned  to  the  same  resource.  – Regardless  of  topic.  

47  

Resource  1  

Resource  2  Time  

Time  

Page 48: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Topic-­‐specific  SAP  

•  All  tags  are  for  the  same  topic.  – Regardless  of  target  resource.  

48  

Topic  1  

Topic  2   Time  

Time  

Page 49: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Resource-­‐Topic-­‐specific  SAP  

49  

Resource  1,  Topic  1  

Resource  2,  Topic  1  

Resource  1,  Topic  2  

Resource  2,  Topic  2  

Time  

Time  

Time  

Time  

Page 50: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Social  Annota'on  Time  Series  (Q)  

•  Q  =  {  (t1,2),(t2,0),(t3,3),(t4,2),(t5,1),(t6,0)  }  •  Trend  Es'ma'on  on  Q  

50  

t1   t2   t3   t4   t6  t5  

count=2   count=0   count=3   count=2   count=1   count=0  Time  

Page 51: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Proposed  Trend  Es'mator  

•  The  Sigmoid  Es'mator  

– amplitude  :  λ    how  trending  – offset  'me  :  τ    when  

– gradient  at  t=τ :  ¼λσ    how  fast  

51  

Fit  to  Data  

Page 52: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Experiments  

•  Target  Resources:  Scien'fic  Publica'ons  •  Social  Annota'ons  – Social  Tags  from  CiteULike  

– Ci'ng  Documents  from  ACM  DL  

52  

Common  Characteris'cs:  1.  From  the  

annotators;  2.  Assigned  to  

the  target  publica'ons;  

3.  Arrive  at  different  'me.  

Page 53: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Trend  Analysis  Tasks  

Trend  Analysis  Task   Social  AnnotaRon  Profile  Used  

Corpus-­‐wise  Trending  Topics   Topic-­‐specific  SAP  

Resource-­‐specific  Topic  Trends  Resource-­‐Topic-­‐specific  SAP  

Topic-­‐specific  Resource  Ranking  

53  

Page 54: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Corpus-­‐wise  Trending  Topics  

Topic  ID   Topic  Tags  How  

trending  When  

How  fast  

122   acm  vldb  sigmod   124.1   SEP  07   35.1  

157   social  community   62.7   NOV  05   18.9  

089  recommender  personaliza'on  collabora'vefiltering  

55.2   MAY  07   18.6  

027   ir  retrieval  relevancefeedback   50.2    NOV  06   29.6  

103   hci  interac'on  interface  ui  user   44.5   APR  06   11.8  

54  Results  using  CiteULike  data.  

Page 55: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Resource-­‐specific  Topic  Trends  

55  Image  from  Amazon™   Top  Emerging  Topics  for  the  Book  

Convex  OpRmizaRon  

Page 56: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Resource-­‐specific  Topic  Trends  (2)  

For  Resource:  Convex  OpRmizaRon  

Topic  ID   Topic  Keywords  How  

trending  When  

How  fast  

155   channel  capacity   194.5   2008   1378.9  

012   op'miza'on  problem   91.4   2007   28.7  

073   wireless  networks   28.6   2007   11.6  

145   sensor  networks   24.0   2008   190.9  

199   noise  signal  filters   20.5   2008   110.0  

56  Results  using  ACM  DL  data.  

Page 57: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Topic-­‐specific  Resource  Ranking  

For  Topic  155:  channel  capacity  

Title  How  

trending  When  

How  fast  

CitaRons  

Elements  of  Informa'on  Theory   200.0   2008   1018.6   2410  

Convex  Op'miza'on   194.5   2008   1378.9   1239  On  limits  of  wireless  communica'ons  in  a  fading  environment  when  using  mul'ple  antennas   146.5   2008   782.5   487  NeXt  genera'on/dynamic  spectrum  access/cogni've  radio  wireless  networks:  a  survey   93.0   2008   562.5   242  

Matrix  Computa'ons  (3rd  ed.)   43.5   2008   224.2   1121  

57  Results  using  ACM  DL  data.  

Page 58: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Contribu'ons  for  Study  3  

•  Trend  Discovery  Process  – Analyze  social  annota'on  profiles.  – Characterize  emerging  trends.  – Perform  trend  analysis  tasks.  

•  Experiments  for  Scien'fic  Publica'ons  – Dataset  from  CiteULike  and  ACM  DL  

•  Corpus-­‐wise  Trending  Topics  •  Resource-­‐specific  Topic  Trends  •  Topic-­‐specific  Resource  Ranking  

58  

Page 59: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Outline  

•  Mo'va'on  •  Studies  and  Results:  – Tag  Predic'on  – Personalized  Tag  Recommenda'on  – Trend  Discovery  

•  Conclusion  

59  

Page 60: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Conclusion  

•  Studies  in  this  disserta'on  address  current  challenges  for  naviga'ng  the  social  tagging  space:  – Tag  predic'on  addresses  tag  sparseness  for  resources.  

– Personalized  tag  recommenda'on  addresses  the  tagging  preferences  of  individual  users.  

– Trend  discovery  using  social  annota'ons  is  a  novel  task  for  resource  ranking.  

60  

Page 61: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Summary  of  Contribu'ons  

•  Tag  Predic'on  – Model  topics,  tags  and  words.  – Assume  correspondence.  

•  Personalized  Tag  Recommenda'on  – Extract  tagging  preference  paFerns.  – Find  like-­‐minded  users.  

•  Trend  Discovery  – Analyze  temporal  profiles.  – Characterize  emerging  trends.  

61  

Page 62: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Publica'ons  Journal  Submission:  •  Meiqun  Hu,  Ee-­‐Peng  Lim  and  Jing  Jiang,  Social  Tag  PredicRon  using  

Latent  Topics.  SubmiFed  to  the  Journal  of  the  American  Society  of  Informa'on  Science  and  Technology.  Under  review.  

Conference  Publica'ons:  •  Meiqun  Hu,  Ee-­‐Peng  Lim  and  Jing  Jiang,  Using  Social  AnnotaRons  for  

Trend  Discovery  in  ScienRfic  PublicaRons.  In  HCIR  2011.    •  Meiqun  Hu,  Ee-­‐Peng  Lim  and  Jing  Jiang,  A  ProbabilisRc  Approach  to  

Personalized  Tag  RecommendaRon.  In  SocialCom  2010.  

Doctoral  Consor'um:    •  Meiqun  Hu,  Ee-­‐Peng  Lim  and  Jing  Jiang,  A  Topic  Modeling  Approach  to  

Social  Tag  PredicRon.  In  Bulle'n  of  IEEE  Technical  CommiFee  on  Digital  Libraries,  6,  Fall  2010.  

62  

Included  in  Course  References,  COMP621U,  Spring  2011,  HKUST.  

Page 63: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Other  Publica'ons  

Conference  Publica'ons:  •  Meiqun  Hu,  Ee-­‐Peng  Lim  and  Ramayya  Krishnan,  PredicRng  Outcome  

for  CollaboraRve  Featured  ArRcle  NominaRon  in  Wikipedia.  In  ICWSM  2009.  

•  Meiqun  Hu,  Ee-­‐Peng  Lim,  Aixin  Sun,  Hady  W.  Lauw  and  Ba-­‐Quy  Vuong,  Measuring  ArRcle  Quality  in  Wikipedia:  Models  and  EvaluaRon.  In  CIKM  2007.    

•  Meiqun  Hu,  Ee-­‐Peng  Lim,  Aixin  Sun,  Hady  W.  Lauw  and  Ba-­‐Quy  Vuong,  On  Improving  Wikipedia  Search  using  ArRcle  Quality.  In  WIDM  2007.  

63  

Included  in  Course  References,  CS  598,  Spring  2008,  UIUC.  

Page 64: Predic’ve)Modeling)for) Navigang)Social)Media - …€™ve)Modeling)for) Navigang)Social)Media Dissertaon)Defense)by) ... Assignment Relaonship) Navigaon)in) ... 103 hci)interac’on)interface)

Thank  you!  

64