ribosomal rna diversity predicts genome diversity in gut ... · ribosomal rna diversity predicts...

12
Washington University School of Medicine Digital Commons@Becker Open Access Publications 2010 Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives Jesse R. Zaneveld University of Colorado at Boulder Catherine Lozupone Washington University School of Medicine in St. Louis Jeffrey I. Gordon Washington University School of Medicine in St. Louis Rob Knight University of Colorado at Boulder Follow this and additional works at: hp://digitalcommons.wustl.edu/open_access_pubs Part of the Medicine and Health Sciences Commons is Open Access Publication is brought to you for free and open access by Digital Commons@Becker. It has been accepted for inclusion in Open Access Publications by an authorized administrator of Digital Commons@Becker. For more information, please contact [email protected]. Recommended Citation Zaneveld, Jesse R.; Lozupone, Catherine; Gordon, Jeffrey I.; and Knight, Rob, ,"Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives." Nucleic Acids Research.38,12. 3869-3879. (2010). hp://digitalcommons.wustl.edu/open_access_pubs/138

Upload: others

Post on 22-Jun-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

Washington University School of MedicineDigital Commons@Becker

Open Access Publications

2010

Ribosomal RNA diversity predicts genomediversity in gut bacteria and their relativesJesse R. ZaneveldUniversity of Colorado at Boulder

Catherine LozuponeWashington University School of Medicine in St. Louis

Jeffrey I. GordonWashington University School of Medicine in St. Louis

Rob KnightUniversity of Colorado at Boulder

Follow this and additional works at: http://digitalcommons.wustl.edu/open_access_pubs

Part of the Medicine and Health Sciences Commons

This Open Access Publication is brought to you for free and open access by Digital Commons@Becker. It has been accepted for inclusion in OpenAccess Publications by an authorized administrator of Digital Commons@Becker. For more information, please contact [email protected].

Recommended CitationZaneveld, Jesse R.; Lozupone, Catherine; Gordon, Jeffrey I.; and Knight, Rob, ,"Ribosomal RNA diversity predicts genome diversity ingut bacteria and their relatives." Nucleic Acids Research.38,12. 3869-3879. (2010).http://digitalcommons.wustl.edu/open_access_pubs/138

Page 2: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

��������� � ��� ����� �� ����� � ��� ��� ������� ��� ���� ��� ��� �� �� � ����� �

� �� �� ��� � ���� ���� ��� ������� �� � � !!� � "� #����� ��� ��� $�������%�&

���������� � � ��� ��� �� � �� �� ���� ����� �� ��� ���������� � ��������� �� ������������

��������� � � ���� �� ���� �� ���� � ������ �� !��� "������� #������ ��������� "�� �

�������� "�$ %���� �� &���� �� '()��� (����� ������ *�������� �"+

,������� �����-�� .� ��� / ,������ 0����� ��� ����/ +������� 0����� ��� ����

'()��)

)� ��������� ��� �� �� ��������� ��� � !��

*������� �� � � ��� +� ����� �! ��, �������

������� �� �������� �! � � ���� ��� )� � !�� �

, ��� ������� ��� � �� � ���������� � �, �

�-( �� � � � +� �� ���������� ��� �� ����

� � �� �! � � ���� ������� �� !��� ������ �!

�� �� �. ��� �� �������� ��� �������������� ���

�! ,���� ��� � ����� � ���� ������ �� ��� ���/

������ ��� � ����� ������ � ��� ������� �� �� /

������� �� ������������ ���� ��� !���� �� �� ���

���� ! , � � � � ���� �� ������� !�� � ��� � ����

��� !��� ���/��� ������� ���� ��� �� ���� �

������ � ��� ������� � ��� ���� ��� �� ���

������� �� ��� ��� � ���� �� � ��� � �� +����� ��

����������� ������� � !��� ���/��� ������� ����

���� ����� � ���� �� �! �����/� �� �� �����������

��� ����/� �� ���� �� �� � 0�� �� �� ���� ���� ��

�� ��� �� � �� ���� ������ �� ��� ���/������ ���

��� ��� � � � � � �� �� �������� ����� � �� ���

���� ���� )��� ��� ������� �� ������� �� ,��� ��

!������ ����� � ���� ������ ���� ��� �� ������

��������� �� �� �� � ���� ��� �� � �� ����������

!��������� ���� �� �� �� �� ��������� �! ��!! �/

�� ������� 1������� , ��� �� ���� � � ,�����

���� ���� �� �� � �� � � �� �-( �� ��� �� ��

������ � �� !�� ��!�������� ����� �� ��� ���� �/

������ �! � � ���� ��� )� � ����� � ����� � � �

������ � �� !�� !�� ������� ������ � � ����� ��

��*���� ��� � � � ������ �� �� ���� /����

� ��� � +� ����� ���2 ���� ,��� �� ��������

����� � ����� � �� ����� � � 3��� �� ��� ������

�� !! ��� �! ������� ���������� �� � ��� ����/

���� ������ ��� � ���� �������� �� ������� ��

��� ��

")�456�)"4

��� ����� �� ���� �� ���� ��������� �� ������ �� ��� �� �� ���� ����� � � ��������� � �� ������� ����� � �� �������� ����� � ���� ���� ������� �� ����� ��� �� �� �� ��������� �� ������������ � ��������� ������ � ��� ������ ���� � �������� ���� ��� ���� ���������������� ����� �� �� �� ����� �� ����� �������� ������� � ��� �� !"# ���� �$������� ���� ���������%�� �� ����� ������ �� �������� ���� �� �&'(�� ��� �� !"#���� � �� �)������ ��*� �� ������ ������� ������������� � � � � ��� ���� �� ����� ������� ���%�������� �� �� ��� �� � ��������� �� ����� ������ ���� � ����� � � ����� � ������ ������������������ �� ���������� ���� �+������ ��� ����� �� ������ ��� �� � ��� ��,��������� ����� ��� ����� �� � �� � � ���� ������ ��� ����� �)� � ������� ����������� ���� - �� �&�.'/� �� ����, �� ������0� �� !"# �� ��� ���� ������� �� ���������������� �� �� ��������� �� ���� ��� ��������� ��������� � ��� ���� �� �� �)������������� ��������� ���� ��� ��� ����� �1�� ��� �� ������ ���� �� ���� �� �� ��� ���� ������������ ���� ��������� ��� �� ������ ��������� �$������� � 2��� ������ ,���� �� !"# ���� ������� ,���� ����� �� ����� �)�� �� �� �� ���������� � ���� �� �� ��������� ���� ������ � ������ �� 3���� 4�������� 5�6�� ���7 �� ���6�� �������� ��* � ���� ������� �� ������������� ����� ���� �� �� ���������� � ��+����� �� !"# ���� � � ����� ��� �� �� � �8'�9�� ������� ���� ��� �� $�� ���� ,� � * ,��������,������ ����� ���� �������� �� ��� ��� �������� ���� ������ ��� ,� ,���� �)��� ��� �������������� ������ ���� :� �������� � �� ����� �������� �� �� ���� ������ �� �� �,���� ������� �� �� ������ �,���� ��� � ����� ����� ������������ ���;

<�� ,��� ��� �������� ����� �� ���� ��� ���7 =� 9>9 (8& �81(� ?�)7 =� 9>9 (8& //((� @����7 ���*����A�����������

�������� ����� � ���� ���� ������� ���� ��������� ����� ��� ��� �� �� ���������

���������������� �!!

� ��� #���� � &>�>� 5���� ��� �� B)��� 2���� �� 5� �

��� � �� B��� #��� ����� �� ����� ���� �� �� �� �� ������ ������ #������ "������������ C���� � ���7DD������������ ���D����� � D

�����D&�.�� ,���� ���� ��� ���� ������������� � �� �� ������� ��� ��������� �� ��� ������� ������� �� ������� ,�* � ������ �����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 3: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

���������� �� � �� � ���� ��������� �������������� ��� ������� �� ������� ������ �� ���� ������������������� ����� ������� ��� �� ��� ������� ������������������ �� � �� ����� ��������� ������� ���� �! "�������� ������� ��� ���� ������ ���� ���� ��� ����������� ������� ������� ��#�# ����� ������ ��� ���� �����$���� �%����� �� ��&����# ������� ���������� ����������� �������" ��������� ������ ���������" ���� ��%��$������� ��� ����'����� ���� ��������# (���� ���� �����)��������� �������# *������" ��� ����� �� ������������ ������� �� ��� ���� �� ��������� �� ���� ���������� ���� ���� �������������� ������� ����� � ����������� �� �%�����" %�������� ���� ���$����$������������������ �+ # ����������� ��������� �� ���� ���������� ���� �������� ������ ���������� ��������� �%�����"������� �������� ���� ���� ������������ ����� ������������� �� � �� ������ �������$���������� ,������ ������� �� ���� �- .#

(���� ������������ ���� ��������� �%����� ���� �� ����������� �� ���� ������������ �+"/"0 " ����� ��� ���������� ������� ��� ���������� ��� ��� �� ���������� �� %�%�$������ ��������� �- " ��������� ������ ���1�� ��������������� �� ���������� ������������ ���� ����� ���������� # 2�� �)��%��" ��� ���� �� ����� ���� ������� ���������� %����������� �������� �+ ����� �� ��� �� ��� �� ������������� �������� �����# (�� ����$����������'���)��%��� �� ������������ ������� �%���3� ��������������� ���������� �� ������� ������ ��� ��� �)����������� ��������� �������� �� �������� ���������������������� ��� ������������� %�������� �45644 �� ���� ����������� ���%������ �� ��%�������� ������������������� ���������� �� %������� ���������� ���%������� ���� ��� ������ ����� ����� ��%������ ��� ���$������ �47"4! # *������" ���������� �� ���%������ ���%���3� ������������ ���� ��������� ���� ��8���� ��������#

(�� ��������� ��� %������� �� ���������� ����� ���)%���� ����� ������" ������� �� ������� �� ��%����������������� ����% �� �������� �/ # �� ���� ����������� ����������� � ������ ��������� �����������" �� ����� �)%��� ������������ �%����� ���%� �� ��� ��� �� ���������� ����������� ���� �������# 9��� ���������" ����� ��� ������� ���������� �������� ������� � ������� ��� ����� ���� �� ���������� ���� %����������� �������� ����� ����� %������ �+ #2�� �)��%��" ���%������ �� � ������ ����������� ����������� ��� ���� ����� ��������� ��� ������ ��� �������� ������ �����������" ��� ����'����� ���� �������� ����������� �� ������� %��&�� �����������" ������� �� ���������� ����� ��#�# ��� ������ ��������� ��� ��� ��������% �� 54 �����1�� ������� �������� # �������������" ���$%������� ������ � ������ ����������� ����� %������ ������%������'����� �4+64- �� ������� ��������� ����� ����������� ��� �)%���� ����������'�� ���������# (���" �������� ���� ��������� ��� �����������% ������� ���������$��� ��������" �� �������� �� � �� � �������� �����$�����" ��� ���������� �����������" �� ��� ����� �� ������% ������ ��%��������" ����� ������ �� �������������� ���������� ������� ����������#

�������

��������� � ����������� � �������

:� ������ �� �������� ������� ��%��������� �������� ����������� ���� ���� �%�������� �� �����%������" ������$%��������� �� %���������# (� �� ��" �� ����������0+ ������� ���� ��� ;<== �������� ���� ����������� �� ��� ��������������" >������������"2��������� ���%������� ��� ?������������ ��� ���@�������������� " �$A�������������" �$A������������� ������ �$A������������� �<������������� # (�� �������� ��������� ����� ������� ���� ��������� ���� ��������������'�� ��������� �� ����� ������� ��� %������������������ �2����� ��������� �� ��� ��������� ���&B��C �� (� ������ ����������� �� ��� ��������� �� ��� �������� ��������� ������ ��������� ���� ��������" �� ��������������� � �� �$����� ������������� ������� �� �����$���� ����������� ��� ��%������ ��������� �� =��>��&���� ���� ������ ��������� �� ��� � �� � �������� ����� ������%������ ���%���� ������# :� 3��� ������������� ����� 3��� ���� ��� ?>� ��% ���� �� 7 ��������455- ��� ���� ���� �� ������ � >@��( ��������# (����3��� ������� =��>��& ������� ��� ��� < D ��������" ����%����� �� ��� ���$��������� ���������� �������� ��� ����� � �� � ������������� ������ ���� �����%������# =��>��& ������� ��� ���� ���� �0/E�������� �������� ���� !55 �% �� ��� � �� � ���������� ���� ������ ���� %����� �� ������ � ���� �� ����� ���������������� ���� ��� ����# ��� (���� ����� ������ ���� ���� ����������� ������� ����� ��������� �� ���� �� ��� ����������� ���� ����� ���� �� ��� ��� ���� �%�������� " ����� �� ������ ����$��� �� �� ��� ��� �� ���� �� � ��������� ������$������ ����������� ���� �����%������ # ���� �� �����$���� �����" ����� ����� ��������� �� ��� ������� ���� ������� ���� ������������� ���%��� ��� ���� ������ �� ������%���" ��������� ����������� ���� ��� =F@� ����������� ���� �� ������ ��� � ������ ������ �� ��������'��#�� ����� ��������� �����" ������� ��������� �� %���������� ������� �������� ���� ��� ������ ��� �� �����" ������������'�� �� G��� �����%������H ������� ������ ������������'�� �� ���$���# (������� ������� ���� ����������� ���������� �������� ������� ����� ��������� ���%������%�� ����������� ���� =F@� ���� ��������� �����B�����# (��� ������3������ %������ ������� - ��� �%�$��������" !7 ��� �����%������ ��� 44 ���$��� ��������# ��� :����� ���� �� ����� ���� ����������" %�������� ����������3�� ����� =F@� ����������� ���������� /F������ 4550 �4/ #

���� �����������

=��� ������������ ��� �������� �� ��� %��%������ ������� �� ��� ����� ������ ���� �� ����� ��� ���������������� �� ��� ���I��� ������ ���� >@��( ��������"����� # (��� ������� �� ���������� ������� ��� �������� ���I��� ������ ��� �� �� �������� ��'�� ��#�# �������� � �������� +55 �����" ������ > �������� +555����� ��� ���� ����� 4+5 �����" > �������� +5E �� �������� �� �" ��� � �������� ���� +E �� ��� ����� �� > #(�� ���%������� ������� ������� ���� ����� ��'�

���� ������ ����� ��������� ����� �� ��� �� ��

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 4: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

���������� � �� �� �� ���� �� ������ �� ����� �� ������ �� ���� ����������� ���� ���� ���� ��������� ���������������� ��� ����� ���� ����� ���� ����������� � ���� ��� ��� ������ ����! ����� ��������� ��� �������"#$ ������� ���� � ��"#$%&'(& ������ �� ������&'(& ������) *�� ���������� ������ ������� �� ���+������ ���� ��������� ��� ���� �,�� ��� ���� ��� ��-����� .�� ��� $�� $�� / �� /�� (�� � �� � ���������-.�� �� �� � ����� ����) ����� ������� �� � �0��� �����1 ��� ��������� ���� ������� �� ��� ������ ��������� �� ��� ����� ������ ��� ������ ��1 ���������� ��� ������� ����� ������ �� ��� ��������������� �� ��� ������� 1 ����� ���� ������� ����,�� ��� ���� ��� ��-��� ��� ���������� �� ����������� �� ���� �����- �������) *� ����� ��� �����2������ ����������� ������ ���� �����- ������� �� ����������� ������������ 3���� ����� ��� �4 444 ���� �+����� ��� � � �� ������ ��� � �� ����, �� ���������� ������ �,�� ��-���� � ��� � � ����� �� ����� �������� �������� �- ������������ �����������- �� �����������-�� ����������� �� �������) *���� ��� ��������� ���� ��� 3���� ���� ������������� �� ��� 5-6���������7�� �8'�)

����� �����

9:;�*� ��-��� ��� ���� ���� ���� � ���� �-���������� ���� �� 5-6����� �8'� �� � � <69= 9:;�* �$4�);��-��� ��� � � ���� ��� 9:>�?3(8 ����, �+39:>�?3(8� ��� �,�� � ���� � ��� �� � �+� ��)@��� ��� ���� 2������ �� � �+�� � ��������� �� �4��4

���-��� ���� ��������� �+�� � ���������� ������ �������� �� ��� ��� � � ��� ��� 1 ������� � ������ �� ��������� �� ���� ��� ������� ������� �"/A �� ��������� �� ���� 1 ��- �� � �0��� ��� ��0�����)

�� �����������

�(� ��<; ��1 ����� ��� ��� �� ��� ������� ���� �� �-��� ������2�� �- 9:;�*��� ��� �� ���� ���B ���� �������� � �������� �� �� 2�� ���� CDBB� �����!EE)������)�)0�E�� ��� ��� ������ ��� � �+�� � ������+��� �� ��%84 �� ��� ������ �� ��) ���� ������������� � ������ �(� ��<; ��1 �����) F� ����2���� ��- ��� ��� 9:;�* �������� ��� ������2�� ���( � ��<; ��1 ����� ���� ������ � �� ������� ����� ������� ��� �� ���� ������2�� �� ������ � �� �-�$��) �( � ��<; ��1 ����� ������2�� �� ���� �������� ���� ������ ���� <;�* �$8�)=� ���� ���� � ������ �( � ��<; ��1 ����� �� ������

������ ����� ��� <;�* ������� ��1 ����� ��� ��������������-) *�� :�� ��7 �$$� ���� B����B���� �$&� ������� �� ��� �������� <;�*+������ ��1 �����)5�-��������� ����� ��� ������ ���� �� 6���6 � �$/� ���� ��������� ��������+0������ �� ��� C�� ���+������� ������� ����������) =� ����� �� ��������������� ����� ���� � �� � ����� �������� �-�-����1 ������ � �� � G�� ��� ��-��� �� ����������� �� ���� �����- �������� ����� ��� ��� ���+��� ���� ���� ��� ���� �-����1 ������ ����) =� ����

���� ����� ��� ��� ������ ���� �- ��� ��� ������ ���� � ������ ���� ���- ��� ������� �� ��� �( � ��<; ���+���������� �� 8/4 ���� �� ��� ������� ����2�� �- H8� H&�� H( ������� �$(�) *���� ��� �������� �- �7��� ���-��� ������������� ������� ���� ��� � ��+������ �( � ��<;��1 �����) *�� ��� ��� ���� ������� �� ��� ��1 �������������) *�� ���������� �� ��� B����B���� "(#8 ������� ��� ����� ������� ���! H8� �#('%8$/$I H&�8$�4%&�44I �� H(� &(8/%/#"")

�������

� ��� � ��� � � ���� �� �� ��� ���� ���������� ������

F� ��� ���� ���� ����������� ��� �� ���� �� �������������� �� ��� CDBB ����� ���� ����� ���;������������ 9������������ .����� ��� ��������� ���6����������� �� ��� :������������� �+5�������������+5����������� �� �+5����������� �D������������)*���� �, ��� �������� ��� �� ���- ������ ���������������� �� ��� ������ � � ��������� �$"�) 5������������������ �� ����� ����� ����� ���+��+��� �������� �� �(� ��<; ��������+0������ ���� ��� ��� ��� ����� /"$"����+�,�� ������+��+������ ���������� ����� � ������� ����� ��� ��� ����������� ������ �(� ��<; ���+����� �� ������� �����������) *�� ���������� �� ���������� � ���������� �- ���������� ������� 9:;�*1 ����� ��� ��� ���� �� ��� ������ ����� ������������� �� �� ����� �� ��� ����� ������ ����� ����,�� � � �+�� � ��������� �� �4��4) *�� ������������� ����� ��� �������� ���� ��� �+�� � ��������� ������� ������� ����� ��� ���+��+��� ������� ������ ����� ������� �� ��������+0������ ����) =����� �� ������������ ��� ��� 9:;�* ���������- ����� ���- ������������ �� ��� ����� � � ��� ��� ������ �������I �����+���� ���- �� ��� ��� �4��4 ��������� �� ���� ���� ���4�& �� �4�" ��� ��� ���) B��� ����������� ���� ��� �- ������� 9:;�* � �� �� �� ��������,���������- ��� �(� ��<; �������� �� ����������� ������ � ����������� ��&�$#�) D,�������� ������������ �(� ��<; ������� ���� �,������ ���- 8'A �� ��������� ������ �� ���� ����������� ������) *��� ������+���� ��� � ������� ��� ���� ����������� ���� � ��� ��4)(8�%&)$8(� ���� � �� ��� ��������� ���+��+��� ������� �� �(� ��<; ��������+0������ ��-�����-)*� ���� ������ ������� �� ���� ����������� ���� ���+

� �����- ������� ��� ������� �� ����� �- ��������,��� ��� ��� ��� ��� ���7�� ��� �- �,����-�.�� �� 8�) .�� �� �, �� ��� ��-���� ��� ������� ���+������� ������ ���� �����- ������� �� ���� ������������������ � ����������- �����2��� �- 3���� *����� 4)4/I ��� � ���������- *��� ��) @������ ����,������- ���� �� �(� ��<; ���� ������� ����������- ������ ��� �, �� ����� �,������� � ������ �8#A �D������������ �� � � �� � "4A �9�������������� ��� ������ �� ���� ����������� ������ �.�� �� 8�) *���������������- �� �� ���� ���� ������ �������������� ���� �������� ���� �� ��������� ���� ��������

������ ���� �� ������ ����� ���� ��� �� �� ����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 5: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

���������

Gut Gut

BLAST 16S rRNA against NCBI Envsdatabase, searching for studies with hits at a >98% similarity threshold

Where was the genome isolated?

Gut/feces/ probiotic

Other

Gut Specialist Non-Pathogen (6)

Gut Specialist Pathogen (11)

Cosmopolitan Gut Non-Pathogen (20)

Cosmopolitan Gut Pathogen (23)

Non-Gut Non-Pathogen (67)

Non-Gut Pathogen

(55)

1

3

4 4 4

Genomes (a)

(b)

from KEGG

195 genomes

Only found in gut environments?

Gut Specialist (17 genomes)

Predominantly found in gut environments?

Predominantly found in non-gut environments?

Only found in non-gut environments?

Gut Cosmopolitan (43 genomes)

Non-Gut (122 genomes)

2

PathogenicityClassification by GOLD

PathogenicityClassification by GOLD

������ �� ���� ������ �� ������� �� ������� ��� �������������� �� � ������� ��� ��� ��������������� �������������� ���������� ����������� ������������� ��� ��� �������������� ����������������� ����������������� ��� ��� ���������������� � �������������� ������� �� ��� ! "" ��������#��� ��#������ �$%& ������� ������ '�� ������� #��� ����� �� �� ���#� ���� ()������� ��� )������* ������� ��� ������� ������������+��� ���,' #�� ���� �� ������� $- , �./� ��0������ ��� ���� ������ ������� ��� /�1 �2� �������� �� ��������� ��� ��2��������� �������������� ��� �������� ���� "������ #��� ����������3�� �� �4��������� �� ��� ����� ����� �� ����+ ������� ����� �4����2�� �� ��� �� ���� ������ #�������� (��� ���������*� ����� ����� �� ��2��� ������� �� ��� ���� ��� ��� �� ����� ��2��������� #��� ��������3�� �� (��� �����������*� #��� �������2�� ����� �� ��� ��� #��� ����� (�������*� ����� 1� ��������� ����� #���� ������� #��� ����� �� ��2��� ��2��������� ������ ��� ��� � ���

���� ������� ���� ����� � ����� ���� ��� ��� ��

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 6: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

������ ������� �� � �� ���� ��� ��� �� ������� � � ���� �� ������� � ������

������� ��������� �� ���� ��� ����� �������� �� �������

�� ����� � �� ������ �� �� ��� �������� �� ��� � ���� ��� ����� �� ��� ������� ������ ���� ������ ���� �� �������� �� ��� ��� �� ������� �� ��� � ����� ���� �������� � ��� �� ��� ���� ��� � ������ �������� �� �� �� ��� ��� � ���� ����������� ����� � !" ������� ������� ��� ������ ��� ��� ����� ��� ������ �� � �������� � �� ������� ���� ��#$%& � � �� '()* '��� +, ��� �� �� ,�����- ����� �� .����� �*� ������ ����� ���������� �� �� �� ����� ����� +�� ���� ���-� ����� ���� ���/����� ����� ����� �� �� �� ���� ����������� ���� � ����� +���������� �- �� ���� � ���� �� ����� �������� �� ���� �� �������� �� ���� ����������� ���� � �����+������-� ��� ���� ��� ������ ��� ����� ���� ������ ���������� ��� '()*�#��� ���� ���� �������� ��� ��� ���� ���� ������

��� �� ��� �� ��� ��� ���� ���� �������� � �������� ������ '.����� 0 *� �� � � ��� �� � �� �� ������ �� ����� ��� ������ ���� ����

������ ��� �� �������� �� ��� �� � � � ��� ��������1 � '�� 2�23� , ��� ��*� ���� �� ��� ���������� ���� ���� ��� '�� 3* ������� ���� � �� ���'��������� �� 4 ��� (*� &�������� �� ���� �������� ���� ���� ���� �� �������� �� ��� �� ������ � ��� � ��� '���� ����5 �(62�)(7 �������� �5�(62�)2*� �� ������ ���� ���� ��� ���� ��� ������'�(62�((*� ����� ���� ���������� � ����� ���� ��� � ��� ��� � � ��� �� ���������� ��� ������� � ��� � ��� ������� ������ ������ �� ���� ������� ��� � � ���� ������ ��� ����� ��� �������� �������� �� �� �� ������� ����� �������� ������� �� ���� ���� �� ���� �������4�� �� ���� �� ����� ��� �� ���� ���� '���� ������

� ���* ���� � � ������� '��� +, ��� �� �� ,�����-�����*� �������� ��� ��� �� � ������ ��� ������ ���� ������� �� ������� ����� � �� ����� �����&�������� �� ���� ������ ��� ���� ��� � ������������� �� ����� �� .������ ( �� 0 � 8������ ������ ���� ���� ������ ��� ���� ����� ���� ��� ���������� ������� � � ��� �������� �� ��������������� �� ���� ��� ������ �� ���� ������ ��� ��������� ���� ��� ���� � ��� ������� � ���� ��������� �����

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

Actinobacteria Bacteroidetes Firmicutes - Clostridia Firmicutes - Lactobacillales Proteobacteria - Delta Proteobacteria - Epsilon Proteobacteria - Gamma (Enterobacteria)

����� �� #��� ������ ��� �� �������� �� ��� ��� #��� ���� ������ ��� �� ������ ������ 9 � ���� ��������� :%"�4 ��� ����������� �� ������� � ��� ��� �������� ��� �� �2��2� 4�� �� ��� ��������� �� �� � ��� �� ������ �� �� �������� ����� �� �� ������������ �� ��������� �� ������� ���� �� /���� ������ � � ��� ������� ���� �� ���;� ������� #�����<������ ��� ������ ������������ �� ������ ������ 8��� ������ ������ ������� �� �� � �� ������ ����� �� ���������� �� �� � �� �� �� �� ����� � ������9 � ������ ���� ��������� �� �������� � ���������� �� �� ����� ����� ������ ���� �( � ���� ��� �������� � ���������� �� � � ��� ����5"���� ��� � �(62�()7 : ��������� �(62�=27 8������� � �(62�3=7 % �� ��� ���� �(62�=27 ��>����� ��� � �(62�0)7 ��>����� ��� �(62�?)7 ��>����� ��� �(62�(?�

.����� �� 8������������� �� �� � ������ ���� ��� ������ ��� ���� �� #$%& � � �� � � ���� � �������� ������ �� ������ ������ �� �������� � +���������� �- �� +������-� >������ � ��� � �� ���� ���� �� ���� �� � ��������� � � �� ���� �� ��� ���� �� � �� ���� @�� � �� +���������� �-� '��* .�� ���� ������� �� � � ����� ���� �������� �� � �������� ����� �� #$%& '(�* ��� ���� ��� +��������- ��+���� ��-� 8������ � ������� � ��� �� ���� ���������� ������� ���� �� �� � ����� ������ �� ��� � ������ "������ ���� �0 ������������ ��� ��� ������ ��� � � �������� �� ��A��� ��� ������ ���� ���� �� � � !" ������ ���� ���� ������� ���� �� � ������'�* 9� ���� ���� �� ��� ��� ��� ������� �� ������� �� ������� �� � � ��� ������ "������ ���� �� � �������5 +#-� �� ���� ����+#8- �������� � ������� �� �� ��� +!- ������� > ������ �� ������ +>- �� ����� ������ +!-�

���� ��� �������� ����� ��� ��� ��� �� ����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 7: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

�� ��������� ��� ��� � �� ������� ����� ���� �� �������������� ������� ����������� ����� � �� ��� ������� ��� ����������� ��������� �� ����� ����� ���������� ����� �� ������� ����� ���������� ��� ! � ����� �� �������� � ����������� �� ��� ����� �� ��� ������ ��"��� ��#$������ �� $������% �� ���� ��� ������� ��������� � ���� ���� ���������� ����� �� ������� ��������� ���� ������ ������� �� ��� ��� ���� ����� ������ ���

&��������� ������� ������ ���� ���� ���'�� ������(���� ��� �� ��� �������� ���� ��� ������ ����� �� ��� ���������� ���� ���������� ����� � �������� �� ��������� ���� )���� ���������� ����� � �(�������*+, �� ��� ���� � �� ��� ���������� ������������ ���� ������ ��� ��� ���� ������ �� �(������

���� -., �� ��� ���� � ������� ����� ���� ���������� �� ��� ���� ����� �� ���� /, �� ��� ���� ��� ����� ���� ��� ������� �� ��� ���� ������� ���������� ������ ��� ��������� ��� ����� ���� �� ���� ���� ����� ���� �� ��� ���������� ���� ���������� ����� � $�������� ���� �� ������� � ��� ����� �������� �� ��� ���������� ���� � ����� �������� ��� 0� � ����� ��� ������� ���� ����� - �� �� ���� ��������������� ��������� �1����������� ����� 1/������� ��� ��� ���� ����� ������ � �- �� + *+� �-���������������� �� ��� ����� �� ��� � ���� � �� ��� ������ � �� �(������ �� ���������� ����� � ��������������� ������ ���� �� ������ ����� ������� ������� ���� �� ��������� ��� �(����� ��� �������� ����� ����� ��� ������ � � ������� �� ��������� ����� ���� �������� ���� �� �� � ������� �� ��

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

(a) (b)

(c)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0 0.03 0.06 0.09 0.12 0.15 0.18 0.21 0.24 0.27 0.3

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary distance (binned)

Other Comparisons

Gut Cosmopolitan

Gut-Specialists

(d)

������ �� 2��� ���������� �� �������� � ���� 0���������� ������� ����������� ����� � �� ����� �� /* 1 �034 ������� � �� ��� ������ ���������� ��� ����� ����� ��� ��(�� ����� ����������� ������� �� �� ����� �� �� ������� ������������� ��� ���� �� ��� /*1 �034���� �� ��� ��(�� ����� ��� �� ���� �� ���� �� ��� "��� ��� ��� ��� �� ����� �� ��� �� ��� ��� ��� ���� 5641�7 �� ��� �������� ��'��� �� �� ! � ����� ���������� �������� ������� ��� ������ 8����� ������ �� ��������� ������� ��� ������ ��� �� ���� �� ��� ����������� ������ �� ��������� ������� ��� ������ ��� �� ���� ���������� ������� �� ��� �� �� ������� ����� �� ����� ��������� �� ��������� ������� �� ������ �� ���� 4������ �� � ������� �� ��� ���������� �� �(������ �� ���������� ����� �� �(����� �� ��������� ��� ������ �� ����� �� ��� ���������� � �� ����� � �� ���� ����� � �- 9 + :- ��� �� ��� ������; + :+ ��� �� �����������; �� + --��� ����� ��������� �� !�� �� �� ������� ����� ���� �� ���������� �� ��� ������ ����� ������� �� ��"��� �� #$������ �� $������%�� ���� ����� 2����������� ��������� ���� ������� �������� ��� ���� �� ������ ����� ���� �� �� ��� ��� ���� ����� ����� �'����������� ��� ����� �� ������ �� ��� ����� �� ������ ��� �� ���� ����� �'������ �� ����� ��� ����� �� ��� �� ��� ����� �� ���� ��������'����� ��� 2��� ������ ���������� �� ���� �� �������� � ���� ���� ������ ����� ����� )��� ���� �� ��� ����� �� �� ��������������� �� ���������� �� ���� ���� ������ �� � � ��� �� �������� ������ ���������� ����� � �� ����� ���� �� ��� ������ ����������<�- 9 + :/ �� ��� ������; + .: �� ����������; �� + =. ��� ����� ��������� ��� >��� �� ��� ��� �� � �� � �� ��� ������ ���� �� ������� ��+ +� ���� ��� ������������� ��� ���� �� ��� /*1 �034� �� ����� ������ �� ���������� 1�� ����� ������ ���� �� ���������� ��� ���� � ������������ ��� �� ��� ������� ����� ������ �� ��� ���������� � ����������� ����� �� ����� + +� ������������� ��� ���� ��� ������ � ������� ? ����� ��� ������� ������ ������� �+ +*�+ /: ������������� ��� ���� !���� ��� ���� � ������ �����

���� ������ ��� �������� ����� ���� ��� ��� ��

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 8: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

������ ���� � ������ �� ������������� ��������

��� ����������� ����� �� �!� ���� "#��#� �#� ���$�� ���� �����$���� ��

���� ��� ������� ���� �� ����� % �� � ��������� �� "� � $����� �� ������ ����� ������������� �������& "� ����� �#� ������ �� ����� %�'��� ��� ������(������ ��������� ��� �)�������� ��������� ����� ������ ����� �� �#�������$� �� �#� ���� ���� ������ %� & �� ������ �#� �)������ �� �#� �$������� �� ���� ������� ���"��� ���� ������� ������� "�� ��� ������ ��������� ����� � �� ������ ����� *� � � �� +������ �#� �)���� �� ������ �� �#� ��� #���� �� ���� �����$���� �$���� �#���������� �������& � �� ���� "#��#� �#�� �)����� "� �����,���& ������(������ ���������"�� ����� ���� ��������� �� ���% ������ ��������������-���� �� �#� ��� ./0 ������ % � !#�� �������$��� �#� ��� ��������� � ��� ������������������ #$� ���� ���� �����$���� �� �$�������� ������� ���"��� ���� � ���1 �������������-�����2�"�$�& � ������� �� ����% �� � ./0 ��������������� ���� ����#�� ������� ��� �� �#� � ������ ������������� ���� �& ��� ����������� ����� �� & ���������� ��� � �� #$� ���# ��"� ���� �����$�����#� �� ������ � ���� �������� !#�� ���� �3��������� ���#� ������������ �� $�� ������� ���� ���������� � ������ ���$������ �� ��#� ��$���������

��� ���� ��� �� ������ �� ��� ������ ��� �������� ����

������ �� ���#� ������������ "��#�� � ���"��� ������� ������� �� ����� ��� ��� �� �)���� ���������&"#��# ���� ��$� � �����#� ���� �#� ��������� ���#������ "#��# �� ���� �#�� "��#�� ��$�� #�����!� �����" �� �� �#�� +������� �� ���#� ������������& "���'� �'���� �#� ������ �� �� � ./0 ������� ��

�� ��� ���� ������� "��#�� ������ ��������!#�� ������ �� ���������� �� �"� ������ ����&������ ���� �� #������� ���� ����� � �����$� �� �� ��"� ���"��� ������� ���� ������� �%4 & �� ���#��� �'����� �#� �#� �#���������� ����� "��� #$� �������)��� �� ���� ������� "��#�� ������ �������� ����� ���#���# ������ ��+������� �� ���������� )� ���&����� �� �#������ ����� �#� �'����� �$������ �������� ������� �� � �� �'����� �#� ����$�� �� ��"���������� �� �#� ��������� � ��������� *� ��� ./0 ������ # ������ �)��� �� ���� �����$���� "��#�� ������� �������& �#�� �� "��� �� ������� �� ������ �������� �� ��#� ����� � � � �� �� �'����� ���������� ��"��

5$�� "#�� �'������ ���� �����$���� � ����� �#�������� �� �#� ���� �������� ��� �����) �� ������� ������� ��� � ./0 ������� ����" %6 �$������ &"� ���� �#� �� � ./0 ���� ������ �� � ��������� ���� �� ���� �����$����� 7��� �����$�������"��� ����� �� �#� ��� ������� ���� � �$�������� ������� ����#� ���% �������� � ������������� ������ ������ 8 � � � !#��� ������ � ���������� "��#�#��� �� 9��������� �� � !�� :� ��; & "#� ���� ��������#�� ���"��� �� � ./0 �$������& �$��� �����������& 0/* �� ��#������� ����� � </0�#��� ������ =�������� *� �����& �#��� ��� � �� �����$�� ����� ��� :��� ����������# ��� ./0& ��� �������� �;� �������� � � � ��� �#� >�& >8 � >� �������� �#�� ����� !#�� ����� �$��� �#� �$�� �#�� ��� ./0���� � �& ���# � �#��� �� ��� "��# �����+�������&� ������� "��# ������� �)������ ������ 8 � ?� �$���& ��������� ���� "��# �� � ./0 ���������"��� ����; � ���% ��� �#� ����� =��"� ����"��� �� ��� �46 ��"� �����$� ����� �� & ���$�����&���� ���� ��$���� �#� ��������� � �� ������"��#�� �#� �������� "#��� ����� ������� ����� ���#��������� ��������� ��� �;� �������� � � � ���

0

0.2

0.4

0.6

0.8

0 0.015 0.03 0.045 0.06

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance (Binned)

0

0.2

0.4

0.6

0.8

1

0 0.01 0.02 0.03 0.04 0.05 0.06

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

Full Length V2 (250 nt)

V4 (250 nt) V6 (250 nt)

(a) (b)

����� �� 7��� �� � ./0 �$������ ������� ���� �$������ �� ���� ������� "��#�� ������ �������� �� !��� ��������� ��� ���#� �#� ���������# �� � ./0 � �;� �������� � �����#�� �� ��� >�& >8 � >� ������� !#� $����� � ������� � �� �#� ������� ���� �& ����� �#� � ������������ ������� �,������ �� �4@6 ��� ./0 � ������� �!#�� ���� � "� ������� �� �������� �#� ������ �� � ./0 ������� ������ #�� ����� �� � ./0 ������ � ������� ��� ����������� ����� �� � !#� ������ �������� �#� �$�� "��#�� �#� ��� ������ �������& �#�$��� ���� �����$���� �� ������ �� ���� � �#���������� ������ �������� �� A������ �#� ������ ��� � �� ���� �� ����; �� � ./0������������� �� ���� ���"� +����,����� �� �#� �)���� �� �#���������� ������ �� ���� �����$����� A��= �� ������� $��� ���� ������$���� � ��$�� ������ "#�� ������� � ������� ����� �#� ����������# �� � ./0 ���� ��+�����& "#��� �������$��� ���#�� �� �� ����������� �����$���� "#�� ��������� ������ "��# ������� �� �#� >�& >8 � >� ������& �������$����

������� ��� ���� ���� ����� ���� ��� ��� �� ����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 9: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

��� �� �� �� ����� �� ���� �� ������� ��� �� �� ���������� � ��������� ������ ����������� ������ ���� ���� ������� ������ !�� �������� ������ �!� �!���� ����� ����� �!� �"�� �#$ ������� �������!���!����� %������� �!� ��� �������� ������ �!� ������ ���� �!��� �! "�&"'� ������ � �!� �� % �#$ �������� �� ������� (&��� �������� � ���� ��������)��� ������� �� ������� �!���� ������ �������� �� �!���� ������ �������� �� �!� ����� ����� *� �!���� �������� !� ����� �!�� ������� � ��+������ !�! � ��!������ �!�� �!� ���!�,�� � ��� ���-�� !�� ��,������ ������ ����� �- ������. ���!���! �!����� ��������������� �� �!� ����� �� ������ ����� ������� ������ �� ����� �- ������ �� ������ �! ������� ���� ������������� � ��� �!� ���� �!�� ���� ����������� -�� ����� �������� �� �� ��������

������� ��������� � ������� � ������

/������� ������ ��� -��,������ ���0��� �� !��1����������-��� /������ ������ ��������� �� �2���� �����)��� ������ �!�� ��� ��� ���������� �� ������ ������������� -�� �������� �-�� 3!� �4� ������ ��,������ �! �!� ������ ������� � �!� ������� �!�� ������� ��� ��� ���� ����������� ������ -��,�����������-����� ������ 5� ������� �!� ����� ������ �����! ����� �! �!� ������ ���� �- ����� �������� �!� �!������� ��� ������ �- ���! ��!�� ������� �!� ������� ������ '��� /��! ������� ���� �������������� �!� ����� �� ������ ���� ����������� -���!��������� ������� ��� ���������� ������� �������� 3!� �������� ��� ��� ����������� �-�����)����� ����� ��� �!��� ������� �� �������� �!��)����� �������� �!�� !��1����� ���� �����-�� ������� � ��� �� -��,���� �!�� �!������� ��� ���� ���)�������� ��� ��������� �� !�! ���� �!� ����� �-�!��������� ������� �� ������ ���� ����������� ������ ���� -�� ���! ������ ��� �!��������� *����������� � ������� -�� �6������� � ������� ����� �1�� �!����� ������� �- �!������� � ������������ ���

���������� �!�� �!�� �- ������ ���78��8 �!�������.��78�8� �������� %���������� ������ �2������ ������- �!� ������� � ���� ������� ������������ �!� �������)��� ��� ��� ����������� ������� ��� ���� ������� ���)�������� � ���� ����������� ���9���� -�� �!� ��2� � �!�������� ��� 8�8'� :����� ������ �2���� � ����� !����!� ����� �- ������ � ���� ���� ��� '. ���%����������� 3���� %4��;��� �!� ���������� �!�� �!� ����� �������� ���)

��� �- �!� ����� ��� �������� ���� �����������-�� !��1����� ���� �����-��� ��� !��1����� ���� �����-��� �!���!� �� �� � ������� ������� !����� ���������� � ������ !��!�� �!� �6��� �- ����������� ����������� ���� ����������� �������� � �������� �!����������� ������ �� ������� 3!� ������ �- ��� �������)��� ������ ������� �!� � ���� �6��� �- !����� ������ ������� �� �!�� �������� � �������� �!������������� '��� 3!�� �� �� �!��� �!��������� �������� ����������� ����������� � ������� -�� ��������� �!��!� ��� ���������� !����� �� ������ �!��������� ��)������ ���� ����������� � ����!��� ��������� �!�� �!���� ������� �- �!��� ����� ������1���� ��� ���� ���������������� �������� -�� �������� �!������� �� ������� �� ������� ��� ���)�������� ������ �!� �������� ���� �� � ���� ����� �- �2������ ��� ������� �!�������� ������ ��������� �! �!� �������� �������� -���!� -��� �!�������� *������ �!� �6��� �- !����� ������ ������� ����������� ���� �!��� �!��������� ��)������ ������� �� �� ���� ��� ������ � �������!�� � �������� �!������� ������ '���

��� ����� �� ������� ��������� � ��� ������������ � ���� �������� �� ����������

������� � ������ !��!�� �!� �6���� �- �!���� !�������!��������� ������� ��� ����� ������� ��� ���������� ������� ��� ���!����� ������� 5!�� ����� �!� ������ ��� ��� ���������� �!� ����������� �� � �������� ��� � ����� !��� ���� ��� �����������)������� ������� ������ ��� ��� ���!�����

0

0.2

0.4

0.6

0.8

1

0 0.1 0.2 0.3 0.4

Gen

e C

on

ten

t C

on

serv

atio

n

Evolutionary Distance

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00 0.03 0.06 0.09 0.12 0.15 0.18 0.21 0.24 0.27 0.33 0.30 0.36 Mea

n G

ene

Co

nte

nt

Co

nse

rvat

ion

Evolutionary Distance (Binned)

(a) (b)

������ �� ;��� ����������� � ������ ����� �� ���)������� �������� ��� ;��� ����������� � �������� �!������� ���� �,������ �� ����������� �,������� <����� �!� ���! �� �� ������� ���� ����������� �!�� �������� �!�������� ���� �� ���� �� �2������ ���� -��,�������0������ �2�!����� � ��=�� ��������!� ��� ��� ����������� ������� ��� ���� ����������� ���78��8 ������. �

�78�8� ����������� <����� ����� �� �������� � !�� ����� �� ���������� ����� ����� ������� ���� �� !��� !�!�� ���� ����������� �� ����������� ����������� ��� 8�8" ��� 8��� �� % �#$ ����������� ��� ��� �!�� �!��� ����� �� ���)��� ������� �����= ������ 3!��� ������ ���� �2!�� ��=����������� ���� ����������� �� �������� ����� 8�84 ����������� ��� ����

���� ������ ��� �������� ����� ���� ��� ��� ��

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 10: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

������� � ���� �� ��������� ������� ��� �� � �������������� �� ���� ������������ �� ����� ������ ��������������������� �������� �� ������� ���� ��� ���� ������������� ���� ���� �� ����� ��� ���� �� �� �������������� ���� �� �� �� ���� ���� �������� �� ��� ��

����������

���� ����� ������� ���� ����������� ���� �� ��� ����� ���� �� ���� ������� �� � ����� ������������ ������������ ������� ���� ��� ����� �� �� ���������� �� ����� ���� �� ��������� ���������� ���� �������� ������� ��������� �� ���� ������� ������ ��� ��� ������� ��������� ����� ���� � ���� ����� �� ������������ ����������!������� ����� �������������� �� ����� ������������ ���������� ����� �� ������� ������ ��� �� � �������� ��������� ���� � ������� �� ��� � ����� ���� ��� �����"���������� ���� ���� � ������� ��� ���� ��������� ��� ���� ������ ��������� #� $ �%&' �� ������ �#(�()� ��� ����������� ������ ���� ������ �� ���������� ���� �������� �(#�(*���� ������ ����� ���� ��� ������ �� �������������� � ��� �� ����� ��������� ���� �� ������������� ������� ��������� ����� �������� ���� ��� �� ����������� ��� +,-' �����.//����0����������/������ �

/+,-'/ ���� ���������������� ������ ���� �� �1� ��� ����� ���� ������� ���������� ������� ��������� ������� ����� � �������� �� ��� ������ ��� ������������ ���� �������������� ������� ������� � ���� �� ��������� �� �������� ���� ����� ���� ���������� ���������� 2����� ���� ���� ������������ ������ �����������

������� �� ������� ���� ���� ����� ������������ ����������� �������� �� ������� ��������� �������� ���� ���� �������2����� ��� ���������� �������� �� ������ �� ��� ��� �(3���� ������� ���� ������������ �� ����� ����������� ���������� ���� ���� �������� ���� �� �������� �1�������� ����� ������� ���� ���� �� ���� ���������� ���2����� ������ � ����� ������� ������� �������� ����� ������� ������� �� ��� ����������� ������� ��� ������� �� ��� �������� ��4������ � ��� ������ ��������� ���������� ����� � ���� �� ��� ���� ���� �������������� �� ���������������� � ��� ����������� �� ���� �������� ����������� ����� �� �� ���� ���������� ����������� �� ����� �� ���� �� �������� � ������� �� ������� �((�' ������ �� ������� �� ������� ������ *5 ���

������� �� ������� ����������� ��� � �������� ��� � ��������� �� ��� ������ �� ����� ����� �� ����� �� ��������� �������� �� ������������� �� �� ����� ��������� �(6�7� ����� �� ��� ����������� �� �������� �� ��� ��� ��� ��

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00 0.03 0.06 0.09 0.12 0.15 0.18 0.21 0.24 0.27

Evolutionary Distance (Binned)

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00 0.03 0.06 0.09 0.12 0.15 0.18 Evolutionary Distance (Binned)

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00 0.03 0.06 0.09 0.12 0.15 0.18 Evolutionary Distance (Binned)

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

0.90

1.00

0.00 0.03 0.06 0.09 0.12 0.15 0.18 0.21 0.24 0.27 Evolutionary Distance (Binned)

(a) (b)

(c) (d)

Mea

n G

ene

Co

nte

nt

Co

nse

rvat

ion

Mea

n G

ene

Co

nte

nt

Co

nse

rvat

ion

Mea

n G

ene

Co

nte

nt

Co

nse

rvat

ion

Mea

n G

ene

Co

nte

nt

Co

nse

rvat

ion

������ �� +�� ���������� ��"� ��� �� ������� �1���� �������� �������� �� ���� ������� ������������ ��� ������� ���� ��� ,��� ����� �������������� ������ �� ���� ������� ������������� ����� �� ������ �� )�)3 #� $ �%&' ������������ ��� ����� 8����� ��� �� �������� ������ ����� ��������� ������� ��� ����� �� ���"� ����� �� ��� ��� �������� ������� �� ���� ��� ����� �� ��� ����������� �� ������ � +��� ������������ ���������������� ��������� �� ������� ������ ����� �� ��� ���� ����������� � '� �� ��� �� ������� ���� �� �������� ������ ����� �� ���� �� ����� �� � ���� ��������� �� '� �� ��� �� ��� ���������� �������� �� '� �� �� �� ��� ���������� ,���� ��� ������ ��� �������� ����� �� ��� ����

������� ���� ����� � ����� ���� ��� ��� �� ����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 11: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

������� ������� �������� ����� ������� � ���� �� ����������� ��� �� ������� �� ���� ��������� ��� ������������� ����� ���� �������� � ��� ����������� �� ���� ��� ��� �� � � ����� ���� � �� ��� ���������������� ��� ��� � ���� ��� �� ��������� ����������� ������ ������ �� ����� ����� ���� � �� ���� ������ �� ��������� �� ��� �� ���� ��� ��� ��������� � �� �� ����� ������ ����� ����� �� ���������� ������ ��� ���� ��� �� ��� ��������� �������������

� !�� �� ������� �� ������ � �� ������� �� ���� ���� ��� � ���� ������� ���������� ���� ������ �� ��� �� ��� ���� �� � �� � ��� ��� ��������� ��������� "� �� � ���� � ����� �� ����� ��� �� ������ ���������� ������� ��� ��� ��� �� ������� ��� �� ���� ������������ �� ��� � ����� ���������� �� ���� ��� � ����� ��� � ��� �� �������� �� ���������� ����������� ��� ���� ������ ���� � ������� ��� � � ������������� #�� ��� ����� ����� �� ����� ��� ��� ����������� � ������� ����������� ���������� ��� ������ ������ ����� ��� �� � �� ������ ��� �� �� ����������� �� ���� ���������� ��� ���� �� � � ����� �������� � ���� ���� ������� �� ������ �� �� ������� � $�� � #����� ��� ���� %����� &�������'$#%& ()*+, �� $�� � #����� ��� ���� �-�������� � &������� ($#-.&/ ����0��� ��� ����������� � �!���1�!����� ����$#-.&+ "�� ����� ���� �� � � �� ��� � � ��� �� ��� ���� ����� � ������� ��� �2���� �� ��������� � � �� ��� �� ��������������� �� �������

����������� ��

&��������� �� 3 � �� � ��� � .�4 5����

��������������

"�� ������ ����� �!� �� �� �! 6���� 7������!�-�� ���� 8�������� "��� 9 ������ 3 ��� $�3�� �� ��& � . !���� ��� ������� �������� �� ��� � ������� 6 : ����� ��� �!� �� �� �! �� �� ��� ��� � ;;%�����3 � � ���0 $��� �� $ � ������<<� $83= >*?@������ ��� � ���� � � �� ��� � �� �� ���A���� ������� �� ��� ����� �� �������

�������

. ��� � #�������� �� B� ��� ��������� � �� ��� (�� ��"C? %$DEF>G �� 6 : +/ . ��� � #�������� �� B� ���(�� �� ������� HD@37DFE**G� 4D@B%DD)EF?+/ 8����<� �� 8���� I���� ��� �� ����� �� B�� �� B�����$��� � #������� (BB$#+ I����� ��� ���� ������� ���0 . ��� � #�������� �� B� ���/ BB$#

������� �� ����� ���� �� .��� ���� ���

����� ��

@ "���� ����H 6 � J���4 - � B � ���$ � I� ����J������8 $ �7�����4 �� %������6 # (?DDF+ "�� ��� � �����������A��� ����� ���� ED)KE@D

? H ���. 4 (@GGF+ � ������� � �� �� ����� � ������ �� ����������� ������ ���� FC)KF)D

C #� ���. � 7�� �7 � B ��� � �$ � 5� � �& �� $� � �"

(@GEG+ -������ �� ��� ������ �� ��� �� ���� � ��� ���� � �� ��! ������ ������� ���� ����������� ����� �� ����� �������� ���� ���� ����� ���� ���� ��� GC>>KGC>G

) 9�����8 4 (?DDD+ #���������� ��� ����� � ����������� ����

���� ���� ����� ���� ���� ��� ECG?KECG* > 9�����8 4 (@GEF+ = ���� � ������� ��������� ���� ���

??@K?F@ * 5�����% 6 �� 9�����8 4 (@GGC+ 4����� � 4.�0 !�� ��

��������� ����� ��� �� @@CK@?C F 3��������9 I �� =�����6 4 (@GG)+ "����� ����� ���

���������� �� ��� ����� � ���� ���� ���� ����� ���� ���� ���*F?@K*F?E

E J���4 - � J��������8 � � B � ���$ � 7�����4 ��%������6 # (?DDE+ 9����� ���� ������0 ������� �� ��������� �� ��� ������� ���� ��� ���������� �� FF*KFEE

G J���4 - � "���� ����H 6 � 7����& �� %������6 # (?DD*+$���� � �������0 ��� � ��� ������� ���� ��� ��� ������

����� ���� @D??K@D?C @D "���� ����H 6 � B � ���$ � L ������!��" � 8 �� ����= J �

3��� ��� � J���4 - � &����$ J � 6�����9 6 � 4���= � ��2������6 H � �� (?DDE+ � ���� ��� �������� � ����� ��

�� � ���� ����� ���� )EDK) @@ I� �!�3 . � &� �� ���� J � I���� ��4 � � =����!���- 8 �

B �� ��. �� H ���. 4 (?DDF+ $������ ��������������� � ����� ��� �� ����� � �������� �� � ���� � ��� �

�M �� ���� ����� ��� ��� ���� ���� ����� ���� ���� ���@CFEDK@CFE>

@? 3����������J � B����& � &����$ J �� 4��� ��3 � (?DDE+"�� ��� �� �2���� �� � ������ �� ��� ��� � ���������� � � ��� ��� �� ���� @*& �4.� ���������

���� ������ �� �?ED @C J�$ � 9 ���= � :� ���$ � 4 �� � ����$ � 9 ���& � :����B �

:� ���L � &����6 � H ���N � 9��B � �� (?DDE+ &������ ���������� ����� �� ��� � ��� ���� ���������� ���� ����

����� ���� ���� ��� ?@@FK?@?? @) 7���� ������7 " �� "��A��6 $ (?DDF+ H��! ����� � ������

�� ��������� � ��� ������ �� 0 � �������� �� �� �������

�� � ��� !��� ���������� �� >D)K>DG @> 7���� ������7 " �� "��A��6 $ (?DD>+ %����� ������ �� �

� ��� ��� ������ ������� ��� ���! ������ ���� ���� ��������� ���� ��� ?>*FK?>F?

@* 9�����4 � � =��� ���O � H���!����% C��� 4�������H � 4������H �4 �!��3 � =��!����- J � J���& 4 � =������ � B �!����6 � �� (?DD?+ -������ ��� � ��������� ��� ��� �� ��� ��������

������ �������� �� ���� ������� -������� ���

���� ���� ����� ���� ���� ��� @FD?DK@FD?) @F %����� ���B � J���= � %� �4 � H��������7 H � &��� �� ���4 �

L � �! �L � 7� ���8 � &���� ���& � $�����" I � ����� ��$ � �� (?DD>+ % � �� ���� �� ������� ����� ����� ��� ��������� B����� ���� ����� ���� "���� �� �)C

@E &��� �� ��& � H ��N � &���!� ����7 - � 8�������. 3 �7��������= . � 9��� ��" & �� $������6 $ (@GGF+ 4���������������� � ���� ����������� � ��� $���� ������ ������������������ ��� ��� ������� ��� ������ ���� � ������ ���

���� ���� ����� ���� ���� ��� GE*GKGEF) @G ����� ��$ � $������% � :���H � 9����" � 3����# � 7�����!�= �

O������� 6 � 9 �����3 $ � ���������8 6 � - ����� ��9 4 � �� (?DD)+ $���������� �� ������ �� ��� �� ��� � ������ L����

����� ���� ���� ����� ���� ���� ��� @FECFK@FE)? ?D $�� ��. � (?DD?+ $���� � ��� ���0 ������ �������� �

� ���� � � ������� ���� ��� >ECK>E* ?@ ����������& % �� 7��� ���8 % (@GGE+ 4������ ������� ��

������� ������� #��� ���������� �� ?*CK?*E ?? & ��������= �� ����������& % (?DD>+ %����� �������� � ���

��� �H������ ���� ��� !��� ���������� �� >FGK>E> ?C I�!����& � L��������7 � 9 ! � � �$ � $�������$ ��

.��! � �7 (?DDC+ P���� ��� �� ��������� �� �������

� � ������ � ���� �� ���� ������ ��� C)FKC>F ?) H ���& � = ��& 7 � 3 ��& � B ����- " �� 3��� �8 (?DDE+

$������ � ��� ���� �� ������ ��� � �� ���0 ������ ����

���� ������ ����� ����$% &'('% )��� *+% ��� (&

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from

Page 12: Ribosomal RNA diversity predicts genome diversity in gut ... · Ribosomal RNA diversity predicts genome diversity in gut bacteria and their relatives ... Gordon, Jeffrey I.; and Knight,

������ ��� ������ ������ �� �� ������ � � ��������������� ����� �� ����

��� ���� ��������� �� � ! ������ � "��� ����� �� � #�� ����� �� ���� � ��� �� �� ����$ �� �� � ��� �%�&�% �

�'� "����������(�� )�������*��(�� +���� ,���+���� -����.��/��0���� 1������1�2�� "�*��)�� "����3 �4�2� ��������+�5� �� 6! 7������ � ����� �� �� ����� �� � ��� 3������ *� � �� �� �� 8 �� ����� �� ���� �� � ��� ������ ��� 6 ��&6 �'�

��� "����������(�� 8���������4�� 9 ��� ������ /� ������"�:��2*������"�� )�����������"�� :�������:��� ��� +���� ,���+�������%! "���� �� ���� � � �� 8 �� ����� � ���#��������� *� � ��� � ;��� � �� � ����� �� � ��� ���� ���� ����� ��� �<�<&�<6<�

�6� 5 �� ���1�� 4�*��� ��1�� 9�*����� ��=� ��� 1�� ����=�)�����6! 9�� ������� -� 5 �� +��3��� ��-5+! � ����> ������ ����� � ��� �������� � ��?��� ��� �� ����� ���������� ������� ���� ���� ��� +%��&+%� �

� � 1� ������ 4�@#����7�� A � ������2�� )�����:�� )�������:����������A�)�� �����4�� �������4�� 5 ��������� 5 ��B� � ��������! 7�)����> � ���� �� ��� �� ����� ��� ��C������������ ����� �� �����

<�� 2�������"�8�� � ���/�� 4 ����/�� 4������/� ��� 5 �����+�:��� �! A�� � ����� �� ����� ����� ���� � ��� ����� ����%�<&%���

<�� )������9� ��� (��������7� ����<! .������� � �������� �3�#��� ��� ��� �'" 3������ �=2 ������ � ��C������3��� �� �������� ���� ��������� �� � ���� %�&% �

<�� +�"�� ��9�B� :� ��������,�7�� 1�����1�� A�� ����5��5�����=�� 7 �����D�4�� 7������ ��� 2���������5� ����'!=2"9> � ��� ��� ��C����� �� ����� ��*� �� ������ *������� � �� �'" �=2 ������ ������� ���� ���� ��� /< %&/< �

<<� 5����+�:� �� �! �'"E�<" �=2 ��C���� ��� .� "����3��������� ���������#�4� ����!� ������� ��� ������ ��� �� ��� ������!� ��� ���� / ���� =�# D���

<%� +�"�� ��9�B�� ��������,�7�� 5�����=�� ��?���4�� A�� ����5��1�����1�� ��3��9�� +���* �+�� ���7�� 2���������5� � ��� ����'!���������� � �� ���F������� �'" �=2 ���� ���3��� ���#��3���� ����� 3�� # � 2�A� ""� ������� ���������� ����' &�����

<�� "��������5�� �*����:� ��� 8����:�2� ����'! )�����> � ��� �������� �� �� ���@�� �� ��3� ?� � ��� �����#���� ���� ���

�6�<&�6�%�<'� 5 ��B�� +�"�� ��9�B�� 2���������5� ��� 1� ����� ����6!

2����� �@����� ��� ������ ��� �'" �=2 ��C������

������� 3� � ���� ������� �����C������� ������� ���� ������� �����

<�� A�������8�� 5�������� "�����3���:�5�� 7������+�2� ���������:�.� �����! ���F3��� �� ����� �� � �� �����

��� ��� �������� �� � ��&� ���<6� 9�������:� �����! �*��� �� �� ���� ��� �����*� �� �

��������� ������ ����� �� ��"�2�)������< � 9������)�4� ��� = ������1�4� �����! 4����� ��� ��� ���

3� �� �� �� ,���� ���� ����� 3�#��� 3��� ��

�� ��� ���������� �� ���&����%�� :�������� ��� -*������:� ����%! ������ ��� � �� G����� ��

� ��� *�� �> ��� ��� �'" �=2 ���� ��C������ ��� 3� ����� � 3��� � # � � ���� � *���� ������� ��� ������� ���� ���""� ������� ���������� � %6<�&%6< �

%�� =�������D�� .���9�� 4�������� ��� ��?�3� �9� ����%! A ����3 ���� ��� ���� ��� �� �� ,������ ������� ����� �

������ � �������� �� ���� � ��� �'�&�''�%�� +��� ���/�8� �� ! 7�������� � ����� G�� �� ��� �� �� *����

��� �������� ���� ���%&��� �%<� �����:�5�� A��������A�:� ��� /� ������:� ����6!

4 ��3 �� 3 ���������> ��� �@����� � � �� �������� �����< &��%<�

%%� 9��3�����7�:�� �������4�� D���������9�� )������A�5��

+������2�� 5�������� "�� ��4�5�� :�����/�:�� ����A�2��2;�� �:�7� � ��� ���� ! 2 ��� �� � ��3 ��� � �3��� ���

���� # ��� �� ���� ��� %6�&%6%�%�� )���������1�� 5��3��)�5�� �������4�� 8 ���=�� ������:�.�

��� 1� ����� ���� ! A��� �� ������ � *� � �� � �����

3��� ��3 �� ����� ����� ��� ��� �������� ���� �' %&��%'� 8 ����+�� �� ����� ����9�� 4� ����=�� "�������:�� "���7��

9����*��9�� 9�������=�� 2�����4�:�� 2�� ��� �"�(� � ��� ����6!9�� � � ��� ����� �� �3�� � ������ ��C����� �4.�"!

���� G�� ��� �� ��� ������� ��� �%�&�%��

������� ���� ��������$ %&'&$ (�� )*$ �� '% ����

at Washington U

niversity School of M

edicine Library on July 27, 2011nar.oxfordjournals.org

Dow

nloaded from