banner

Blog

Aug 02, 2023

Der Genomgehalt sagt die Kohlenstoffabbaupräferenzen heterotropher Bakterien voraus

Nature Microbiology (2023)Diesen Artikel zitieren

5 Altmetrisch

Details zu den Metriken

Heterotrophe Bakterien – Bakterien, die organische Kohlenstoffquellen nutzen – sind taxonomisch und funktionell in den verschiedenen Umgebungen unterschiedlich. Aufgrund der großen Anzahl von Metaboliten, die als potenzielle Kohlenstoff- und Energiequellen für Heterotrophe dienen könnten, ist es eine Herausforderung, Stoffwechselinteraktionen und Nischen innerhalb mikrobieller Gemeinschaften abzubilden. Ob ihre Stoffwechselnischen anhand allgemeiner Prinzipien, wie beispielsweise einer kleinen Anzahl vereinfachter Stoffwechselkategorien, verstanden werden können, ist unklar. Hier führen wir ein Hochdurchsatz-Stoffwechselprofil von 186 marinen heterotrophen Bakterienstämmen durch, die in Medien kultiviert werden, die eines von 135 Kohlenstoffsubstraten enthalten, um Wachstumsraten, Verzögerungszeiten und Erträge zu bestimmen. Wir zeigen, dass die katabolen Nischen heterotropher Bakterien trotz hoher Variabilität auf allen Ebenen der Taxonomie anhand ihrer Präferenz für entweder glykolytische (Zucker) oder glukoneogene (Aminosäuren und organische Säuren) Kohlenstoffquellen verstanden werden können. Diese Präferenz wird durch die Gesamtzahl der Gene kodiert, die in Pfaden gefunden werden, die in die beiden Arten der Kohlenstoffnutzung einfließen, und kann mithilfe eines einfachen linearen Modells auf der Grundlage der Genzahlen vorhergesagt werden. Dies ermöglicht grobkörnige Beschreibungen mikrobieller Gemeinschaften im Hinblick auf die vorherrschenden Arten des Kohlenstoffkatabolismus. Die Zucker-Säure-Präferenz hängt auch mit dem genomischen GC-Gehalt und damit mit dem Kohlenstoff-Stickstoff-Bedarf ihres kodierten Proteoms zusammen. Unsere Arbeit zeigt, wie die Evolution bakterieller Genome durch grundlegende Einschränkungen im Stoffwechsel strukturiert ist.

Dies ist eine Vorschau der Abonnementinhalte, Zugriff über Ihre Institution

Greifen Sie auf Nature und 54 weitere Nature Portfolio-Zeitschriften zu

Holen Sie sich Nature+, unser preisgünstigstes Online-Zugangsabonnement

29,99 $ / 30 Tage

jederzeit kündigen

Abonnieren Sie diese Zeitschrift

Erhalten Sie 12 digitale Ausgaben und Online-Zugriff auf Artikel

119,00 $ pro Jahr

nur 9,92 $ pro Ausgabe

Leihen oder kaufen Sie diesen Artikel

Die Preise variieren je nach Artikeltyp

ab 1,95 $

bis 39,95 $

Die Preise können örtlicher Steuern unterliegen, die beim Bezahlvorgang berechnet werden

Alle Wachstums- und Genomdaten sind unter https://doi.org/10.17632/xfh8t8568g.1 verfügbar. Alle Isolate sind auf Anfrage entweder bei MG (Europa) oder OXC (USA) erhältlich. Alle Genomassemblierungen sind unter den BioProjects PRJNA319196 und PRJNA478695 verfügbar, mit Ausnahme der Stämme 1A06 (PRJNA318805), 12B01 (PRJNA13568), 13B01 (PRJNA318805), DSS-3 (BioSample SAMN02604003) sowie AS40, AS56, AS88 und AS94 (PRJNA996876 ). Quelldaten werden mit diesem Dokument bereitgestellt.

Der gesamte zur Reproduktion der Zahlen erforderliche Code ist unter https://doi.org/10.17632/xfh8t8568g.1 verfügbar.

Huttenhower, C. et al. Struktur, Funktion und Vielfalt des gesunden menschlichen Mikrobioms. Natur 486, 207–214 (2012).

Artikel CAS Google Scholar

Thompson, LR et al. Ein gemeinschaftlicher Katalog enthüllt die multiskalige mikrobielle Vielfalt der Erde. Natur 551, 457–463 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Sunagawa, S. et al. Struktur und Funktion des globalen Ozeanmikrobioms. Wissenschaft 348, 1261359 (2015).

Artikel PubMed Google Scholar

Pontrelli, S. et al. Metabolische Kreuzfütterung strukturiert den Aufbau polysaccharidabbauender Gemeinschaften. Wissenschaft. Adv. 8, eabk3076 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Gralka, M., Szabo, R., Stocker, R. & Cordero, OX Trophische Interaktionen und die Treiber der mikrobiellen Gemeinschaft. Curr. Biol. 30, R1176–R1188 (2020).

Artikel CAS PubMed Google Scholar

Pollak, S. et al. Nutzung öffentlicher Güter in natürlichen Bakterioplanktongemeinschaften. Wissenschaft. Adv. 7, eabi4717 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Moran, MA Das globale Mikrobiom der Ozeane. Wissenschaft 350, aac8455 (2015).

Artikel PubMed Google Scholar

Datta, MS, Sliwerska, E., Gore, J., Polz, MF & Cordero, OX Mikrobielle Wechselwirkungen führen zu schnellen mikroskaligen Abfolgen auf Modell-Meerespartikeln. Nat. Komm. 7, 11965 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Enke, TN et al. Modularer Aufbau polysaccharidabbauender mariner Mikrobengemeinschaften. Curr. Biol. 29, 1528–1535 (2019).

Artikel CAS PubMed Google Scholar

Fahimipour, AK & Gross, T. Kartierung des bakteriellen Stoffwechselnischenraums. Nat. Komm. 11, 4887 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Kehe, J. et al. Positive Wechselwirkungen sind bei kultivierbaren Bakterien häufig. Wissenschaft. Adv. 7, eabi7159 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Kirchman, DL Die Ökologie von Cytophaga-Flavobakterien in aquatischen Umgebungen. FEMS Mikrobiol. Ökologisch. 39, 91–100 (2002).

CAS PubMed Google Scholar

Buchan, A., LeCleir, GR, Gulvik, CA & González, JM Master-Recycler: Merkmale und Funktionen von Bakterien, die mit Phytoplanktonblüten verbunden sind. Nat. Rev. Microbiol. 12, 686–698 (2014).

Artikel CAS PubMed Google Scholar

Machado, D., Andrejev, S., Tramontano, M. & Patil, KR Schnelle automatisierte Rekonstruktion von Stoffwechselmodellen im Genommaßstab für mikrobielle Arten und Gemeinschaften. Nukleinsäuren Res. 46, 7542–7553 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Barberán, A., Caceres Velazquez, H., Jones, S. & Fierer, N. Versteckt im Verborgenen: Durchsuchen von Aufzeichnungen über Bakterienarten nach Informationen über phänotypische Merkmale. mSphere 2, e00237-17 (2017).

Artikel PubMed PubMed Central Google Scholar

Mende, DR et al. ProGenomes2: eine verbesserte Datenbank für genaue und konsistente Habitat-, taxonomische und funktionelle Annotationen prokaryotischer Genome. Nukleinsäuren Res. 48, D621–D625 (2020).

CAS PubMed Google Scholar

Sueoka, N. Korrelation zwischen der Basenzusammensetzung von Desoxyribonukleinsäure und der Aminosäurezusammensetzung von Protein. Proz. Natl Acad. Wissenschaft. USA 47, 1141–1149 (1961).

Artikel CAS PubMed PubMed Central Google Scholar

Hellweger, FL, Huang, Y. & Luo, H. Die Kohlenstoffbegrenzung treibt die Entwicklung des GC-Gehalts eines Meeresbakteriums in einem individuenbasierten Modell im Genommaßstab voran. ISME J. 12, 1180–1187 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Shenhav, L. & Zeevi, D. Ressourcenschonung manifestiert sich im genetischen Code. Wissenschaft 370, 683–687 (2020).

Artikel CAS PubMed Google Scholar

Mende, DR et al. Umweltfaktoren einer mikrobiellen genomischen Übergangszone im Inneren des Ozeans. Nat. Mikrobiol. 2, 1367–1373 (2017).

Artikel CAS PubMed Google Scholar

Musto, H. et al. Genomischer GC-Spiegel, optimale Wachstumstemperatur und Genomgröße in Prokaryoten. Biochem. Biophys. Res. Komm. 347, 1–3 (2006).

Artikel CAS PubMed Google Scholar

Estrela, S. et al. Funktionelle Attraktoren beim Aufbau mikrobieller Gemeinschaften. Zellsystem 13, 29–42 (2022).

Artikel CAS PubMed Google Scholar

Amarnath, K. et al. Stressinduzierter Stoffwechselaustausch zwischen komplementären Bakterientypen liegt einem dynamischen Mechanismus der Stressresistenz zwischen den Arten zugrunde. Nat. Komm. 14, 3165 (2023).

Artikel CAS PubMed PubMed Central Google Scholar

Estrela, S., Diaz-Colunga, J., Vila, JC, Sanchez-Gorostiaga, A. und Sanchez, A. Vielfalt erzeugt Vielfalt durch mikrobielle Nischenkonstruktion. Vorabdruck bei bioRxiv https://doi.org/10.1101/2022.02.13.480281 (2022).

Schink, SJ et al. Die Spezialisierung auf Glykolyse/Glukoneogenese bei Mikroben wird durch biochemische Einschränkungen der Flusserkennung vorangetrieben. Mol. Syst. Biol. 18, e10704 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Basan, M. et al. Ein universeller Kompromiss zwischen Wachstum und Verzögerung in schwankenden Umgebungen. Natur 584, 470–474 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Plucain, J. et al. Epistase und Allelspezifität bei der Entstehung eines stabilen Polymorphismus in Escherichia coli. Wissenschaft 343, 160–164 (2014).

Artikel Google Scholar

Blount, ZD, Borland, CZ & Lenski, RE Historische Kontingenz und die Entwicklung einer Schlüsselinnovation in einer experimentellen Population von Escherichia coli. Proz. Natl Acad. Wissenschaft. USA 105, 7899–7906 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Le Gac, M., Plucain, J., Hindré, T., Lenski, RE & Schneider, D. Ökologische und evolutionäre Dynamik koexistierender Abstammungslinien während eines Langzeitexperiments mit Escherichia coli. Proz. Natl Acad. Wissenschaft. USA 109, 9487–9492 (2012).

Artikel PubMed PubMed Central Google Scholar

Hershberg, R. & Petrov, DA Beweis dafür, dass Mutationen bei Bakterien allgemein auf AT ausgerichtet sind. PLoS Genet. 6, e1001115 (2010).

Artikel PubMed PubMed Central Google Scholar

Ely, B. Der genomische GC-Gehalt sinkt in den meisten Bakteriengenomen. PLoS ONE 16, e0244163 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Maddamsetti, R. & Grant, NA Divergente Entwicklung von Mutationsraten und Verzerrungen im Langzeit-Evolutionsexperiment mit Escherichia coli. Genombiol. Entwicklung 12, 1591–1603 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Yakovchuk, P., Protozanova, E. & Frank-Kamenetskii, MD Beiträge von Basenstapelung und Basenpaarung zur thermischen Stabilität der DNA-Doppelhelix. Nukleinsäuren Res. 34, 564–574 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Lassalle, F. et al. Entwicklung des GC-Gehalts in Bakteriengenomen: Die Hypothese der voreingenommenen Genkonvertierung erweitert sich. PLoS Genet. 11, e1004941 (2015).

Artikel PubMed PubMed Central Google Scholar

Shenhav, L. & Zeevi, D. Ressourcenschonung manifestiert sich im genetischen Code. Wissenschaft 370, 683–687 (2020).

Artikel CAS PubMed Google Scholar

Smriga, S., Ciccarese, D. & Babbin, AR Denitrifizierende Bakterien reagieren auf Mikrogradienten in Partikelmatrizen und formen diese. Komm. Biol. 4, 570 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Gowda, K., Ping, D., Mani, M. & Kuehn, S. Die Genomstruktur sagt die Metabolitendynamik in mikrobiellen Gemeinschaften voraus. Zelle 185, 530–546 (2022).

Artikel CAS PubMed Google Scholar

Moran, MA et al. Genomsequenz von Silicibacter pomeroyi zeigt Anpassungen an die Meeresumwelt. Natur 432, 910–913 (2004).

Artikel CAS PubMed Google Scholar

Ben-Haim, Y. et al. Vibrio coralliilyticus sp. nov., ein temperaturabhängiger Erreger der Koralle Pocillopora damicornis. Int. J. Syst. Entwicklung Mikrobiol. 53, 309–315 (2003).

Artikel CAS PubMed Google Scholar

Hehemann, JH et al. Adaptive Strahlung durch Wellen des Gentransfers führt zu einer feinskaligen Ressourcenaufteilung in Meeresmikroben. Nat. Komm. 7, 12860 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Bankevich, A. et al. SPAdes: ein neuer Genomassemblierungsalgorithmus und seine Anwendungen für die Einzelzellsequenzierung. J. Comput. Biol. 19, 455–477 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM: Bewertung der Qualität mikrobieller Genome, die aus Isolaten, Einzelzellen und Metagenomen gewonnen wurden. Genomres. 25, 1043–1055 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Hyatt, D. et al. Prodigal: prokaryotische Generkennung und Identifizierung der Translationsinitiationsstelle. BMC Bioinform. 11, 119 (2010).

Artikel Google Scholar

Huerta-Cepas, J. et al. EGGNOG 4.5: ein hierarchisches Orthologie-Framework mit verbesserten funktionalen Annotationen für eukaryotische, prokaryotische und virale Sequenzen. Nukleinsäuren Res. 44, D286–D293 (2016).

Artikel CAS PubMed Google Scholar

Zhang, H. et al. DbCAN2: ein Metaserver für die automatisierte Annotation kohlenhydrataktiver Enzyme. Nukleinsäuren Res. 46, W95–W101 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: ein Toolkit zur Klassifizierung von Genomen mit der Genom-Taxonomie-Datenbank. Bioinformatik 36, 1925–1927 (2020).

Artikel CAS Google Scholar

Shen, W. & Ren, H. TaxonKit: ein praktisches und effizientes NCBI-Taxonomie-Toolkit. J. Genet. Genomics 48, 844–850 (2021).

Artikel PubMed Google Scholar

Ebrahim, A., Lerman, JA, Palsson, BO & Hyduke, DR COBRApy: Constraints-basierte Rekonstruktion und Analyse für Python. BMC-Syst. Biol. 7, 74 (2013).

Artikel PubMed PubMed Central Google Scholar

Wolfram Mathematica v. 13.2 (Wolfram, 2022).

R: Eine Sprache und Umgebung für statistische Berechnungen (R Core Team, 2022).

Yu, G., Smith, DK, Zhu, H., Guan, Y. & Lam, TTY Ggtree: ein R-Paket zur Visualisierung und Annotation phylogenetischer Bäume mit ihren Kovariaten und anderen zugehörigen Daten. Methoden Ecol. Entwicklung 8, 28–36 (2017).

Artikel Google Scholar

Paradis, E. & Schliep, K. Ape 5.0: eine Umgebung für moderne Phylogenetik und Evolutionsanalysen in R. Bioinformatics 35, 526–528 (2019).

Artikel CAS PubMed Google Scholar

Tamura, K., Stecher, G. & Kumar, S. MEGA11: Molecular Evolutionary Genetics Analysis Version 11. Mol. Biol. Entwicklung 38, 3022–3027 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Schliep, KP phangorn: Phylogenetische Analyse in R. Bioinformatics 27, 592–593 (2011).

Artikel CAS PubMed Google Scholar

Kanehisa, M., Sato, Y., Kawashima, M., Furumichi, M. & Tanabe, M. KEGG als Referenzressource für die Annotation von Genen und Proteinen. Nukleinsäuren Res. 44, D457–D462 (2016).

Artikel CAS PubMed Google Scholar

Heinken, A. et al. Stoffwechselrekonstruktion im Genommaßstab von 7.302 menschlichen Mikroorganismen für die personalisierte Medizin. Nat. Biotechnologie. https://doi.org/10.1038/s41587-022-01628-0 (2023).

Heinken, A., Magnúsdóttir, S., Fleming, RMT & Thiele, I. DEMETER: Effiziente gleichzeitige Kuratierung von Rekonstruktionen im Genommaßstab, basierend auf experimentellen Daten und verfeinerten Genanmerkungen. Bioinformatik 37, 3974–3975 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Callahan, BJ et al. DADA2: hochauflösende Probeninferenz aus Illumina-Amplikondaten. Nat. Methoden 13, 581–583 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Hubert, B. SkewDB, eine umfassende Datenbank mit GC und 10 weiteren Skews für über 30.000 Chromosomen und Plasmide. Wissenschaft. Daten 9, 92 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Lagadec, E., Småge, SB, Trösse, C. & Nylund, A. Phylogenetische Analysen norwegischer Tenacibaculum-Stämme bestätigen eine hohe Bakterienvielfalt und legen die Verbreitung allgegenwärtiger virulenter Stämme nahe. PLoS One 16, e0259215 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Ekborg, NA et al. Saccharophagus degradans gen. Nov., sp. nov., ein vielseitiger mariner Abbauer komplexer Polysaccharide. Int. J. Syst. Entwicklung Mikrobiol. 55, 1545–1549 (2005).

Artikel CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken S. Estrela (Yale University und Stanford University) für die Bereitstellung von Daten zur Community-Zusammensetzung aus ihren Anreicherungsexperimenten (Abb. 4d); A. Sichert für die Assemblierung von Genomen; und M. d. Bello, X. Shan, T. Hwa sowie allen Mitgliedern des Cordero-Labors und der Simons PriME-Kollaboration für ihre bereichernden Diskussionen. Wir danken der Simons Collaboration: Principles of Microbial Ecosystems (PriME), Preisnummer 542395 (OXC), und dem Simons Foundation Postdoctoral Fellowship Award Nummer 599207 (MG).

Matti Gralka

Aktuelle Adresse: Systems Biology Group, Amsterdam Institute for Life and Environment (A-LIFE) und Amsterdam Institute of Molecular and Life Sciences (AIMMS), Vrije Universiteit Amsterdam, Amsterdam, Niederlande

Shaul Pollak

Aktuelle Adresse: Abteilung für Mikrobielle Ökologie, Zentrum für Mikrobiologie und Umweltsystemwissenschaften, Universität Wien, Wien, Österreich

Abteilung für Bau- und Umweltingenieurwesen, Massachusetts Institute of Technology, Cambridge, MA, USA

Matti Gralka, Shaul Pollak & Otto X. Cordero

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MG entwarf die Studie, führte alle Experimente durch, analysierte alle Daten und verfasste das erste Manuskript. SP analysierte die Genomdaten aus der proGenomes-Datenbank. MG, SP und OXC diskutierten die Ergebnisse. OXC leitete das Projekt und redigierte das Manuskript.

Korrespondenz mit Matti Gralka oder Otto X. Cordero.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Microbiology dankt Sara Mitri, Seppe Kuehn und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Der Baum und die Taxonomie wurden mithilfe des GTDB-tk-Klassifizierungsworkflows unter Verwendung von Standardparametern aus einem Alignment von 120 Markergenen erstellt. Die Legende entspricht den erwarteten Ersetzungen pro Standort. Eine vollständige Liste aller Stämme finden Sie in der Ergänzungstabelle 1.

a, Anzahl der Kohlenstoffquellen, die das Wachstum pro Stamm unterstützen. b, Anteil aller Stämme, die ein bestimmtes Substrat als einzige Kohlenstoff- und Energiequelle nutzen konnten. c) Es fehlte eine starke Korrelation zwischen der Anzahl der wachstumsfördernden Kohlenstoffquellen, der Wachstumsrate und dem Ertrag. Durchschnittlicher Ertrag (blaue Punkte) und Rate (rote Quadrate), gruppiert nach der Anzahl der Kohlenstoffquellen, die das Wachstum unterstützten, dargestellt als Mittelwert ± Standardabweichung (für insgesamt n = 182 Stämme, die Wachstum auf mindestens einem Substrat zeigen). Linien und P-Werte werden aus linearen Regressionen abgeleitet. Generalistischere Arten (mehr verbrauchte Kohlenstoffquellen) erzielen einen etwas höheren Durchschnittsertrag, aber die Effektgröße ist wahrscheinlich nicht praktisch relevant. d, Für jede Bedingung (Substrate × Belastung) haben wir die Wachstumsrate und den Ertrag aufgetragen, die sehr leicht positiv korrelieren (lineare Regression P = 2 × 10−6, R2 = 0,005). Die Punkte ganz rechts entsprechen der maximal nachweisbaren Wachstumsrate angesichts unseres Abstands der experimentellen Zeitpunkte. e, lineare Steigungen für die Regression des Ertrags pro Stamm mit der Wachstumsrate; nur 3/186 Stämme zeigten eine statistisch signifikante Korrelation (lineare Regression) zwischen Rate und Ertrag. Die vertikale Linie entspricht der Steigung der Regression über alle Bedingungen.

a–c, Phänotypabstand, definiert als der Kosinusabstand zwischen Konsumvektoren, als Funktion des genomischen Abstands zwischen Stammpaaren, wobei der genomische Abstand der GTDB-tk-Abstand (a) und der Bray-Curtis-Abstand zwischen dem Geninhalt ( b; basierend auf der Kopienzahl von KEGG KO) oder Modulinhalt (c; basierend auf der Häufigkeit von KEGG-Modulen). Punkte sind der Mittelwert ± Standardabweichung der logarithmischen Klassen; n = 16.471 Vergleiche insgesamt.

a, Hauptkomponentenanalyse der vollständigen Wachstumsratenmatrix, wiedergegeben aus Abb. 1 im Haupttext. b, Gemittelte Beladungen feinkörniger Substratkategorien, normiert auf die Einheitslänge. Detaillierte Belastungen aller Substrate in der Hauptkomponentenanalyse in a. Die vollständige Hauptkomponentenanalyse zeigt eine klare Trennung der Präferenzen für organische (einschließlich Alkohole und Aromaten) und Aminosäuren. c,d, Individuelle Ladungen pro Substrat für jede Hauptkomponente (PC; links). Beachten Sie, dass alle Säuren negative Ladungen auf PC1 haben, aber alle bis auf zwei organische Säuren ihr Vorzeichen auf PC2 im Verhältnis zu Aminosäuren wechseln. Streudiagramme der ersten Hauptkomponente (basierend auf der vollständigen Wachstumsratenmatrix) gegenüber dem SAP, wie im Haupttext definiert, und die zweite Hauptkomponente gegenüber der analog definierten Präferenz für Aminosäuren und organische Säuren (rechts). Jeder Punkt ist ein anderes Isolat, gefärbt nach taxonomischer Reihenfolge (wie in Abb. 1). P-Werte werden aus linearen Regressionen abgeleitet.

a, Neuanalyse der Daten von Kehe und Kollegen11. Die Heatmap entspricht ihren erweiterten Daten Abb. 2 (endgültige optische Dichte in jeder Bedingung), außer mit Zeilen und Spalten, die nach Kosinusähnlichkeit sortiert sind. b: Die Hauptkomponentenanalyse dieser Matrix zeigt die Häufung der beiden taxonomischen Ordnungen und ihre Übereinstimmung mit den durchschnittlichen Beladungen von Säuren und Zuckern. c, Phylogenetischer Baum basierend auf GTDB-tk von Arten, die in den Merkmalsdatenbanken IJSEM und DEMETER sowie proGenomes (nach Artnamen) enthalten sind. Beachten Sie, dass zwei große Phyla, Actinobacteriota und Firmicutes, in unserer Stammbibliothek überhaupt nicht vertreten sind.

a, Glatte Histogramme der paarweisen Korrelationskoeffizienten zwischen den Wachstumsvektoren der Stämme über alle drei Experimente hinweg (V1, V2, V3; V3 ist das Experiment, das im Haupttext hauptsächlich diskutiert wird). b, Streudiagramme des SAP, gemessen für jeden Stamm zwischen allen drei Wiederholungsexperimenten. P-Werte werden aus linearen Regressionen abgeleitet.

Vollständigkeit, Abdeckung und Duplizierung werden im Detail unter „Methoden“ definiert. a: Die Vorhersage der Abdeckung anhand der Vollständigkeit (lineares Modell) führt im Allgemeinen zu qualitativ hochwertigeren Anpassungen als die Vorhersage der Abdeckung anhand der Duplizierung. b: Nach der Korrektur auf Vollständigkeit erklärt die Duplikation tendenziell mehr Residuen als die Vollständigkeit nach der Korrektur auf Duplikation. c) Weder die Duplizierung noch die Abdeckung eines einzelnen Signalwegs korrelierte sehr stark mit SAP, und ob die Duplizierung oder Abdeckung eines bestimmten Signalwegs eine bessere Aussagekraft für SAP hatte, hing vom Signalweg ab. d, Veranschaulichung des Konzepts der funktionellen Duplikation am Beispiel des Galactose-Abbauwegs (KEGG-Weg ko00052). Dargestellt ist der zentrale Teil des Weges, der Laktose und andere Oligosaccharide zunächst in β-D-Galaktose umwandelt, die in mehreren Schritten in α-D-Glukose-6-phosphat umgewandelt wird, das dann in die Glykolyse eintritt. Für einige Reaktionen haben wir mehrere Orthologe in denselben Stämmen gefunden (z. B. bis zu sechs Orthologe von K01785 (galM, Aldose-1-Epimerase, EC:5.1.3.3). Diese Orthologen sind keine exakten Duplikate, wie der Baum unten zeigt rechts. Der Baum basiert auf einem Mehrfachsequenz-Alignment aller mit K01785 versehenen Sequenzen über alle Stämme hinweg. Wir haben die sechs Kopien hervorgehoben, die in den Zobellia-Stämmen A2M03 gefunden wurden, die im Baum verteilt sind und oft mit Orthologen gruppiert sind, die in entfernt verwandten Arten gefunden werden Tatsächlich gilt für alle stark duplizierten Orthologen (maximale Anzahl von Orthologen pro Stamm mindestens sechs) der paarweise Abstand (berechnet aus den mehrfachen Sequenzausrichtungen für jedes KEGG-Ortholog unter Verwendung der dist.ml-Funktion des Phangorn-Pakets in R), war zwischen Orthologen im gleichen Stamm etwa gleich größer im Vergleich zu Orthologen in verschiedenen Stämmen, da sie kleiner sein sollte. Somit repräsentieren „doppelte“ Orthologe in einem Stamm wahrscheinlich funktionelle Varianten unterschiedlichen evolutionären Ursprungs. e,f, Durchschnittliche Abstände zwischen KEGG-Orthologen innerhalb und zwischen Stämmen für Gene, die mit Zucker- und Säurekatabolismus assoziiert sind. Die KEGG-Orthologen in Schwarz weisen einen Unterschied zwischen den beiden Distanzen von mehr als 10 % auf. Punkte stellen den Mittelwert ± Standardabweichung dar; Die Anzahl der Vergleiche ist für jedes Gen unterschiedlich und liegt zwischen n = 496 und n = 179.101. g, Vergleich zwischen gemessenem und vorhergesagtem Wachstum auf einzelnen Substraten. Das vorhergesagte Wachstum wurde aus FBA-Simulationen von Stoffwechselmodellen im Genommaßstab abgeleitet, die mit CarveMe unter Verwendung von Standardparametern (kein Lückenfüllen) erstellt wurden. Dieses Verfahren ergab 58 % korrekte Vorhersagen (vertikale Linie), was im Bereich korrekter Vorhersagen lag, die beim Vergleich mit gemischten Etiketten erzielt wurden (Verteilung, erhalten durch 1.000-maliges Mischen von Etiketten, wobei jedes Mal der Anteil richtiger Vorhersagen gemessen wurde).

a–d, Anzahl der CAZyme (a,b, Glykosylhydrolasen; und c,d, Polysaccharidlyasen) und ihre Korrelation mit SAPs (b,d). b,d, Die Einschübe zeigen −log10P pro Bestellung, den negativen log10 des P-Werts, der aus linearen Regressionen der CAZyme-Zahl mit SAP innerhalb jeder Bestellung erhalten wurde; −log10P > 2 (vertikale Linie) entspricht einer signifikanten Korrelation auf dem 5 %-Niveau, Bonferroni korrigiert für mehrere Tests. b, Die Quadratsymbole entsprechen den Quadraten in Abb. 1d. Dabei handelt es sich um Ausnahmen von der mittleren Stoffwechselpräferenz pro Bestellung, wie etwa die säurespezialisierende Gattung Tenacibaculum in der Gattung Flavobacteria, zu der auch Fischpathogene gehören60. Umgekehrt tendierten die Ordnungen Pseudomonadales und Rhodobacterales (von denen allgemein angenommen wird, dass sie auf einfache Substrate spezialisiert sind13) dazu, Säuren zu bevorzugen (SAP < 0), aber wir fanden auch die auf Zucker spezialisierte Pseudomonadales-Gattung Saccharophagus, die als Zuckerabbauer bekannt sind61. Die Flavobacteria- und Pseudomonadales-Stämme mit atypischen Phänotypen für ihre Taxonomie wiesen tendenziell weniger bzw. mehr CAZyme auf als ihre nahen Verwandten. Kleine Punkte entsprechen einzelnen Isolaten, große Punkte mit Fehlerbalken geben den Mittelwert ± Standardabweichung für jede Ordnung an (a,c, n = 28 (Pseudomonadales), 34 (Rhodobacterales), 20 (Vibrionales), 58 (Alteromonadales), 32 (Flavobacteriales). )) oder SAP bin (b,d, Gesamtzahl der Stämme n = 182).

a,Der GC-Gehalt (gemessen über alle vorhergesagten kodierenden Regionen) ist auf der Ordnungsebene in unserer Stammbibliothek relativ konserviert (n = 28 (Pseudomonadales), 34 (Rhodobacterales), 20 (Vibrionales), 58 (Alteromonadales) und 32 (Flavobacteriales). )). b: Der GC-Gehalt sagt den Kohlenstoff- und Stickstoffbedarf pro kodierter Aminosäure voraus. Alle Proteinsequenzen wurden manuell anhand der Anzahl der Kohlenstoff- und Stickstoffatome jeder Aminosäure bewertet. c, Dieselben Daten wie Abb. 3b ohne Binning: Der GC-Gehalt korreliert mit dem genomischen GC-Gehalt über den gesamten Stammsatz hinweg, jedoch nicht innerhalb der Ordnungen, möglicherweise weil sich der GC-Gehalt sehr langsam entwickelt und daher unterhalb der Ordnungsebene relativ konserviert ist. Bemerkenswerterweise war diese Korrelation viel stärker als die Korrelation zwischen dem GC-Gehalt und anderen grundlegenden Merkmalen des Genoms, wie etwa der Anzahl der kodierenden Regionen (lineare Modellanpassung, P = 0,2), und es gab keinen praktisch signifikanten Unterschied zwischen dem GC-Gehalt von Gene in zucker- und säurekatabolischen Stoffwechselwegen (e). d, Aufgrund der Korrelation zwischen dem GC-Gehalt und sowohl dem Nährstoffbedarf als auch SAP korreliert SAP positiv/negativ mit der Anzahl der Kohlenstoff-/Stickstoffatome pro kodierter Aminosäure. Kleine Punkte entsprechen einzelnen Dehnungen, große Punkte mit Fehlerbalken geben den Mittelwert ± Standardabweichung für die fünf Hauptordnungen an. Linien und P-Werte werden aus linearen Regressionen abgeleitet. e: Der durchschnittliche GC-Gehalt von zucker- und säurekatabolen Genen ist sehr ähnlich. Streudiagramm des GC-Gehalts aller Gene, die als Zucker-/Säure-Gene gekennzeichnet sind (Ergänzungstabelle 5), aus den Genomen extrahiert und pro Stamm gemittelt. Die Linie entspricht dem gleichen GC-Gehalt in Zucker-/Säure-Genen. f, Reste der linearen Anpassung in a, die einen schwachen, aber statistisch signifikanten (P = 6 × 10−16) Trend für Genome mit hohem GC zeigen, einen etwas höheren GC-Gehalt in Zuckergenen als in Säuregenen aufzuweisen. g, Beispiel für die Korrelation und lineare Regression der Signalweghäufigkeit mit dem GC-Gehalt in mehr als n = 11.000 verschiedenen Referenzgenomen (proGenomes). h, Das Extrahieren der linearen Regressionskoeffizienten (Steigungen) für jeden Signalweg, die alle hochsignifikant waren, ergibt ein Bild ähnlich wie in Abb. 2b, d GC-Inhalt. Die Steigungen für Zucker- (n = 7) und Säurepfade (n = 26) unterscheiden sich deutlich voneinander (t-Test, dof = 31, T = −4,26, P = 0,00017).

a, Taxonomische Verteilung und Verteilung von SAPs in den synthetischen Gemeinschaften, gefärbt nach Reihenfolge (Fla, Flavobacteriales; Vib, Vibrionales; Alt, Alteromonadales; Pse, Pseudomonadales; Rho, Rhodobacterales; Cyt, Cytophagales). b: Reichtum im Laufe der Zeit in synthetischen Gemeinschaften, die auf einer von vier Kohlenstoffquellen wachsen (Abb. 4a). Punkte mit Fehlerbalken geben den Mittelwert ± Standardabweichung über sechs Wiederholungen an. c, Abundanzgewichteter durchschnittlicher GC-Gehalt von Gemeinschaften, die mit Säuren oder Zuckern angereichert sind. Der genomdurchschnittliche GC für einzelne OTUs wurde mithilfe von SkewDB (Methoden) geschätzt. Die Verteilungen sind statistisch signifikant unterschiedlich (zweiseitiger Welch-t-Test \(T=6,95,{\rm{dof}}=13,8,{P}=7,5\times {10}^{-6}\)). d, Endgültiger Reichtum an synthetischen Gemeinschaften, die auf vier verschiedenen Konzentrationen von GlcNAc wachsen. Die Gemeinschaften bestanden aus einer komplexen Mischung von Stämmen, von denen nur etwa die Hälfte in der Lage war, GlcNAc in Monokultur zu konsumieren (Konsumenten). Die übrigen Arten (Kreuzfresser) müssen sich daher von den von den Verbrauchern ausgeschiedenen Metaboliten gekreuzt haben. e,f, Durchschnittliche Anzahl von C- oder N-Atomen pro kodierter Aminosäure in den Gemeinschaften, gewichtet mit der Häufigkeit jedes Stammes. Dargestellt ist der Durchschnitt der letzten fünf Zeitpunkte. Sternchen zeigen signifikante Unterschiede zwischen den Bedingungen an (P = {2, 0,2, 5,8, 6,2} × 10−6 von oben nach unten in e und P = {0,01, 3,0, 3,8, 1,4} × 10−5 von oben nach unten in f) in einem zweiseitigen Mann-Whitney-Test (unter Verwendung der Bonferroni-Korrektur für Mehrfachtests). d–f,h, Kleine Punkte entsprechen Replikaten (einschließlich verschiedener Verdünnungsfaktoren, n = 12 Punkte pro Bedingung), große Punkte mit Fehlerbalken geben den Mittelwert ± sd g an, Funktionelle Zusammensetzung synthetischer Gemeinschaften, die auf vier verschiedenen Konzentrationen von GlcNAc wachsen die einzige Kohlenstoffquelle (aber nicht Stickstoffquelle). Die endgültigen Artenzusammensetzungen werden als Balkendiagramme angezeigt, in denen jede Art entsprechend ihrem SAP gefärbt ist. Bei niedrigen GlcNAc-Konzentrationen dominierten eher säurespezialisierte Spezies (negatives SAP, Grüntöne). Dieser Trend wurde nicht durch eine Änderung der relativen Häufigkeit von Verbrauchern (die über alle Bedingungen hinweg ungefähr konstant war) verursacht, sondern sowohl durch Verbraucher als auch durch Crossfeeder, wobei bei niedrigeren Kohlenstoffkonzentrationen ein geringerer SAP-Gehalt vorherrschte. h, Dieses Muster blieb bei der Störung der Gemeinden bestehen. Alle vier Replikatgemeinschaften mit dem mittleren Verdünnungsfaktor (über sechs Zyklen bei der höchsten und niedrigsten Konzentration (20 bzw. 0,02 mM GlcNAc) gezüchtet) wurden parallel zu den ungestörten Gemeinschaften in alle anderen Konzentrationen übertragen. In Übereinstimmung mit der ungestörten Beobachtung , ein Anstieg/Abfall der GlcNAc-Konzentration führte zu einem Anstieg/Abfall von cSAP. Dieser Effekt war bei stärkerer Störung insgesamt stärker, vergleichen Sie beispielsweise die 20 mM auf 2 mM gewechselten Gemeinschaften (gelb) mit den 20 mM auf 0,02 mM hat die Community gewechselt (rot).

Ergänzungstabelle 1. Liste der Stämme. Ergänzungstabelle 2. Liste der Substrate. Ergänzende Tabelle 3. Vollständiger Datensatz der Wachstumsraten. Ergänzende Tabelle 4. KEGG-Pfade, die für SAP-Vorhersagen verwendet werden. Ergänzende Tabelle 5. KOs, die für SAP-Vorhersagen verwendet werden. Ergänzende Tabelle 6. Liste der Zucker-/Säure-KOs in unseren Stämmen. Ergänzende Tabelle 7. Vorhergesagtes SAP für Referenzgenome. Ergänzende Tabelle 8. OTUs für synthetische Gemeinschaften auf vier Kohlenstoffquellen.

Quelldaten für Abb. 1–4.

Springer Nature oder sein Lizenzgeber (z. B. eine Gesellschaft oder ein anderer Partner) besitzen die ausschließlichen Rechte an diesem Artikel im Rahmen einer Veröffentlichungsvereinbarung mit dem Autor bzw. den Autoren oder anderen Rechteinhabern. Die Selbstarchivierung der akzeptierten Manuskriptversion dieses Artikels durch den Autor unterliegt ausschließlich den Bedingungen dieser Veröffentlichungsvereinbarung und geltendem Recht.

Nachdrucke und Genehmigungen

Gralka, M., Pollak, S. & Cordero, OX Der Genomgehalt sagt die Kohlenstoffabbaupräferenzen heterotropher Bakterien voraus. Nat Microbiol (2023). https://doi.org/10.1038/s41564-023-01458-z

Zitat herunterladen

Eingegangen: 08. Februar 2023

Angenommen: 24. Juli 2023

Veröffentlicht: 31. August 2023

DOI: https://doi.org/10.1038/s41564-023-01458-z

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

AKTIE