banner

Nachricht

Jul 09, 2023

Moonlighting-Gene beherbergen Antisense-ORFs, die potenzielle Membranproteine ​​kodieren

Scientific Reports Band 13, Artikelnummer: 12591 (2023) Diesen Artikel zitieren

372 Zugriffe

1 Altmetrisch

Details zu den Metriken

Moonlighting-Gene kodieren für einzelne Polypeptidmoleküle, die mehrere und oft voneinander unabhängige Funktionen erfüllen. Diese Gene kommen in allen Lebensbereichen vor. Ihre Allgegenwärtigkeit und funktionelle Vielfalt werfen viele Fragen hinsichtlich ihres Ursprungs, ihrer Entwicklung und ihrer Rolle im Zellzyklus auf. In dieser Studie stellen wir eine einfache Bioinformatik-Sonde vor, die es uns ermöglicht, Gene nach ihrem Antisense-Translationspotential zu ordnen, und wir zeigen, dass diese Sonde zuverlässig Nebeneffekte in einer Vielzahl von Organismen anreichert. Wir stellen fest, dass Moonlighting-Gene mutmaßliche offene Antisense-Leseraster (ORFs) enthalten, die reich an Codons für unpolare Aminosäuren sind. Wir stellen auch fest, dass Nebenarbeitsgene dazu neigen, sich zusammen mit Genen zu befinden, die an der Produktion von Zellwänden, Zellmembranen oder Zellhüllen beteiligt sind. Auf der Grundlage dieser und anderer Erkenntnisse schlagen wir ein Modell vor, in dem wir vorschlagen, dass nebenbei arbeitende Genprodukte wahrscheinlich durch Lücken in der Zellwand und Membran an Wand-/Membranbaustellen aus der Zelle austreten; und wir schlagen vor, dass Antisense-ORFs „membranklebrige“ Proteinprodukte produzieren, die die DNA des Moonlighting-Gens effektiv an die Zellmembran in porösen Bereichen binden, in denen ein intensiver Zellwand-/Zellmembranaufbau im Gange ist. Dies führt zu einem hohen Potenzial für das Entweichen von Mondscheinproteinen an die Zelloberfläche. Evolutionäre und andere Implikationen dieser Erkenntnisse werden diskutiert.

Moonlighting-Gene sind Gene, die Proteine ​​mit mehreren unterschiedlichen und oft voneinander unabhängigen Funktionen kodieren1. Paradoxerweise befinden sich diese Proteine ​​oft auch im Zytosol und sind außerdem an der Außenseite der Zelle zu finden. Nach unserem Kenntnisstand wurden für diese Proteine ​​keine Partner im Sekretionssystem identifiziert. In den 30 Jahren, seit festgestellt wurde, dass Glycerinaldehyd-3-phosphat-Dehydrogenase (GAPDH) eine untergeordnete Rolle auf der Zelloberfläche pathogener Streptokokken2 spielt, wurden viele weitere Beispiele für Schwarzarbeit entdeckt. Zu diesen Beispielen gehören Genprodukte mit bekannten zytosolischen Funktionen, die irgendwie auf der Zelloberfläche landen oder in Kulturmedien ausgeschieden werden. Die manuell kuratierte MoonProt-Datenbank listet mittlerweile über 300 solcher Gene auf, die Wirtsorganismen umfassen, die von Bakterien über Hefen, Protisten, Archeonen, Pflanzen bis hin zu Säugetieren reichen. Viele grundlegende Fragen bleiben unbeantwortet: Wie erlangen diese Gene mehrere Funktionen? Wie erhalten sie Zugang zur Außenseite der Zelle, wenn keine Partner im Sekretionssystem vorhanden sind? Warum werden einige Stoffwechselenzyme ausgeschüttet, viele andere jedoch nicht? Und wie kommt es, dass dieselben Proteine ​​(z. B. GAPDH, Enolase, DnaK, GroEL, Ef-Tu, Superoxiddismutase) in verschiedenen Wirten eine Nebenrolle spielen? Da in allen Phyla häufig dieselben Proteine ​​in Nebenrollen vorkommen, ist es wahrscheinlich, dass das Phänomen durch Prozesse ermöglicht wird, die für alles Leben von grundlegender Bedeutung sind. Bemerkenswert ist, dass es sich bei vielen an der Schwarzarbeit beteiligten Genen um alte, hochkonservierte Gene handelt, was wiederum auf zugrunde liegende Prozesse hinweist, die grundlegend – in gewissem Sinne vielleicht sogar ursprünglich – sind. In der vorliegenden Studie streben wir eine bioinformatische Top-Down-Untersuchung von Schwarzarbeit-Genen an, bei der wir nach hochrangigen Hinweisen und pangenomischen Ursachen und Wirkungen suchen.

Ein Schlüsselmerkmal des Zelllebens ist die Kapselung: Zellen haben ein Inneres und ein Äußeres, wobei dauerhafte Strukturen die beiden trennen. Man kann es so betrachten, dass die Zelle einen Entropiegradienten verkörpert, mit einer wässrigen Umgebung mit hoher Entropie im Zentrum und einer Hülle mit niedriger Entropie (d. h. hochstrukturiert), die eine Membran und Strukturkomponenten umfasst die Peripherie. Die Membrankomponenten der Zelle bestehen größtenteils aus Proteinen, die unpolare Aminosäuren enthalten; Im Gegensatz dazu haben wasserlösliche Proteine ​​(wie sie im Zentrum der Zelle vorhanden sind) überwiegend polare Aminosäuren auf ihrer Oberfläche. Der genetische Code bietet einen bequemen (und universellen) Mechanismus zur Spezifizierung polarer gegenüber unpolaren Aminosäuren: Ein Purin an Base zwei eines Codons garantiert praktisch die Auswahl einer polaren Aminosäure, während ein Pyrimidin in der zweiten Base tendenziell a garantiert unpolare Aminosäure. Dies deutet auf einen ursprünglichen genetischen Code hin, der (zumindest wohl) ein binärer Code gewesen sein könnte, der entweder polare oder unpolare Aminosäuren zulässt, basierend auf der Verwendung von Purinen oder Pyrimidinen in Codons. (Zur Diskussion dieser Möglichkeit siehe Trifonov3). Unabhängig davon, ob es sich um RNA oder DNA handelt, war das ursprüngliche genetische Material möglicherweise einzelsträngig. In diesem Fall konnte die Transkription in mRNA (sofern sie stattfand) nur in eine Richtung erfolgen, nämlich in einer 3′-zu-5′-Richtung. Mit der Einführung doppelsträngiger Nukleinsäuren könnte die Transkription jedoch in eine von zwei Richtungen erfolgen. Aufgrund der Komplementarität tendiert eine Botschaft, die polare Aminosäuren in eine Richtung kodiert, natürlicherweise dazu, unpolare Aminosäuren in die andere Richtung zu kodieren. Man kann sich ein Szenario in den frühen Tagen des doppelsträngigen genetischen Materials vorstellen, nämlich in den Tagen vor Promotoren, Repressoren, Shine-Dalgarno-Sequenzen oder anderen spezialisierten Sequenzorganisationen wie UTRs/nichtkodierenden Regionen: Zu diesem Zeitpunkt könnte die Transkription abgeschlossen sein geschah bidirektional, wobei wasserlösliche Proteine ​​in einer Richtung und Proteine, die reich an hydrophoben Aminosäuren sind, in der anderen Richtung produziert wurden, eine Situation, die ganz natürlich zur Produktion von Membranproteinen und zur Einkapselung hydrophiler Proteine ​​in Membranen (d. h. zellulärem Leben) führt. . Schwarzarbeit ist größtenteils ein Thema, bei dem es um „drinnen versus draußen“ geht. Daher ist es nur natürlich, sich zu fragen, ob Hinweise auf das Phänomen möglicherweise Fragen zur Verwendung hydrophober Aminosäuren und/oder zum Aufbau von Zellwänden und Zellmembranen beinhalten. Wir berücksichtigen diese und andere Fragen bei der Entwicklung bioinformatischer Techniken zur Entdeckung von Schwarzarbeitsgenen.

Zu unseren Modellorganismen gehören Streptococcus pneumoniae NCTC11032 (G + C-Gehalt 40,6 %), Escherichia coli NCTC11775 (G + C 51,7 %) und Mycobacterium tuberculosis H37Rv (G + C 65,9 %). RefSeq-Genome wurden aus dem NCBI-Repository heruntergeladen. Insgesamt wurden 25 Mondscheingene aus der MoonProt-Datenbank kuratiert. Dabei handelt es sich um Gene, für die es zahlreiche Belege für eine Mondscheinaktivität gibt (Tabelle 1). Viele dieser Gene liegen in mehr als einer Isoform vor. Für unsere Anreicherungsexperimente zählen wir jede Isoform einzeln. Beispielsweise liegt bei M. tuberculosis die Cystein-Desulfurase in den Genen csd und iscS vor; Superoxiddismutase existiert als SodA und sodC; und so weiter. Insgesamt enthält M. tuberculosis, wenn man alle Isoformen aller Gene zählt, 35 Schwarzlichtprotein-Gene; Es wurde festgestellt, dass E. coli 31; S. pneumoniae hat 20.

Den für diese Studie ausgewählten Genen ist gemeinsam, dass sie alle bekanntermaßen Proteine ​​produzieren, die sich sowohl im Zytosol als auch außerhalb des Zytosols befinden (entweder auf der Oberfläche der Zelle oder in das Kulturmedium ausgeschieden). Daher fallen sie unter die Rubrik „Ausscheidung zytosolischer Proteine“ oder ECP4.

Wir haben einen Anreicherungstest entwickelt, bei dem wir zunächst jedes Gen anhand einer Metrik bewerten, dann die Gene nach ihren Bewertungen sortieren und dann die 20 % aller Gene mit der höchsten Bewertung ermitteln. Innerhalb dieses Top-Cuts suchen wir nach Nebenjob-Genen und anderen funktionellen Genkategorien. Anschließend berechnen wir die Fold-Enrichment-Zahlen und berechnen für jede einen Erwartungswert basierend auf der kumulativen hypergeometrischen Wahrscheinlichkeit. (Der Code für die Anreicherungsanalyse sowie für die hypergeometrische Wahrscheinlichkeitsanalyse ist frei verfügbar unter https://github.com/kasmanethomas/moonlighting/tree/main). Wir haben verschiedene „Cur-Größen“ von 5 bis 30 % ausprobiert und bei allen Grenzwerten durchweg Anreicherungen festgestellt. Bei kleineren Stichprobengrößen waren die Faltungsanreicherungen tendenziell höher. Wir haben uns für eine Schnittgröße von 20 % entschieden, die angemessen umfassend, aber nicht zu breit ist. Die etwas geringeren Faltenanreicherungen bei dieser Schnittgröße bedeuten, dass die Zahlen angemessen konservativ sind.

Die von uns verwendeten Metriken beinhalten das Zählen der Anzahl (in Prozent) der Codons, die einer bestimmten Beschreibung entsprechen: Beispielsweise zählt eine Metrik den Prozentsatz der Codons, die mit dem Muster RNY übereinstimmen, wobei „R“ für ein beliebiges Purin und „N“ für eine beliebige Base steht und „Y“ ist ein beliebiges Pyrimidin. Eine weitere Metrik, die wir verwenden, besteht darin, Shannon-Entropien für Purine/Pyrimidine in den Basen eins und drei aller Codons eines Gens zu erhalten; Diese beiden Entropien werden dann verwendet, um einen 2D-Vektor zu konstruieren. Ebenso erhalten wir die G + C-Entropien der Basen eins und drei für die Codons eines Gens; Diese beiden Entropien bilden einen 2D-Vektor. Eine Metrik wird aus dem Skalarprodukt der beiden 2D-Vektoren abgeleitet. (Die Motivation hinter dieser Metrik wird unter „Ergebnisse“ besprochen).

Der Code zur Berechnung von Metriken und zur Durchführung der Anreicherungstests besteht aus nativem JavaScript-Code, der von den Autoren erstellt wurde (Codelisten finden Sie im Github-Repository unter https://github.com/kasmanethomas/moonlighting). Unser Code entspricht ECMAScript2015 und wir haben ihn in Google Chrome Version 107.0.5304.121 (x86_64) getestet.

Unsere Untersuchung ergab, dass es für alle Schwarzarbeitsgene zwei gemeinsame Faktoren gibt: Erstens neigen sie dazu, physisch in der Nähe von Genen für Enzyme lokalisiert zu sein, die am Aufbau von Zellwänden, Zellmembranen oder Zellhüllen beteiligt sind; und zweitens neigen sie dazu, im Antisense-Stil kleine Proteine ​​zu kodieren, die einen hohen Prozentsatz an unpolaren Aminosäuren enthalten. Wir begannen damit, zu untersuchen, wo im Genom jedes biologischen Modells Mondscheingene vorkommen, und stellten fest, dass sie dazu neigen, sich zusammen mit Genen zu befinden, die am Aufbau von Zellwänden und Zellmembranen beteiligt sind. Anschließend charakterisierten wir Moonlighting-Gene im Hinblick auf die Codon-Purin-Bias – und stellten fest, dass Moonlighting-Gene eine überdurchschnittlich hohe Purin-Bias sowohl in Vorwärts- als auch in Rückwärtsrichtung (umgekehrtes Komplement) aufweisen. Als nächstes entwickelten wir Anreicherungsassays basierend auf diesen Codon-Eigenschaften. Die Ergebnisse dieser Tests stimmten mit der Annahme überein, dass offene Antisense-Leseraster in Schwarzarbeitsgenen existieren könnten. Dementsprechend suchten wir nach Antisense-ORFs in Schwarzarbeitsgenen. Wir fanden heraus, dass solche ORFs nicht nur existieren, sie enthalten oft auch vorhergesagte Transmembrandomänen.

Um eine Vorstellung von der lokalen Umgebung zu bekommen, in der Schwarzarbeitsgene „operieren“, haben wir ihre Nähe zu anderen Genen untersucht. Wir fragten: Was sind ihre Nachbarn? Wir können ein einfaches Experiment durchführen, indem wir Stichproben für alle Gene machen, die in einem Plus- oder Minusbereich (z. B. fünf Gene) von Nebengenen liegen, wobei wir darauf achten, doppelte Treffer zu entfernen. Die Menge aller nächsten Nachbarn innerhalb von fünf Genen eines Mondscheingens wurde getestet. Nach der Entfernung der Duplikate fanden wir in M. tuberculosis H37Rv 298 Gene (N = 298) mit Anreicherungsmerkmalen, wie in Tabelle 2 gezeigt. Hinweis: Ähnliche Ergebnisse wurden sowohl mit einem Proximity-Radius von drei als auch mit zehn gefunden. Ein Radius von fünf wurde gewählt, da der Ergebnissatz in niedrigeren Bereichen vergleichsweise spärlich war und nur 136 Gene enthielt, während in höheren Bereichen die Faltenanreicherungen tendenziell gering waren und höhere E-Werte aufwiesen. Der aussagekräftigste Ergebnissatz wurde bei einem Radius von fünf erhalten.

Beachten Sie, dass Mondscheingene dazu neigen, sich zusammen mit Genen für die Zellwandbiogenese zu befinden. Das wichtigste numerische Ergebnis ist jedoch die große Anzahl der gefundenen „hypothetischen Protein“-Gene (Tabelle 2). Fast 30 % der Suchergebnisse bestehen aus hypothetischen Proteingenen. Es stellt sich heraus, dass ein viel aussagekräftigeres Bild zu sehen ist, sobald die „hypothetischen Protein“-Gene unsere Ergebnisse nicht mehr verwässern. Wenn wir die hypothetischen Proteingene auf der Grundlage herausfiltern, dass sie möglicherweise verborgene Ergebnisse verdecken, und nur Gene zählen, denen eine Funktion zugewiesen wurde, sehen die Anreicherungen wie in Tabelle 3 dargestellt aus.

Beachten Sie, dass Gene, die an der Zellwandbiogenese, Sekretion oder der Funktion der inneren Membran beteiligt sind, ganz oben auf der Liste stehen. Allerdings umfasst die Liste mittlerweile auch viele andere wichtige Kategorien, darunter äußere Membran, Plasmamembran und Gene, die speziell an der Peptidoglycan-Synthese beteiligt sind. Ähnliche Ergebnisse werden bei E. coli (Tabelle 4) und Streptococcus pneumoniae (siehe Tabelle 5) erzielt.

Interessanterweise zeigen alle drei Organismen Anreicherungen für tRNA-Ligasen. Die MoonProt-Datenbank listet 15 tRNA-Ligasen (hauptsächlich aus Eukaryoten) mit Nebeneffektfunktionen auf. Beachten Sie, dass das Thema der „lokalen Umgebung“ des Schwarzarbeit-Gens in der „Diskussion“ fortgesetzt wird, wo darauf hingewiesen wird, dass die Nähe dieser Gene zu Genen für den Membran- und Zellwandaufbau alles andere als zufällig ist.

Bei dem Versuch, Nebenjob-Gene zu verstehen, begannen wir mit der wohl grundlegendsten und aussagekräftigsten bioinformatischen Metrik für die Untersuchung von Genen, nämlich dem Purin-Bias der Base eins der Codons (im Folgenden R1 genannt). Die Bedeutung von R1 (Puringehalt, Basis 1) besteht darin, dass es der zuverlässigste statistische Indikator für den Status des offenen Leserahmens ist. Laut Ponce de Leon et al.5: „Es ist das einzige ausreichend robuste Signal, um bei der Gensuche und Annotation im Rahmen von Genomuntersuchungen zu helfen.“ Der Grund ist einfach: Die meisten Gene in den meisten Organismen und in allen Lebensbereichen haben einen durchschnittlichen R1-Wert von 0,6 oder mehr. Das heißt, die Base 1 der Codons in proteinkodierenden Genen ist in 60 % der Fälle entweder Adenin oder Guanin. Während für diesen sogenannten „Purin-Bias“ verschiedene Erklärungen angeboten wurden, lautet die einfachste Hypothese, dass der DA-da-da-DA-da-da-Takt dieses Signals dem Ribosom eine einfache Möglichkeit bietet, die Rahmenausrichtung zu erkennen und aufrechtzuerhalten während der Übersetzung. Abbildung 1 zeigt den Purinprozentsatz für jede der drei Codonbasen im Vergleich zum CDS-Genom-G + C-Gehalt für N = 159 Bakteriengenome. Es ist leicht zu erkennen, dass der Puringehalt der Base eins bei allen Organismen deutlich höher ist als bei den anderen beiden Codonbasen.

Puringehalt (A + G) der Basen eins, zwei und drei der Codons für N = 159 Bakteriengenome. Jeder Punkt repräsentiert ein vollständiges Genom. Einzelheiten finden Sie in Anhang A.

Bei M. tuberculosis wurde festgestellt, dass der CDS-Genom-weite Mittelwert von R1 für alle Codons 0,60515 ± 0,05462 beträgt. Die R1-Werte für alle Moonlighting-Gene sind grafisch dargestellt (Abb. 2). Man kann feststellen, dass die Mehrheit (24/35) der Nebenerwerbsgene überdurchschnittliche R1-Werte aufweisen.

Puringehalt (R1) der Base eins der Codons für N = 35 Moonlighting-Gene in M. tuberculosis H37Rv. Der genomweite Durchschnitt von 0,60515 ± 0,05462 (für alle 3906 CDS-Gene) ist schwarz dargestellt.

Die ungewöhnlich hohen R1-Werte für Schwarzarbeitsgene ließen uns fragen, ob R1 möglicherweise auch in der entgegengesetzten Richtung, auf dem gegenüberliegenden DNA-Strang, hoch ist. Abbildung 3 zeigt den Puringehalt der Base eins für Anti-Codons derselben Gene (d. h. Codons im umgekehrten Komplement des Nachrichtenstrangs). Etwas überraschend ist, dass 25/35 Gene einen überdurchschnittlichen Purin-Bias in Reverse-Komplement-Codons aufweisen.

Reverse-Komplement-Puringehalt (R1) der Base eins der Anti-Codons für N = 35 Moonlighting-Gene in M. tuberculosis H37Rv. Der genomweite Durchschnitt von 0,53089, 0,05213 ± 0,05213 (für alle 3906 CDS-Gene) ist schwarz dargestellt.

Die hohen Vorwärts- und Rückwärts-R1-Werte der Abb. 2 und 3 schlagen eine Strategie zur Erzielung von Anreicherungen von Schwarzarbeitsgenen vor: Erhalten Sie R1FORWARD und R1REVERSE-COMPLEMENT für jedes Gen im CDS-Genom, addieren Sie die beiden und sortieren Sie alle Gene nach dieser Metrik. Nehmen Sie dann die obersten 20 % der Gene und sehen Sie, wie viele Nebengeniere sind. Dabei fanden wir Anreicherungen, wie in Tabelle 6 dargestellt.

Die obersten 20 % der nach der Metrik sortierten Gene enthalten 14 von 35 Schwarzarbeitsgenen, was einer 2,00-fachen Anreicherung entspricht, bei einer kumulativen hypergeometrischen Wahrscheinlichkeit von 0,005. Als nächstes überlegten wir, ob eine Metrik, die R1-vorwärts und R1-rückwärts summiert, einfach gleichbedeutend mit der Zählung des Prozentsatzes der Codons wäre, die mit dem Muster RNY übereinstimmen, wobei R ein beliebiges Purin, N eine beliebige Base und Y ein beliebiges Pyrimidin ist. Unsere Analyse zeigt, dass die beiden Metriken nicht identisch sind und leicht unterschiedliche Ergebnisse liefern. Die RNY-Metrik ist effektiver (Tabelle 7).

Die Anreicherung für Schwarzarbeitsgene bei M. tuberculosis zeigt einen Wert von 2,29-fach bei einem Erwartungswert von Null. Das bedeutet, dass Mondscheingene mehr als andere Gene Codons enthalten, die dem RNY-Muster entsprechen, einem Muster, das von Natur aus bidirektional ist (da das Anticodon von RNY auch RNY ist). Wir haben uns natürlich gefragt, ob dieses Ergebnis auf M. tuberculosis beschränkt ist oder allgemein auf andere Organismen zutreffen könnte. Daher zeigen die Tabellen 8 und 9 die Ergebnisse für E. coli NCTC11775 und Streptococcus pneumoniae NCTC11032.

Die RNY-Anreicherungstechnik war bei allen drei Organismen wirksam. Bemerkenswert ist auch, dass die Genfunktionskategorien bei allen Organismen gut übereinstimmten; Beispielsweise werden ribosomale Proteingene im Allgemeinen durch diese Technik angereichert.

Im Hinblick auf die obigen Ergebnisse stellen sich zwei Hauptfragen: (1) Könnte unsere Anreicherungstechnik auf irgendeine Weise verfeinert oder verbessert werden? (2) Warum funktioniert die Technik überhaupt? Das Vorhandensein eines hohen Purin-Bias in Vorwärts- und Rückwärtsrichtung deutet auf die Möglichkeit einer reversen Transkription und Translation von Antisense-RNA in diesen Genen hin. Wir entschieden uns, als Ansatz die Hypothese zu verfolgen, dass Antisense Open Reading Frames (asORFs) in Schwarzarbeitsgenen existieren könnten. Dies veranlasste uns, darüber nachzudenken, wie Informationen, die im selben Gen in zwei Richtungen laufen, sinnvollerweise nebeneinander existieren könnten. Unsere Überlegung war, dass die RY-Achse (Purin/Pyrimidin) Informationen möglicherweise anders kodiert als die SW-Achse (GC vs. AT). Jede Achse ist in der Lage, Informationen im Wert von einem Bit zu kodieren. Wir haben uns gefragt, ob die Degeneration der Basen eins und drei der Codons die „friedliche Koexistenz“ von Informationen auf diesen Achsen ermöglichen könnte, sodass RY-Informationen, die in eine Richtung gehen, SW-Informationen, die in die andere Richtung gehen, effektiv überlagert werden können.

Um die obige Idee zu testen, wurde eine neue Metrik wie folgt entwickelt:

Ermitteln Sie für jedes Gen die Shannon-Entropie des RY-Signals in der Basis eins der Codons. Das heißt, ermitteln Sie die durchschnittliche Purinhäufigkeit (und Pyrimidinhäufigkeit) für Base eins und berechnen Sie damit die Entropie auf die übliche Weise wie folgt:

Machen Sie dasselbe für Basis drei.

Verwenden Sie die Entropiewerte für Basis eins und drei, um einen Vektor zu bilden, [HRY1, HRY3].

Ermitteln Sie die Shannon-Entropie des SW-Signals (wobei „S“ G oder C und „W“ A oder T bedeutet) in Basis eins und auch in Basis drei; und bilden einen Vektor, [HSW1, HSW3].

Normalisieren Sie die so erhaltenen Vektoren.

Berechnen Sie ihr Skalarprodukt. Verwenden Sie dies als Grundlage einer Metrik.

Das Skalarprodukt zweier Vektoren misst, wie stark sich die Vektoren in der Richtung unterscheiden, da das Skalarprodukt normalisierter Vektoren der Kosinus des Winkels zwischen ihnen ist. Im Falle von Schwarzarbeitsgenen wird ein großer Unterschied für die RY- und SW-Vektoren erwartet. Wir erwarten einen großen Winkel und einen kleinen Kosinus, daher wird der Score-Wert für Gene gemäß 1-Kosinus berechnet. Die Anreicherungswerte für M. tuberculosis sind in Tabelle 10 aufgeführt, in der die Gene nach dieser neuen Metrik geordnet sind.

Die in Tabelle 10 dargestellten Ergebnisse bieten mehrere neue zusätzliche Funktionskategorien. Die ersten vier – einschließlich der Mondscheingene – weisen Fold-Enrichments von mehr als 2,0 und Erwartungswerte von Null auf. Eine weitere Anreicherung erfolgt, wenn die RNY-Metrik mit der auf dem Entropiepunktprodukt basierenden Metrik kombiniert wird. Durch einfaches Summieren der beiden Metriken (um eine neue Metrik zu erstellen) konnten wir 20 von 35 Schwarzarbeitsgenen in Mycobacterium tuberculosis H37Rv finden, was einer fachen Anreicherung von 2,86 bei Erwartung Null entspricht. Dieselbe Metrik ergibt eine 2,58-fache Anreicherung (E = 0) für Schwarzlichtgene in E. coli und eine 2,25-fache Anreicherung in S. pneumoniae (bei E = 0,009).

Basierend auf den obigen Ergebnissen, die mit unserem Ansatz übereinstimmen (der besagt, dass Antisense-ORFs in Schwarzarbeitsgenen vorkommen könnten), haben wir beschlossen, in unseren drei Modellorganismen nach offenen Leserahmen in den umgekehrten Komplementen von Schwarzarbeitsgenen zu suchen. Bisher sind wir aufgrund der Purin-Voreingenommenheit im Leserahmen Null naiv davon ausgegangen, dass Antisense-Produkte im Leserahmen Null auf dem Komplementstrang vorhanden sein werden. (Wir gehen davon aus, dass es drei mögliche Leserahmen gibt: Null, + 1 und + 2. Diese Rahmen können auf jedem Strang vorhanden sein, relativ zum 5'-Terminus des Strangs.) Aber ist das wirklich eine vernünftige Erwartung? Aus rein theoretischen Gründen gehen wir davon aus, dass es drei mögliche Leserahmen in umgekehrter Richtung gibt, mit unterschiedlichen Auswirkungen auf die Überlappung von Codon-Informationen. Vorwärts- und Rückwärtsleserahmen können sich auf folgende Weise überlappen (Abb. 4):

Mögliche Leserahmenausrichtungen in Vorwärts- und Rückwärtssträngen. Pfeile geben die Leserichtung an; Die Zahlen „1 2 3“ geben die Positionen der Codonbasen an. „R“ bedeutet irgendein Purin; „n“ bedeutet jede Basis. Das „Rnn“-Muster ist repräsentativ für etwa 60 % der Codons in jedem Organismus und in allen Lebensbereichen. Die obere Konfiguration (A) zeigt beide Stränge im Leserahmen Null. In dieser Konfiguration richten sich die Basen 2 der Codons und Anticodons aus. In der mittleren Konfiguration (B) befindet sich der obere Strang im Leserahmen + 1 (relativ zum Anfang dieses Strangs), während sich der untere Strang im Leserahmen Null befindet. In dieser Ausrichtung liegt die Base 3 der Codons gegenüber der Base 3 der Anticodons. Beachten Sie jedoch, dass Base 2 gegenüber einem Purin steht, was bedeutet, dass Base 2 ein Pyrimidin ist. In der unteren Konfiguration (C) befindet sich der obere Strang im Leserahmen + 2 (oder entsprechend − 1), was bedeutet, dass Base eins der Codons gegenüber Base 1 der Anticodons liegt. Dies ist keine praktikable Ausrichtung, wenn sowohl Codon als auch Anticodon ein Purin in der ersten Basenposition haben. Siehe Text für weitere „Diskussion“.

In Abb. 4 sind komplementäre DNA-Stränge nebeneinander dargestellt, mit den Codonbasen mit der Nummer 1–2–3 auf dem unteren Strang (in dieser Darstellung von links nach rechts) und den Anticodonbasen mit der Nummer 3–2–1 auf dem unteren Strang Oberstrang (der von rechts nach links gelesen wird). Das Symbol „R“ steht für ein Purin; 'n' ist eine beliebige Basis. Pfeile stellen Leserichtungen dar. Oben im Diagramm, im Abschnitt mit der Bezeichnung „A“, sind die Stränge in der Art „2 über 2“ ausgerichtet: Base 2 des Codons liegt gegenüber Base 2 seines Anticodons. Dies ist die Ausrichtung, die auftritt, wenn der Translationsleserahmen für jeden Strang Null ist (Standardeinstellung). Der mit „B“ gekennzeichnete mittlere Teil des Diagramms zeigt die Codon/Anticodon-Ausrichtung, wenn sich der obere Strang im Leserahmen + 1 befindet. In diesem Fall überlappt Base 3 eines Codons Base 3 des anderen; eine sogenannte „3-über-3“-Orientierung. Das unterste Strangpaar (im Diagramm mit „C“ gekennzeichnet) zeigt die Situation, in der sich der untere Strang (wie üblich) im Leserahmen Null befindet, der obere Strang jedoch im Leserahmen + 2 (oder entsprechend − 1). Dadurch wird Base eins des Codons gegenüber Base eins des Anticodons platziert („1 über 1“-Konfiguration).

In einem Gen mit überlappenden ORFs ist die „1 über 1“-Konfiguration eindeutig nicht möglich, wenn jeder ORF einen hohen Purin-Bias aufweist, da ein Purin niemals gegenüber einem anderen Purin in der DNA auftreten kann. Daher gehen wir davon aus, dass ein +2-Antisense-Leserahmen selten vorkommt. Es könnte existieren, aber nur, wenn ein ORF einen geringen Purin-Bias und der andere Strang einen hohen Purin-Bias aufweist; oder wenn beide Stränge einen Purin-Bias von 50 % aufweisen.

Die obere Konfiguration (2 über 2), bei der sich beide Stränge im Leserahmen Null befinden, ist zumindest haltbar, da ein hoher Puringehalt in Base eins beider Stränge durch einen entsprechend hohen Pyrimidingehalt in Base drei ausgeglichen werden kann. Dies ist möglich, da Basis drei größtenteils entartet ist; Der Bedarf an einem Pyrimidin in der dritten Base ist mit geringen Kosten verbunden. Dennoch bedeutet „2 über 2“, dass, wenn Base zwei in einem ORF überwiegend aus Purinen besteht, es im anderen ORF überwiegend aus Pyrimidinen bestehen muss. Wenn also der untere Strang ein hydrophiles Polypeptid kodiert, kodiert der obere Strang wahrscheinlich ein hydrophobes – ein Membranprotein.

Die mittlere Konfiguration (3 über 3), bei der sich der obere Strang im Leserahmen + 1 befindet, ermöglicht eine hohe Purin-Voreingenommenheit in beiden Strängen gleichzeitig, wenn Base zwei jedes Codons ein Pyrimidin ist. Entscheidend ist, dass jeder ORF ein Polypeptid mit einem hohen Gehalt an unpolaren Aminosäuren kodieren muss. (Der genetische Code ist so angeordnet, dass ein Pyrimidin in der zweiten Base sehr wahrscheinlich eine unpolare Aminosäure bedeutet.) Dies wiederum bedeutet, dass es sich bei beiden Translationsprodukten wahrscheinlich um Membranproteine ​​handelt.

Zusammenfassend gehen wir davon aus, dass, wenn ein Antisense-ORF in einem Gen vorhanden ist, dieser nur selten im Leserahmen + 2 liegt; es kann im Frame Null sein; und es ist ziemlich wahrscheinlich, dass es im +1-Rahmen liegt, insbesondere wenn Membranproteine ​​die Translationsprodukte sind.

Aus den obigen logischen Schlussfolgerungen ergibt sich die folgende Frage: Wie können wir nach Antisense-ORFs suchen? Wo werden sie beginnen? Die triviale Antwort lautet: Sie beginnen mit einem Startcodon; und sie erfüllen die Anforderung eines ORF, nämlich:

Dem Startcodon sollte etwas vorangehen, das einer Shine-Dalgarno-Sequenz ähnelt.

Das Startcodon sollte ATG oder vielleicht GTG sein.

Auf das Startcodon sollte eine (entsprechend große) Anzahl von Codons folgen, die in der ersten Base einen deutlichen Purin-Bias aufweisen.

Und die Codonsequenz sollte in einem Stoppcodon (TAA, TAG oder TGA) enden.

Eine Suche nach solchen Strukturen kann durchgeführt werden, indem man das umgekehrte Komplement eines Gens erhält und es mit einem regulären Ausdruck abgleicht, wie zum Beispiel:

Dieser Ausdruck ermöglicht eine Suche nach 14 beliebigen Basen, gefolgt von ATG oder GTG, gefolgt von einem oder mehreren Tripletts, die kein Stoppcodon enthalten, gefolgt von drei Basen. (Das „g“ am Ende bedeutet einfach, global zu suchen und mehrere Ergebnisse zu melden.) Der 14-Basen-Leader kann auf Shine-Dalgarno-Motive (oder ein Proxy-Maß wie den Purin-Prozentsatz) überprüft werden, um Treffer mit geringer Qualität herauszufiltern. Um den übersetzbaren Teil eines Treffers zu erhalten, können die ersten 14 Basen einfach entfernt (oder ignoriert) werden. Treffer können eine beliebige Anzahl von Codons enthalten; Es ist Sache des Benutzers, eine geeignete Mindestgrenze festzulegen. Während der obige reguläre Ausdruck gute Ergebnisse liefert, stellen wir in der Praxis fest, dass bessere Ergebnisse erzielt werden, wenn man Folgendes verwendet:

Dieser Ausdruck sucht nach den kombinierten Start/Stopp-Motiven ATGA, TTGA und GTGA, die in führerlosen Genen aller drei unserer Modellorganismen häufig vorkommen (unveröffentlichte Daten). Die ersten drei Basen des Motivs bilden ein Startcodon; Die letzten drei Basen bilden das „Opal“-Stoppcodon, TGA. Wenn dieses Motiv in führerlosen Genen auftritt, stoppt die Übersetzung an der TGA und beginnt dann nach einem Frameshift von – 1 erneut.

Als wir mithilfe der Start/Stopp-Motiv-Regex nach mutmaßlichen Antisense-ORFs in den Moonlighting-Genen unserer drei Modellorganismen suchten, fanden wir Treffer in fast jedem Gen (siehe Tabelle 11). Die meisten Treffer (90/142 = 63,4 %) befanden sich wie vorhergesagt im +1-Leserahmen.

Während die Werte von R1 (durchschnittlicher Puringehalt, Base 1 der Codons) in den Treffern scheinbar recht niedrig sind, ist dies größtenteils auf die ungewöhnlich niedrigen R1-Werte des Leserahmens + 2 Treffer zurückzuführen, die die Durchschnittswerte nach unten ziehen. Wenn wir die R1-Werte nach Leserahmen betrachten (Tabelle 12), sehen wir, dass die R1-Werte für die Leserahmen Null und +1 relativ hoch sind. Höchstwahrscheinlich können der Leserahmen + 2 Treffer als falsch positive Ergebnisse angesehen werden. Einige falsch positive Ergebnisse treten wahrscheinlich auch in den Leserahmen Null und + 1 auf.

Eine Analyse von Y2 (Pyrimidingehalt, Base 2 der Codons) zeigt, dass Y2 im Leserahmen + 1 Treffer signifikant höher ist als in anderen Leserahmen (Tabelle 13), was mit unserer Vorhersage übereinstimmt (siehe vorheriger Abschnitt) und legt nahe, dass dies der Fall ist mutmaßliche Antisense-ORFs, die im Frame + 1 vorhanden sind, kodieren wahrscheinlich Membranproteine. Insgesamt stimmen die Ergebnisse in den Tabellen 11, 12 und 13 stark mit den theoretischen Vorhersagen des vorherigen Abschnitts überein.

Wir haben versucht, weitere Erkenntnisse darüber zu gewinnen, ob die Translationsprodukte mutmaßlicher Antisense-ORFs, die in Schwarzlichtgenen vorkommen, tatsächlich Membranproteine ​​kodieren könnten. Zu diesem Zweck haben wir mithilfe regulärer Ausdrücke nach Treffern in der Antisense-Richtung gesucht, basierend auf:

Der obige Ausdruck verwendet ATG als mutmaßliches Startcodon. Wir verwendeten jedoch auch Ausdrücke, die die Startcodons TTG, GTG und CTG sowie die alternativen Startcodons ATA, ATT, ATC und TAC enthielten, basierend auf einer Untersuchung der Startcodons in den annotierten Genen unserer drei Modellorganismen. Die drei Modellorganismen nutzen alle diese Startcodons (gemäß den annotierten RefSeq-Genomen). Wir haben für jedes Startcodon separate Regex-Suchen durchgeführt. Sobald mutmaßliche ORFs gefunden wurden, übersetzten wir die ORFs in silico und übermittelten die resultierenden Polypeptidsequenzen an die Server-App Consensus Constrained TOPology (CCTOP) unter http://cctop.ttk.hu/. CCTOP ist eine Webanwendung, die einen konsensbasierten Ansatz zur Vorhersage von Transmembrantopologien verfolgt. Mithilfe von 10 verschiedenen Methoden zur Topologievorhersage integriert CCTOP zuvor ermittelte Struktur- und Topologieinformationen in ein probabilistisches Hidden-Markov-Modell. Seine Zuverlässigkeit (in Bezug auf weniger falsch positive und falsch negative Ergebnisse) hat sich insgesamt als besser erwiesen als HMMTOP, Phobius oder jede andere einzelne Transmembran-Vorhersagetechnologie, die allein verwendet wird. Einzelheiten finden Sie auf der CCTOP-Website oder in Dobson et al.6.

CCTOP sagte Transmembrandomänen in sieben Antisense-ORFs aus Schwarzlichtgenen von M. tuberculosis voraus (Tabelle 14). Einige der ORFs überschnitten sich. Beispielsweise wurde festgestellt, dass die Glutaminsynthetase-Untereinheit A1 (glnA1) einen mutmaßlichen Antisense-ORF mit den Startcodons ATG und TTG an den Offsets 613 und 625 enthält. Ebenso wurde festgestellt, dass rpoB einen Antisense-ORF mit drei eng beieinander liegenden Startcodons enthält.

Fünfzehn Mondscheingene von E. coli ergaben 49 asORFs mit vorhergesagten Transmembrandomänen (Tabelle 15). Die Gene waren: aceB, dnaK, eno, fusA, gapA, glcB, gpmB, gpmM, murI, pfkA, pfkB, pgi, rpoB, sodC und tuf. Auch hier überlappen sich wie bei Mycobacterium tuberculosis H37Rv viele der Treffer: Beispielsweise existieren in fusA Startcodons für scheinbar einen einzelnen Antisense-ORF an den Offsets 682, 697 und 709. Bemerkenswerterweise enthält rpoB mindestens vier eng beieinander liegende „Startcodons“ in einem mutmaßlichen Antisense-ORF, der insgesamt 2892 Basen umfasst.

Es wurde festgestellt, dass zehn Moonlighting-Gene von Streptococcus pneumoniae mutmaßliche asORFs mit vorhergesagten Transmembrandomänen aufweisen (Tabelle 16). Sechs der zehn Gene haben asORFs, die mehrere mutmaßliche Startcodons enthalten.

Interessanterweise erzielten alle drei Organismen eine Transmembranvorhersage für Antisense-ORFs in rpoB (DNA-gesteuerte RNA-Polymerase-Untereinheit Beta) sowie fba (Fructose-Bisphosphat-Aldolase) und dnaK (Chaperon DnaK). Bemerkenswert ist, dass von den insgesamt 89 Transmembrandomänen-Vorhersagen, die in den drei Modellorganismen durchgeführt wurden, 49 (55,1 %) im Leserahmen + 1 und nur 8 im Leserahmen + 2 liegen. Die meisten mutmaßlichen Antisense-ORFs in den Tabellen 14, 15 und 16 sind klein (mit mittleren Längen zwischen 65 Aminosäuren in Streptococcus und 92 in E. coli). Dies ist nicht überraschend, wenn man bedenkt, dass neuere Arbeiten7 zeigen, dass Gene, die für kleine (< 100 AA) Proteine ​​kodieren, 16 % (± 9 %) aller Proteine ​​in Bakterien ausmachen könnten, wobei viele dieser Gene an Membranproteinen beteiligt sind und einige in Antisense kodiert sind8 . Allerdings sind nicht alle transmembranhaltigen asORFs klein. Der größte mutmaßliche transmembranhaltige Antisense-ORF, den wir in E. coli gefunden haben, ist 2892 Basen lang und kommt in rpoB vor.

In dieser Studie untersuchten wir den Vorwärts- und Rückwärtskomplement-Purin-Bias in der ersten Base von Codons (und Anticodons) und stellten fest, dass die meisten Schwarzarbeitsgene (nicht nur bei M. tuberculosis, sondern auch bei E. coli und Streptococcus pneumoniae) punkten deutlich über dem CDS-Genom-Durchschnitt für Vorwärts- und Rückwärts-Purin-Bias. Basierend auf diesem Befund gingen wir vorläufig davon aus, dass Antisense-Translationsprodukte möglicherweise in Schwarzarbeitsgenen kodiert sind. Dies führte uns zu der Hypothese, dass Codons, die dem Muster RNY (Purin, beliebige Base, Pyrimidin) entsprechen, in relativer Häufigkeit in Schwarzarbeitsgenen vorkommen könnten. Und tatsächlich haben wir herausgefunden, dass wir durch die Bewertung aller Gene eines Organismus nach dem „RNY-Gehalt“ eine Anreicherung für nebenberufliche Gene erreichen konnten: Wir erhielten bei den drei Modellorganismen eine fache Anreicherung von 2,29–2,58 bei hypergeometrischen Erwartungen von null bis 0,002 . Wir kamen zu dem Schluss, dass, wenn Informationen in zumindest einigen Teilen von Schwarzarbeitsgenen bidirektional kodiert werden, dies zur Folge hätte, dass degenerierte Codonbasen (Base 1, Base 3) die Informationslast so aufnehmen müssten, dass Informationen im Wesentlichen vorhanden sind gemultiplext. Um diese Möglichkeit zu testen, haben wir eine Heuristik entwickelt, die auf der Idee basiert, dass Codoninformationen entlang der RY- und SW-Achse unterschiedlich codiert werden können. (RY bezieht sich auf die IUPAC-Mehrdeutigkeitsachse von Purin gegenüber Pyrmidin; SW bezieht sich auf die Achse von GC gegenüber AT.) Wir haben die Shannon-Entropie der Basis 1 in der RY-Achse und die Shannon-Entropie der Basis 3 in dieser Achse für jedes Gen bewertet. Mit diesen Zahlen haben wir einen Vektor [HRY1, HRY3] erstellt. Auf ähnliche Weise haben wir einen Vektor [HSW1, HSW3] für die SW-Entropien der Basen 1 und 3 erstellt. Anschließend haben wir das Skalarprodukt der so erstellten Vektoren berechnet und eine Metrik von 1−dotProduct zum Sortieren der Gene verwendet. Diese Metrik führte zu einer erheblichen Anreicherung der Moonlighting-Gene bei M. tuberculosis, und die Kombination der RNY-Metrik plus der Skalarproduktmetrik führte zu einer signifikanten Anreicherung der Moonlighting-Gene in allen drei Organismen.

Ermutigt durch diese Erkenntnisse suchten wir nach offenen Antisense-Reading-Frames (asORFs) in Mondschein-Genen und fanden 142 davon in 81/86 Mondschein-Genen in den drei Modellorganismen. Wir haben aus rein theoretischen Gründen vorhergesagt, dass die meisten Antisense-Transkripte im Leserahmen + 1 liegen würden; und tatsächlich war dies der Fall (90 von 142 asORFs waren + 1). Wir haben auch vorhergesagt, dass asORFs im +1-Rahmen hauptsächlich Pyrimidine in der zweiten Base der Codons enthalten würden. Dies war auch der Fall. Der durchschnittliche Y2-Gehalt (Pyrimidin, Base 2) von asORFs im Leserahmen + 1 lag zwischen 0,6309 und 0,7046. Da ein Codon mit Pyrimidin in Base 2 normalerweise eine unpolare Aminosäure angibt, gingen wir davon aus, dass asORFs des Schwarzlichtgens Membranproteine ​​kodieren könnten. Als wir die Translationsprodukte der mutmaßlichen asORFs auf Transmembrandomänen überprüften, wurde vorhergesagt (vom CCTOP-Vorhersageserver unter https://cctop.ttk.hu/), dass 89 solcher Proteinprodukte Transmembrandomänen enthalten.

Basierend auf diesen Erkenntnissen und auf der Grundlage unserer Feststellung, dass Schwarzarbeitsgene dazu neigen, sich zusammen mit Genen zu befinden, die am Aufbau von Zellwänden oder Zellmembranen beteiligt sind (siehe den Abschnitt „Lage von Schwarzarbeitsgenen“ weiter oben), schlagen wir das in gezeigte Modell für Schwarzarbeit vor Abb. 5, das wir das THX1138-Modell nennen, benannt nach dem Protagonisten von George Lucas‘ erstem Film („THX1138“), in dem der Held – gefangen in einer unterirdischen Dystopie – an die Oberfläche des Planeten flüchtet, wo er Sonnenlicht sieht zum ersten Mal.

Ein mögliches Szenario, bei dem es um die Übersetzung eines Schwarzarbeitsgens geht. Die Transkription erfolgt bidirektional (siehe grüne Kugeln oben, die die RNA-Polymerase darstellen). „Falsche“ RNAPs an den Enden des Moonlighting-Gens produzieren Antisense-Produkte, die membranfreundliche Polypeptide enthalten, die möglicherweise über Transertion (möglicherweise aber auch über einen anderen Mechanismus) mit der Membran assoziieren. Die membranfreundlichen Antisense-Produkte sorgen für eine feste Verankerung in der DNA. In der Gegend wird intensiv an der Zellwandkonstruktion gearbeitet; Das bedeutet, dass es Lücken in der Wand gibt. Das Moonlighting-Gen ist an beiden Enden durch Übergangsbänder verankert und wird in unmittelbarer physischer Nähe zum offenen Abschnitt der Wand gehalten. Ein neu produziertes Mondscheinprotein passiert, wenn es sich von seinem Ribosom löst, problemlos den Spalt in der Zellwand. Es könnte tatsächlich sein, dass es nirgendwo anders hingehen kann. Siehe Text für weitere „Diskussion“.

Durch die bidirektionale Transkription des Moonlighting-Gens entstehen entstehende Antisense-Proteine, die an der Membran haften. (Diese Hypothese basiert auf unserer Feststellung, dass die fraglichen Antisense-Proteine ​​häufig mutmaßliche Transmembrandomänen enthalten.) In der Wachstumsphase ist die Translation transkriptionell gekoppelt, sodass die DNA im Wesentlichen an die Membran gebunden ist, wenn die entstehenden Antisense-Proteine ​​bei der Herstellung an der Membran haften bleiben. Gene unmittelbar vor und nach dem Moonlighting-Gen können auch über Antisense-Transertions-Tethers verfügen, die durch denselben Mechanismus gebildet werden. (Beweise für Transertion Tethering der hier erwähnten Art wurden für eine Reihe von Bakterienarten dokumentiert; siehe die Übersicht von Woldringh8). Wir nehmen an, dass die Verankerung der DNA an der Membran auf diese Weise (möglicherweise) ein weit verbreitetes Phänomen ist, an dem möglicherweise Hunderte von Genen beteiligt sind. (Diese Ansicht steht im Einklang mit neueren Forschungen zu kleinen Proteinen in Bakterien9, von denen viele über ORFs verfügen, die in überlappenden Leserahmen vorliegen10, oft im Antisense11). Im Bereich zwischen den Enden des Gens findet möglicherweise ein intensiver Zellwandaufbau statt, und wir gehen davon aus, dass es Bereiche gibt, in denen beträchtliche (~ 10–30 nm) Lücken bestehen – Bereiche, in denen eine Überbrückung der Lücke durch übergangsgebundene DNA möglich ist Tatsächlich handelt es sich um eine wesentliche strukturelle Verstärkung, um zu verhindern, dass sich die geschwächte Wand katastrophal öffnet. Mittlerweile sind die Lücken in der Unterkonstruktionswand groß genug, dass ganze Proteine ​​ungehindert passieren und unter dem Turgordruck gewaltsam herausgedrückt werden können.

Unabhängig davon, ob Antisense-Proteine ​​produziert werden, lässt sich das Entweichen von Moonlighting-Proteinen an die Zelloberfläche ganz einfach dadurch erklären, dass die Produktion von Moonlighting-Proteinen in unmittelbarer Nähe von Bereichen mit intensiver Zellwand- und Zellmembrankonstruktion erfolgt. Eine einfache Leckage-Hypothese ist nicht nur gerechtfertigt, sondern überzeugend – und erklärt leicht, warum noch nie ein Sekretionssystem an der ECP-Freisetzung beteiligt war. „Nicht-klassische Sekretion“ ist einfach eine günstige Leckage. Kompliziertere Erklärungen sollten nicht weiterverfolgt werden, bis einfache ausgeschlossen wurden (Occams Rasiermesser). Die Sparsamkeit schreibt vor, dass wir vor anderen über eine Leakage-Theorie nachdenken sollten; Die Beweislast liegt bei denen, die auf komplexeren Erklärungen bestehen. Angesichts des Turgordrucks von 5–30 Atmosphären, der in einer Bakterienzelle herrscht12, könnten Genprodukte, die in der Nähe eines „Lochs in der Wand“ produziert werden, durchaus mit Gewalt durch das Loch gedrückt werden, so wie ein Passagier nach einer explosiven Dekompression aus dem Fenster eines Verkehrsflugzeugs geschleudert wird auf 30.000 Fuß.

Das THX1138-Modell (günstige Leckage unterstützt durch erzwungene Nähe durch die Wirkung membrangebundener Polysomen) erklärt eine Reihe von Aspekten des „Nebenjobs“, die sich 30 Jahre lang der Erklärung entzogen haben:

Es erklärt, warum funktionell nicht verwandte Enzyme (glykolytische Enzyme, Chaperone, Elongationsfaktoren, Superoxiddismutasen usw.) beteiligt sind. Sie haben etwas gemeinsam: Ihre Antisense-Produkte sind reich genug an unpolaren Aminosäuren, um an der Membran zu haften.

Es erklärt, wie Mondscheingene vom ECP-Typ eine Ausscheidung erreichen: Mit Hilfe des Turgordrucks werden sie durch Löcher im unter dem Aufbau befindlichen Membran-/Wandkomplex herausgedrückt, da sie genau an der richtigen Stelle produziert werden, damit dies geschieht, und zwar ohne -polare Antisense-Proteine, die das Gen in besonders porösen Bereichen an der Membran verankern.

Dies erklärt, warum einige Proteine ​​aus demselben Operon ausgeschieden werden, andere jedoch nicht. Einige Glykolyse-Gene könnten beispielsweise Antisense-Produkte produzieren, die an der Zellmembran haften, während andere überhaupt keine Antisense-Produkte haben (oder Produkte, die zu kurz oder zu polar sind, um die Rolle des „Anhaftens an der Membran“ zu erfüllen). .

Dies erklärt, warum Boël et al.13 durch die Modifikation des 3'-Endes des GAPDH-Gens in Streptokokken die Ausscheidung von GAPDH verhindern konnten. Eine Modifikation des 3'-Endes des Gens könnte leicht die Membranbindungseigenschaften des Antisense-Produkts eines Gens verändern. Es könnte die Übersetzbarkeit von Antisense-Produkten verringern oder ganz verhindern.

Dies erklärt, warum sich Mondscheingene neben Genen für den Aufbau von Membranen und Zellwänden befinden: Sie (oder vielmehr ihre Antisense-Produkte) spielen eine Rolle dabei, die Membran während des Aufbaus zusammenzuhalten.

Unsere Theorie umfasst zwei Hypothesen: Die eine besagt, dass es zu einem Austritt von Mondscheinproteinen an Bereichen mit aktivem Zellwand-/Membranaufbau kommt. Der andere Grund ist, dass ein solches Austreten (falls es auftritt) durch membranfreundliche Antisense-Proteine ​​erleichtert wird, die (während der kotranskriptionellen Übersetzung) im Wesentlichen Mondscheingene an die Zellwand/Membran binden. Während es möglich ist, dass Mondscheinproteine ​​an Bereichen mit aktiver Zellwand-/Membrankonstruktion vorbei austreten, ohne dass die Anbindung von DNA an die innere Membran durch Antisense-Proteine ​​unterstützt wird, gehen wir davon aus, dass die Anbindungen (sofern vorhanden) möglicherweise dazu führen Seien Sie in der Tat wichtig, wenn es darum geht, „die Tür offen zu halten“.

Hunderte von Genen bereichern sich gleichzeitig mit Nebengenen, wenn eine Bewertungsmetrik verwendet wird, die eine Bidirektionalität von Transkription und Übersetzung annimmt. Basierend auf unseren Anreicherungsexperimenten ist es wahrscheinlich, dass viele Gene Informationen auf beiden DNA-Strängen (zumindest in einigen Abschnitten) kodieren. Diese Situation wird natürlich durch die Degeneration des genetischen Codes ermöglicht. Durch Degeneration bleiben die meisten Punktmutationen auch „neutral“ (über synonyme Codons). Aber in einer Region mit bidirektionalem Informationsfluss ist die Neutralität zwangsläufig eingeschränkt. In einer Konfiguration, in der Codons und Anticodons um eine Base versetzt sind, mit Anticodons im Leserahmen + 1, bleibt die Neutralität in Base 3 erhalten, da in dieser Konfiguration Base 3 der Codons Base 3 der Anticodons überlappen wird (Abb. 4). In anderen Ausrichtungen überlappt Base 3 jedoch eine informationsreiche (degenerationsarme) Base, und synonyme Mutationen werden zwangsläufig seltener sein. Für große Regionen anwendbarer Gene gibt es möglicherweise keine „neutrale Mutation“. Aus theoretischen Überlegungen können wir mit Sicherheit vorhersagen, dass ein Versatz des Antisense-ORF um +1 die neutralitätserhaltendste Ausrichtung sein wird, da dadurch die Base 3 der Codons mit der Base 3 der Anticodons ausgerichtet wird. Für Organismen mit relativ hohen Codon-Shannon-Entropien, also Organismen mit einem durchschnittlichen G + C-Gehalt von nahezu 50 %, ist dies die Ausrichtung, die den größten Schutz gegen nicht-synonyme Mutationen bietet. Organismen mit deutlich höherem oder niedrigerem GC-Gehalt verfügen über mehr „Informationsspielraum“ in ihren Codons (aufgrund der GC- oder AT-Redundanz) und können daher möglicherweise Antisense-Leserahmen-Offsets von Null oder + 2 tolerieren. Auf dieser Grundlage würden wir vorhersagen dass Organismen mit sehr niedrigem GC möglicherweise keine asORFs haben, die zugunsten des + 1-Antisense-Offsets voreingenommen sind; Es werden auch andere Offsets verwendet. Dennoch sind Gene mit signifikantem bidirektionalem Informationsgehalt (unabhängig vom ORF-Framing) weniger tolerant gegenüber Punktmutationen und es ist daher zu erwarten, dass sie sich langsam entwickeln und als „hochkonservierte Gene“ erscheinen, die einer reinigenden Selektion unterzogen werden. Kimuras ursprüngliche „neutrale Theorie“14 konzentrierte sich nicht direkt auf Punktmutationen; Es wurde lediglich davon ausgegangen, dass die meisten „Mutationen“ kaum oder gar keine Auswirkungen auf die Phänotypen haben. Dennoch stellt die Existenz bidirektionaler Informationen in zumindest einigen Genen eine wichtige Fußnote jeder Diskussion über mutationsbasierte Evolution dar. Synonym- und nicht-synonyme Mutationsraten, Transversions-/Übergangsverhältnisse und andere Dynamiken müssen im Hinblick auf die Bidirektionalität (oder Nicht-Bidirektionalität) verschiedener Genregionen sorgfältig abgewogen werden. Die Anforderungen der bidirektionalen Evolution können der Codon-Zusammensetzung ungewöhnliche Einschränkungen auferlegen.

Da unser Modell es uns ermöglicht, Metriken zu konstruieren, die die Schwarzarbeitsgene kontinuierlich anreichern, ermöglicht es die Vorhersage der Schwarzarbeitsfunktionalität in Genen, die noch keine solchen Zuweisungen erhalten haben. In Tabelle 17 stellen wir neun solcher Vorhersagen vor, die Gene repräsentieren, die sich in allen drei unserer Modellorganismen durchweg mit den Mondscheingenen anreichern. Wir gehen davon aus, dass einige oder alle dieser neun Gene „Schwarzarbeiter“ vom ECP-Typ sind. Dies sind Gene, die in unseren Anreicherungsexperimenten konsistent vorkommen, und zwar in allen drei Modellorganismen.

Obwohl es für uns offensichtlich unmöglich ist, die sekundäre Funktion eines dieser Gene vorherzusagen, würden wir zumindest erwarten, dass die fraglichen Genprodukte extrazellulär existieren (entweder auf der Oberfläche von Zellen oder in B. des Kulturüberstands), über den „günstigen Leckage“-Mechanismus.

Eine wichtige Einschränkung unserer Studie besteht darin, dass wir nicht versucht haben, nach Antisense-ORFs zu suchen, die sich über Gengrenzen erstrecken. Wir gehen davon aus, dass einige solcher ORFs existieren, da etwa 15 % der Gene in jedem unserer Modellorganismen führerlose (angrenzende, in manchen Fällen überlappende) Gene sind, die polycistronisch transkribiert werden können. Wir haben auch nicht versucht, eine umfassende Suche nach Intra-Gen-Promotoren in den Antisense-Strängen von Schwarzlicht-Genen durchzuführen. Antisense-Intra-Gen-Promotoren sind in etwa 11 % der Gene von M. tuberculosis vorhanden (basierend auf unseren unveröffentlichten Daten), und wir glauben, dass diese Promotoren eine Rolle bei der Modulation der Expression von asORFs spielen könnten. Upstream-Antisense-Promotoren könnten auch in den Nachbarn von Schwarzarbeitsgenen existieren. Dies ist ein Bereich für weitere Forschung.

Unsere Anreicherungen für Nebenjob-Gene waren zwar mäßig erfolgreich (mit Fold-Anreicherungen von 2,0–3,0), konnten jedoch nicht alle Nebenjob-Gene „finden“. Es ist also fair zu fragen, warum nicht? Warum haben sich nicht alle Schwarzarbeiter bereichert? Wir glauben, dass es mehrere mögliche Antworten gibt. Erstens berücksichtigten unsere Metriken keine Effekte, die Antisense-ORFs betreffen könnten, die Gengrenzen überschreiten (wie oben erwähnt), und es ist möglich, dass solche Effekte wichtig sein könnten. Wir glauben, dass Moonlighting schließlich ein Tramping-Phänomen ist, das aus der Tendenz bestimmter Chaperone, Stoffwechselgene und anderer entsteht, im Verlauf vieler syntenischer Crossover-Ereignisse und / oder oder andere Genverlagerungsereignisse. Es wäre sinnvoll, wenn Schwarzarbeit nicht nur mit Antisense-Produkten zusammenhängt, die von Schwarzarbeit-Genen selbst stammen, sondern auch von benachbarten Genen. Es kann auch sein, dass einige nebenberufliche Gene stille Sekretionspartner in Form von hypothetischen Proteinen haben. Dies könnte insbesondere für M. tuberculosis gelten, wo die Anreicherungsstatistiken im Allgemeinen schwächer waren als für E. coli oder S. pneumonia. Bei M. tuberculosis häufen sich Schwarzarbeitsgene häufiger als bei den anderen beiden Organismen in der Nähe hypothetischer Proteingene, da dieser Organismus 26,9 % hypothetische Proteingene aufweist, gegenüber 5,5 % bei E. coli und 9,7 % bei Streptokokken. Aber die Antwort auf die Frage „Warum haben sich nicht alle Schwarzarbeitsgene angereichert?“ könnte noch einfacher sein. Unsere Anreicherungssonden waren bei der Anreicherung vieler anderer Genkategorien wirksam (z. B. Gene für ribosomale Proteine, Zellwandbiogenese, Fettsäuresynthese, Transporter, Permeasen und andere), was darauf hindeutet, dass Antisense-ORFs mit dem Potenzial zur Produktion kleiner Membranproteine ​​extrem sein könnten häufig, etwa 20 % aller Gene betroffen. Unsere Techniken haben all diese Gene angereichert, sodass eine Verwässerung unserer Nebenernte unvermeidlich war.

Generell besteht eine Einschränkung der aktuellen Studie darin, dass wir keine Nasslaboruntersuchungen durchgeführt haben, um festzustellen, ob Antisense-ORFs tatsächlich übersetzt werden, und auch nicht die Ribosomenprofilierungsdaten online durchsucht haben, um zu sehen, ob einer dieser ORFs in hoher Qualität entdeckt wurde -Durchsatzprofilierung. Wir haben Antisense-ORFs mithilfe der unserer Meinung nach branchenüblichen ORF-Aufruflogik identifiziert, können jedoch keine Aussage darüber machen (und werden dies auch nicht tun), ob diese ORFs tatsächlich in vivo übersetzt werden. Wir laden andere Forscher ein, diesen Bereich weiter zu verfolgen.

In dieser Studie haben wir herausgefunden, dass Mondscheingene von drei Modellorganismen (Mycobacterium tuberculosis H37Rv, Escherichia coli NCTC11775 und Streptococcus pneumoniae NCTC11032) dazu neigen, sich auf dem Genom in der Nähe von Genen zu befinden, die an der Zellwandbiogenese, -sekretion und der inneren oder äußeren Zellwand beteiligt sind Synthese der äußeren Membran. Wir konnten eine einfache bioinformatische Sonde entwickeln, die das Potenzial für Reverse Transkription und Antisense-Translation quantifiziert, und haben herausgefunden, dass eine solche Sonde es uns ermöglicht, nebenbei arbeitende Gene mithilfe einer unkomplizierten Anreicherungsassay-Technik zu entdecken. Basierend auf theoretischen Überlegungen haben wir vorhergesagt, dass, wenn offene Antisense-Leserahmen in Schwarzlichtgenen existieren würden, diese höchstwahrscheinlich in den Leserahmen Null oder + 1 existieren würden; Frame + 2 wäre wahrscheinlich nicht gut ausgenutzt. Wir haben auch vorhergesagt, dass alle ORFs, die sich im Leserahmen + 1 befinden, Proteine ​​mit einem hohen Prozentsatz an unpolaren Aminosäuren kodieren würden. Wir konnten diese Vorhersagen bestätigen. Als wir nach Antisense-ORFs in Moonlighting-Genen suchten, fanden wir 142 mutmaßliche ORFs in den drei Modellorganismen, von denen sich 90 im Leserahmen + 1 befanden. Darüber hinaus wiesen die 90 Antisense-ORFs des Leserahmens + 1 einen vergleichsweise hohen Anteil an unpolaren Aminosäuren auf Inhalt. Als wir die mutmaßlichen Translationsprodukte von Antisense-ORFs mithilfe des CCTOP-Transmembran-Vorhersageservers überprüften, stellten wir fest, dass sieben Translationsprodukte von M. tuberculosis, fünfzehn Produkte von E. coli und zehn Produkte von S. pneumoniae vorhergesagte Transmembrandomänen enthielten. Es wird erwartet, dass es sich bei den meisten verbleibenden Produkten um Membranproteine ​​handelt, die auf einem hohen Gehalt an unpolaren Aminosäuren basieren. Basierend auf diesen Erkenntnissen stellten wir ein Modell vor, das eine Rolle von Antisense-Membranproteinen bei der Bindung von Moonlighting-Genen an die bakterielle Innenmembran in Bereichen mit aktivem Zellwandaufbau vorschlägt. Da Mondscheinproteine ​​in „erzwungener Nähe“ zu porösen Bereichen der neuen Zellwand produziert werden und der Turgordruck in Bakterienzellen extrem ist (5–30 Atmosphären), entweichen Mondscheinproteine ​​durch Lücken in der Wand aus der Zelle , ist (wir glauben) unvermeidbar. Mit unserem Modell können wir vorhersagen, dass bestimmte Proteine ​​(von denen bisher noch nicht festgestellt wurde, dass sie Schwarzbrenner sind) wahrscheinlich eine extrazelluläre Rolle spielen werden. Daher haben wir spezifische Vorhersagen für neun Gene gemacht: rpoC, gyrA, gyrB, LigA, typA, ptsP, infB, purH und aspS.

Die während der aktuellen Studie generierten und/oder analysierten Datensätze sind im Github-Repository verfügbar, [https://github.com/kasmanethomas/moonlighting] und [https://cctop.ttk.hu/].

Jeffery, CJ Moonlighting-Proteine. Trends Biochem. Wissenschaft. 24, 8–11. https://doi.org/10.1016/S0968-0004(98)01335-8 (1999).

Artikel CAS PubMed Google Scholar

Agarwal, V. et al. Streptococcus pneumoniae-Endopeptidase O (PepO) ist ein multifunktionales Plasminogen- und Fibronektin-bindendes Protein, das die Umgehung der angeborenen Immunität und die Invasion von Wirtszellen erleichtert. J. Biol. Chem. 288(10), 6849–6863. https://doi.org/10.1074/jbc.M112.405530 (2013).

Artikel CAS PubMed PubMed Central Google Scholar

Trifonov, EN, Kirzhner, A., Kirzhner, VM & Berezovsky, IN Unterschiedliche Stadien der Proteinevolution, wie durch Proteinsequenzanalyse nahegelegt. J. Mol. Entwicklung 53(4–5), 394–401. https://doi.org/10.1007/s002390010229 (2001).

Artikel ADS CAS PubMed Google Scholar

Götz, F. et al. Ausscheidung zytosolischer Proteine ​​(ECP) in Bakterien. Int. J. Med. Mikrobiol. 305(2), 230–237 (2015).

Artikel PubMed Google Scholar

Ponce-de-Leon, M., de-Miranda, AB, Alvarez-Valin, F. & Carels, N. Der Purin-Bias kodierender Sequenzen wird durch physikochemische Einschränkungen der Proteine ​​bestimmt. Bioinform. Biol. Erkenntnisse 8, 93–108. https://doi.org/10.4137/BBI.S13161 (2014).

Artikel PubMed Google Scholar

Dobson, L., Reményi, I. & Tusnády, GE CCTOP: Ein konsensbeschränkter TOPology-Vorhersage-Webserver. Nukleinsäuren Res. 43(1), W408–W412 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Miravet-Verde, S. et al. Entschlüsselung des verborgenen Universums kleiner Proteine ​​im Bakteriengenom. Mol. Syst. Biol. 15, e8290. https://doi.org/10.15252/msb.20188290 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Woldringh, CL Die Rolle der kotranskriptionellen Translation und Proteintranslokation (Transertion) bei der bakteriellen Chromosomensegregation. Mol. Mikrobiol. 45, 17–29 (2002).

Artikel CAS PubMed Google Scholar

Ardern, Z., Neuhaus, K. & Scherer, S. Sind Antisense-Proteine ​​in Prokaryoten funktionsfähig?. Vorderseite. Mol. Biowissenschaften. 7, 9. https://doi.org/10.3389/fmolb.2020.00187 (2020).

Artikel CAS Google Scholar

Kreitmeier, M. et al. Alternative Frame-Kodierung im Fokus: Zwei lange überlappende Gene in Pseudomonas aeruginosa werden translatiert und einer reinigenden Selektion unterzogen. iScience. 25, 2. https://doi.org/10.1016/j.isci.2022.103844 (2022).

Artikel CAS Google Scholar

Wright, BW, Molloy, MP & Jaschke, PR Überlappende Gene in natürlichen und manipulierten Genomen. Nat. Rev. Genet. 23, 154–168. https://doi.org/10.1038/s41576-021-00417-w (2022).

Artikel CAS PubMed Google Scholar

Bugg, TDH Bakterielle Peptidoglycan-Biosynthese und ihre Hemmung, in Comprehensive Natural Products Chemistry 241–294 (Pergamon, 1999). https://doi.org/10.1016/B978-0-08-091283-7.00080-1.

Buchen Sie Google Scholar

Boël, G., Jin, H. & Pancholi, V. Die Hemmung des Zelloberflächenexports der ankerlosen Oberflächendehydrogenase von Streptokokken der Gruppe A beeinflusst die Bakterienadhärenz und die antiphagozytischen Eigenschaften. Infizieren. Immun. 73, 6237–6248 (2005).

Artikel PubMed PubMed Central Google Scholar

Kimura, M. Evolutionsrate auf molekularer Ebene. Natur 217(5129), 624–626. https://doi.org/10.1038/217624a0 (1968).

Artikel ADS CAS PubMed Google Scholar

Xolalpa, W. et al. Identifizierung neuer bakterieller Plasminogen-bindender Proteine ​​im humanpathogenen Mycobacterium tuberculosis. Proteomics 7(18), 3332 (2007).

Artikel CAS PubMed Google Scholar

Ashiuchi, M., Kuwana, E., Komatsu, K., Soda, K. & Misono, H. Unterschiede in den Auswirkungen auf die DNA-Gyrase-Aktivität zwischen zwei Glutamat-Racemasen von Bacillus subtilis, dem Poly-Gamma-Glutamat-Synthese-verknüpfenden Glr-Enzym und das YrpC (MurI)-Isozym. FEMS Mikrobiol. Lette. 2, 221–235 (2003).

Artikel Google Scholar

Ashiuchi, M. et al. Glutamatracemase ist ein endogener DNA-Gyrase-Inhibitor. J. Biol. Chem. 224, 39070 (2002).

Artikel Google Scholar

Kunert, A. et al. Immunumgehung des Humanpathogens Pseudomonas aeruginosa: Der Elongationsfaktor Tuf ist ein Faktor-H- und Plasminogen-bindendes Protein. J. Immunol. 179(5), 2979–2988 (2007).

Artikel CAS PubMed Google Scholar

Kinhikar, AG et al. Die Malatsynthase aus Mycobacterium tuberculosis ist ein Laminin-bindendes Adhäsin. Mol. Mikrobiol. 60(4), 999–1013 (2006).

Artikel CAS PubMed Google Scholar

Wang, W. & Jeffery, CJ Eine Analyse der Ergebnisse der Oberflächenproteomik enthüllt neue Kandidaten für intrazelluläre/Oberflächen-Mondlichtproteine ​​in Bakterien. Mol. BioSyst. 12, 1420–1431 (2016).

Artikel CAS PubMed Google Scholar

Reddy, VM & Suleman, FG Mycobacterium avium-Superoxid-Dismutase bindet an Epithelzell-Aldolase, Glycerinaldehyd-3-phosphat-Dehydrogenase und Cyclophilin A. Microb. Pathog. 36, 67–74 (2004).

Artikel CAS PubMed Google Scholar

Enzo, E. et al. Die aerobe Glykolyse optimiert die Transkriptionsaktivität von YAP/TAZ. EMBO J. 34(10), 1349–1370. https://doi.org/10.15252/embj.201490379 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Yuan, W., Tuttle, DL, Shi, YJ, Ralph, GS und Dunn, WA Glucose-induzierte Mikroautophagie in Pichia pastoris erfordert die Alpha-Untereinheit der Phosphofructokinase. J. Cell Sci. 110, 1935–1945 (1997).

Artikel CAS PubMed Google Scholar

Daniely, D. et al. Pneumokokken-6-Phosphogluconat-Dehydrogenase, ein mutmaßliches Adhäsin, induziert bei Mäusen eine schützende Immunantwort. Klin. Exp. Immunol. 144, 254263 (2006).

Artikel Google Scholar

Antikainen, J., Kuparinen, V., Lähteenmäki, K. & Korhonen, TK Enolasen aus grampositiven bakteriellen Krankheitserregern und kommensalen Laktobazillen weisen funktionelle Ähnlichkeit in virulenzassoziierten Merkmalen auf. FEMS Immunol. Med. Mikrobiol. 51(3), 526–534. https://doi.org/10.1111/j.1574-695X.2007.00330.x (2007).

Artikel CAS PubMed Google Scholar

Castaldo, C. et al. Oberflächenverdrängte Alpha-Enolase von Lactobacillus plantarum ist ein Fibronektin-bindendes Protein. Mikrob. Zellfakt. 16(8), 14. https://doi.org/10.1186/1475-2859-8-14 (2009).

Artikel CAS Google Scholar

Knaust, A. et al. Zytosolische Proteine ​​tragen zur Rekrutierung von Oberflächenplasminogen von Neisseria meningitidis bei. J. Bakteriol. 189(8), 3246–3255 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Kinnby, B., Booth, NA & Svensater, G. Plasminogenbindung durch orale Streptokokken aus Zahnbelag und entzündlichen Läsionen. Mikrobiologie 154 (Teil 3), 924–931. https://doi.org/10.1099/mic.0.2007/013235-0 (2008).

Artikel CAS PubMed Google Scholar

Kesimer, M., Kili, N., Mehrotra, R., Thornton, DJ & Sheehan, JK Identifizierung von Speichelmucin-MUC7-Bindungsproteinen aus Streptococcus gordonii. BMC Mikrobiol. 9, 163 (2009).

Artikel PubMed PubMed Central Google Scholar

Kainulainen, V. et al. Glutaminsynthetase und Glucose-6-phosphat-Isomerase sind adhäsive Mondscheinproteine ​​von Lactobacillus Crispatus, die durch epitheliales Cathelicidin LL-37 freigesetzt werden. J. Bakteriol. 194(10), 2509–2519. https://doi.org/10.1128/JB.06704-11 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Candela, M. et al. Bindung von menschlichem Plasminogen an Bifidobacterium. J. Bakteriol. 189(16), 5929–5936. https://doi.org/10.1128/JB.00159-07 (2007).

Artikel CAS PubMed PubMed Central Google Scholar

Kinoshita, H. et al. Die Zelloberfläche von Lactobacillus plantarum LA 318 Glycerinaldehyd-3-phosphat-Dehydrogenase (GAPDH) haftet an menschlichem Dickdarmmucin. J. Appl. Mikrobiol. 104(6), 1667–1674. https://doi.org/10.1111/j.1365-2672.2007.03679.x (2008).

Artikel CAS PubMed Google Scholar

Basu, D. et al. Ein neues Nukleoid-assoziiertes Protein von Mycobacterium tuberculosis ist ein Sequenzhomolog von GroEL. Nukleinsäuren Res. 37, 4944–4954 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Bergonzelli, GE et al. GroEL von Lactobacillus johnsonii La1 (NCC 533) ist mit der Zelloberfläche assoziiert: Mögliche Rolle bei Interaktionen mit dem Wirt und dem Magenpathogen Helicobacter pylori. Infizieren. Immun. 74(1), 425–434 (2006).

Artikel CAS PubMed PubMed Central Google Scholar

Ensgraber, M. & Loos, M. Ein 66 Kilodalton schweres Hitzeschockprotein von Salmonella typhimurium ist für die Bindung des Bakteriums an den Darmschleim verantwortlich. Infizieren. Immun. 60(8), 3072–3078 (1992).

Artikel CAS PubMed PubMed Central Google Scholar

Garduo, RA, Garduo, E. & Hoffman, PS Oberflächenassoziiertes Hsp60-Chaperonin von Legionella pneumophila vermittelt die Invasion in einem HeLa-Zellmodell. Infizieren. Immun. 66(10), 4602–4610 (1998).

Artikel Google Scholar

Pantzar, M., Teneberg, S. & Lagergard, T. Die Bindung von Haemophilus ducreyi an Kohlenhydratrezeptoren wird durch das 58,5-kDa-Hitzeschockprotein GroEL vermittelt. Mikroben infizieren. 8(9–10), 2452–2458 (2006).

Artikel CAS PubMed Google Scholar

Wuppermann, FN, Melleken, K., Julien, M., Jantos, CA & Hegemann, JH Das GroEL1-Protein von Chlamydia pneumoniae ist mit der Zelloberfläche assoziiert und für die Infektion von HEp-2-Zellen erforderlich. J. Bakteriol. 190(10), 3757–3767. https://doi.org/10.1128/JB.01638-07 (2008).

Artikel CAS PubMed PubMed Central Google Scholar

Wiker, HG, Sletten, K., Nagai, S. & Harboe, M. Hinweise auf drei separate Gene, die die Proteine ​​des mykobakteriellen Antigen-85-Komplexes kodieren. Infizieren. Immun. 58, 272–274 (1990).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, G. et al. Die Rolle von Mondscheinproteinen in Bakterien. Curr. Ausgaben Mol. Biol. 16, 15–22 (2014).

PubMed Google Scholar

Alvarez, RA, Blaylock, MW & Baseman, JB Oberflächenlokalisierte Glycerinaldehyd-3-phosphat-Dehydrogenase von Mycoplasma genitalium bindet Mucin. Mol. Mikrobiol. 48(5), 1417–1425 (2003).

Artikel CAS PubMed Google Scholar

Winram, SB & Lottenberg, R. Das Plasmin-bindende Protein Plr von Streptokokken der Gruppe A wird als Glycerinaldehyd-3-phosphat-Dehydrogenase identifiziert. Microbiology 142 (Teil 8), 2311–2320 (1996).

Artikel CAS PubMed Google Scholar

Boone, TJ, Burnham, CA & Tyrrell, GJ Bindung der Phosphoglyceratkinase von Streptokokken der Gruppe B an Plasminogen und Aktin. Mikrob. Pathog. 51(4), 255–261. https://doi.org/10.1016/j.micpath.2011.06.005 (2011).

Artikel CAS PubMed Google Scholar

Blau, K. et al. Flamingo-Cadherin: Ein mutmaßlicher Wirtsrezeptor für Streptococcus pneumoniae. J. Infizieren. Dis. 195(12), 1828–1837 (2007).

Artikel CAS PubMed Google Scholar

Crowe, JD et al. Candida albicans bindet menschliches Plasminogen: Identifizierung von acht Plasminogen-bindenden Proteinen. Mol. Mikrobiol. 47(6), 1637–1651 (2003).

Artikel CAS PubMed Google Scholar

Kozik, A. et al. Fibronektin-, Vitronektin- und Laminin-bindende Proteine ​​an den Zellwänden der pathogenen Hefen Candida parapsilosis und Candida Tropicalis. BMC Mikrobiol. 15, 197 (2015).

Artikel PubMed PubMed Central Google Scholar

Referenzen herunterladen

Synevovet-Labor, Bukarest, Rumänien

Kasman E. Thomas & Elvira Gagniuc

Fakultät für Ingenieurwesen in Fremdsprachen, Universität Politehnica Bukarest, Bukarest, Rumänien

Paul A. Gagniuc

Fakultät für Veterinärmedizin, Universität für Agrarwissenschaften und Veterinärmedizin, Bukarest, Rumänien

Elvira Gagniuc

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

KET entwickelte das Design der Studie. KET und PAG verfassten den Hauptmanuskripttext und EG koordinierte die Studie und bereitete die Abbildungen vor. 1, 2 und 3. Alle Autoren haben das Manuskript überprüft.

Korrespondenz mit Paul A. Gagniuc.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Thomas, KE, Gagniuc, PA & Gagniuc, E. Moonlighting-Gene beherbergen Antisense-ORFs, die potenzielle Membranproteine ​​kodieren. Sci Rep 13, 12591 (2023). https://doi.org/10.1038/s41598-023-39869-x

Zitat herunterladen

Eingegangen: 07. Februar 2023

Angenommen: 01. August 2023

Veröffentlicht: 03. August 2023

DOI: https://doi.org/10.1038/s41598-023-39869-x

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein gemeinsam nutzbarer Link verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

AKTIE