Genexpressie vaak verkeerd geïnterpreteerd

RNA-seqHet blijkt dat onderzoekers die de genexpressie van een cel te bepalen door de RNA-moleculen te sequenciëren die in die cel voorkomen nogal eens in de fout gaan en daardoor tot verkeerde conclusies komen. Dergelijk onderzoek valt ook niet te reproduceren.
Toegegeven, de biologie is de laatste vijftig, zestig jaar steeds ingewikkelder geworden. Dat heeft alles te maken met het steeds verder doordringen van het biologisch onderzoek in het moleculaire domein. Om de genexpressie in een cel te bepalen wordt de RNA-seq-technologie gebruikt. Dan weet je welke genen actief zijn en welke niet (en ook hoe actief). Dat patroon van genactiviteit heet genexpressie. Onderzoekers van de universiteit van Tel Aviv moesten constateren dat onderzoekers daar nogal eens mee de fout in gaan.

De onderzoekers analyseerden tientallen openbaar beschikbare RNA-seq-gegevensverzamelingen, die de genetische reactie op verschillende vormen van stress moesten blootleggen. Ze constateerden dat met name korte en lange genen herhaaldelijk van expressie veranderden.
De onderzoekers rond Shiri Mandelbaum vroegen zich af of dat misschien een algemene biologische reactie is op veel verschillende prikkels of dat er iets mis is met de proeven. Daartoe grepen ze naar replicatie van de proef bij dezelfde omstandigheden. Verschillen daarbij wijzen op technische effecten die niks te maken hebben het het bekeken biologische verschijnsel. Ook daar kwam datzelfde patroon terug van de vaak wisselende expressie van korte en lange genen. Het probleem moest iets technisch zijn, concludeerden de onderzoekers, waarbij lengte van het gen een rol speelt.
Het is de bedoeling van het uitlezen van de RNA-moleculen in een cel om er achter te komen hoe die reageert op bepaalde prikkels. Bepaalde specifieke processen worden beheerst door eiwitten van korte en lange genen. Zo coderen veel korte genen voor eiwitten waaruit het ribosoom (de ‘eiwitfabriek’) is opgebouwd. Veel lange genen coderen voor eiwitten die deel uitmaken van de extracellulaire matrix die een cel structuur en vorm geven.

Foute informatie

Mandelbaum c.s. toonden aan dat in veel gegevensverzamelingen die lengteafwijking samen met wat fouten in de statistische analyses kunnen leiden tot verkeerde gevolgtrekkingen over specifieke biologische functies, met die over het ribosoom en het ECM inbegrepen, in reactie op geteste omstandigheden. Volgens Mandelbaum kan die ‘lengteafwijking’ uit de gegevens worden gewied terwijl je dan de werkelijke biologische gegevens over houdt.

De laatste jaren is er steeds meer onrust ontstaan over foute onderzoeksresultaten in de biologie (maar ook daarbuiten). Dat wordt de reproduceerbaarheidscrisis genoemd. Dit onderzoek legt er nog maar eens de nadruk op dat een onderzoeker voor het hanteren van zijn meetgegevens de juiste statistische technieken gebruikt (of laat hanteren, als zijhij het niet zelf kan).

Bron: Science Daily

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.