Calculer la moyenne des reads des cibles
Pour calculer la moyenne des reads des cibles spécifiées dans un fichier BED, vous pouvez utiliser plusieurs outils bioinformatiques. Un des outils les plus couramment utilisés pour manipuler et analyser les fichiers BED est bedtools
. Voici un guide Ă©tape par Ă©tape pour utiliser bedtools
afin de calculer la couverture moyenne des reads sur les régions cibles d'un fichier BED.
Installation de bedtools
bedtools
Avec conda :
Calculer le coverage
Indexer votre fichier BAM (si ce n'est pas déjà fait) :
Utiliser bedtools coverage
pour calculer la couverture :
VĂ©rification de l'Ă©tat de sortie et analyse
Après avoir exécuté la commande, la sortie devrait ressembler à ceci :
Dans cet exemple :
chr1 : Chromosome.
2370423173 : Début de la région (0-based, inclusif).
2370424198 : Fin de la région (1-based, exclusif).
RYR2 : Identifiant de la région.
10 : Nombre de reads qui chevauchent la région.
1000 : Nombre total de bases couvertes par des reads dans la région.
1025 : Longueur de la région (4198 - 3173).
0.975 : Fraction de la région couverte par des reads (1000 / 1025).
Calcul de la Moyenne de la Couverture
Pour calculer la moyenne de la couverture (nombre de reads) pour les régions spécifiées dans un fichier BED, vous pouvez utiliser awk
(installation ici):
Cette commande additionne toutes les valeurs de la cinquième colonne (nombre de reads couvrant chaque région) et divise par le nombre total de lignes pour obtenir la couverture moyenne.
Last updated