Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

mm9.download.sh / python3 / NOVA example / plans for mm39 update #3

Open
yannaubertcrct opened this issue Mar 25, 2024 · 0 comments
Open

Comments

@yannaubertcrct
Copy link

Hi,
I'm really interested to use RNAmotifs to analyze my differential splicing results however I'm encountering a number of issues with your software when trying to run it on the NOVA example.

Let's first start with the mm9.download.sh script.

yann.aubert@crct2121-Ubuntu:/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/m3_light/genomes$ ls -lht mm9
total 3,3G
-rwxr-xr-x 1 yann.aubert utilisateurs du domaine 2,6G mars 25 14:56 mm9.fasta
-rwxr-xr-x 1 yann.aubert utilisateurs du domaine 680M juil. 21 2007 mm9.2bit

  • I tried running this edited mm9.download.sh script with the original 'python' argument, which threw an error since I only have python3 installed.
  • After editing this edited mm9.download.sh script to use python3 instead of the original 'python' argument, I also run into an error. Here is a copy of the script used.
mkdir mm9
cd mm9
##wget http://hgdownload-test.cse.ucsc.edu/goldenPath/mm9/bigZips/mm9.2bit -O mm9.2bit
wget https://hgdownload.soe.ucsc.edu/goldenPath/mm9/bigZips/mm9.2bit -O mm9.2bit

## if not installed downaoload  http://hgdownload.cse.ucsc.edu/admin/exe/twoBitToFa 
../twoBitToFa mm9.2bit mm9.fasta -noMask

cd ../../
printf 'import m3_light\nm3_light.fastasplit("m3_light/genomes/mm9/mm9.fasta")' | python3
mv *.string m3_light/genomes/mm9
rm m3_light/genomes/mm9/mm9.fasta
rm m3_light/genomes/mm9/mm9.2bit

and the copy of the error I ran into.

Résolution de hgdownload.soe.ucsc.edu (hgdownload.soe.ucsc.edu)… 128.114.198.53
Connexion à hgdownload.soe.ucsc.edu (hgdownload.soe.ucsc.edu)|128.114.198.53|:443… connecté.
requête HTTP transmise, en attente de la réponse… 200 OK
Taille : 712923274 (680M)
Enregistre : ‘mm9.2bit’

mm9.2bit 100%[================================================================================================================>] 679,90M 16,3MB/s ds 41s

2024-03-25 14:56:51 (16,6 MB/s) - ‘mm9.2bit’ enregistré [712923274/712923274]

Traceback (most recent call last):
File "", line 1, in
File "/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAMotifs/m3_light/init.py", line 31
print index+1, motif
^^^^^^^^^^^^^^^^^^^^
SyntaxError: Missing parentheses in call to 'print'. Did you mean print(...)?
mv: impossible d'évaluer '*.string': Aucun fichier ou dossier de ce nom
rm: impossible de supprimer 'm3_light/genomes/mm9/mm9.fasta': Aucun fichier ou dossier de ce nom
rm: impossible de supprimer 'm3_light/genomes/mm9/mm9.2bit': Aucun fichier ou dossier de ce nom

As I do not code in Python, I'm having issues sorting out this error.

Regardless of this error I still tried to run RNAmotifs on the NOVA example that is provided using the following code:

#!/bin/bash

cd /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs

./RNAmotifs.edit.sh /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs NOVA_regulation NOVA.txt mm9 Mouse 2> /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/logs/TEST.log

Here's a copy of RNAmotifs.edit.sh

# Configuration
# --------------------

# Before running this script, please adjust folders (paths) in the r.config and n.config files.

# SET THE ABSOLUTE PATH TO RNAMOTIFS FOLDER
RNAmotifs=$1 # SET THE ABSOLUTE PATH TO RNAMOTIFS FOLDER

cd $RNAmotifs

export PYTHONPATH=$RNAmotifs

# SET THE NAME OF THE RNAMOTIFS RESULTS FOLDER
result_dir=$2

# SET THE ABSOLUTE PATH TO SPLICING CHANGE PATH
splicing_change_infile=$RNAmotifs/TEST/$3

species=$4 # set species

organism=$5 # either "Mouse" or "Human"

p_emp=0.0005

p_fisher=0.1


# Run
# --------------------

N_config="${RNAmotifs}/TEST/${result_dir}.n.config"
R_config="${RNAmotifs}/TEST/${result_dir}.r.config"

# writing gMotifs configuration files

rm $N_config $R_config

if [ ! -f "$N_config" ] ; then
         # if not create the file
         touch "$N_config"
fi

echo "organism=$organism" >> $N_config
echo "splicing_change_file=$splicing_change_infile" >> $N_config
echo "tetramer_folder=$RNAmotifs/tetramers/$result_dir" >> $N_config
echo "results_folder=$RNAmotifs/results/$result_dir" >> $N_config

cp $N_config $R_config

echo "search=N" >> $N_config
echo "search=R" >> $R_config

cat $N_config

cat $R_config

# prepare non-overlapping regions from splicing file

if [ -e m3_light/regions/$result_dir ] ; then
	echo "Dir already present"
else
	mkdir m3_light/regions/$result_dir
fi

python3 m3_light/regions/prepare_regions.py $splicing_change_infile m3_light/regions/$result_dir/overlapping.tab

python3 m3_light/regions/merge_overlapping_regions.py m3_light/regions/$result_dir/overlapping.tab m3_light/regions/$result_dir/$result_dir.tab

rm m3_light/regions/$result_dir/overlapping.tab


# find tetramers in the genome

echo "import m3_light" > tmp.py
echo "m3_light.find_tetramers('${result_dir}', '${species}')" >> tmp.py
python3 tmp.py
rm tmp.py

# move results to tetramers folder

mkdir tetramers
mkdir tetramers/$result_dir
mkdir tetramers/$result_dir/r
mkdir tetramers/$result_dir/nr
cp m3_light/results/$result_dir/motifs.final/pth_0.5/A* tetramers/$result_dir/nr
cp m3_light/results/$result_dir/motifs.final/pth_0.5/C* tetramers/$result_dir/nr
cp m3_light/results/$result_dir/motifs.final/pth_0.5/T* tetramers/$result_dir/nr
cp m3_light/results/$result_dir/motifs.final/pth_0.5/G* tetramers/$result_dir/nr
cp m3_light/results/$result_dir/motifs.final/pth_0.5/W* tetramers/$result_dir/r
cp m3_light/results/$result_dir/motifs.final/pth_0.5/Y* tetramers/$result_dir/r
cp m3_light/results/$result_dir/motifs.final/pth_0.5/S* tetramers/$result_dir/r
cp m3_light/results/$result_dir/motifs.final/pth_0.5/R* tetramers/$result_dir/r


# counting tetramer occurences in the genome

# couting: count the number of exons with tetramer occurrencies in the region of interest r1,r2,r3
# tetramer: calculate the positional specific tetramer occurrences along the RNA splicing map

mkdir results
mkdir results/$result_dir
./gMotifs/build/tetramer -c $N_config
./gMotifs/build/counting -c $N_config
./gMotifs/build/tetramer -c $R_config
./gMotifs/build/counting -c $R_config

# bootstrap and tetramer selection

cd R

Rscript bootstrap-FDR.R ../results $result_dir 10000

Rscript selection_of_tetramers.R ../results $result_dir 10000 $p_fisher $p_emp

Here's a copy of stdout

organism=Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=N
organism=Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=R
Dir already present

organism=Mouse
Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=N
N
Mouse: 1
Analysis folder: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/nr/
Search RSYW: N
dIRZ: 0.1
dIRO: 1
inExon: 50
inIntron: 200
Path SP: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
Path Tetra: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/nr/
Array rows: 32874

Motif Length: 0
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/nr/STATS.txt
Impossible open data file: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt

organism=Mouse
Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=N
N
Mouse: 1
Analysis folder: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/nr/
Search RSYW: N
dIRZ: 0.1
dIRO: 1
inExon: 50
inIntron: 200
Path SP: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
Path Tetra: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/nr/
Array rows: 32874

Motif Length: 0
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/nr/tetramers_files.txt
Impossible open data file: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt

organism=Mouse
Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=R
R
Mouse: 1
Analysis folder: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/r/
Search RSYW: R
dIRZ: 0.1
dIRO: 1
inExon: 50
inIntron: 200
Path SP: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
Path Tetra: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/r/
Array rows: 32874

Motif Length: 0
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/r/STATS.txt
Impossible open data file: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt

organism=Mouse
Mouse
splicing_change_file=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
tetramer_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation
results_folder=/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation
search=R
R
Mouse: 1
Analysis folder: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/results/NOVA_regulation/r/
Search RSYW: R
dIRZ: 0.1
dIRO: 1
inExon: 50
inIntron: 200
Path SP: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt
Path Tetra: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/r/
Array rows: 32874

Motif Length: 0
/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/r/tetramers_files.txt
Impossible open data file: /mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/TEST/NOVA.txt

██████╗ ███╗ ██╗ █████╗ ███╗ ███╗ ██████╗ ████████╗ ██╗ ███████╗ ███████╗
██╔══██╗ ████╗ ██║ ██╔══██╗ ████╗ ████║ ██╔═══██╗ ╚══██╔══╝ ██║ ██╔════╝ ██╔════╝
██████╔╝ ██╔██╗ ██║ ███████║ ██╔████╔██║ ██║ ██║ ██║ ██║ █████╗ ███████╗
██╔══██╗ ██║╚██╗██║ ██╔══██║ ██║╚██╔╝██║ ██║ ██║ ██║ ██║ ██╔══╝ ╚════██║
██║ ██║ ██║ ╚████║ ██║ ██║ ██║ ╚═╝ ██║ ╚██████╔╝ ██║ ██║ ██║ ███████║
╚═╝ ╚═╝ ╚═╝ ╚═══╝ ╚═╝ ╚═╝ ╚═╝ ╚═╝ ╚═════╝ ╚═╝ ╚═╝ ╚═╝ ╚══════╝

Reading tetramer counts....
|======================================================================| 100%
Calculating enrichment....
|======================================================================| 100%
Bootstrapping results....
================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================================utilisateur système écoulé
11.008 0.056 11.064
Saving results....

██████╗ ███╗ ██╗ █████╗ ███╗ ███╗ ██████╗ ████████╗ ██╗ ███████╗ ███████╗
██╔══██╗ ████╗ ██║ ██╔══██╗ ████╗ ████║ ██╔═══██╗ ╚══██╔══╝ ██║ ██╔════╝ ██╔════╝
██████╔╝ ██╔██╗ ██║ ███████║ ██╔████╔██║ ██║ ██║ ██║ ██║ █████╗ ███████╗
██╔══██╗ ██║╚██╗██║ ██╔══██║ ██║╚██╔╝██║ ██║ ██║ ██║ ██║ ██╔══╝ ╚════██║
██║ ██║ ██║ ╚████║ ██║ ██║ ██║ ╚═╝ ██║ ╚██████╔╝ ██║ ██║ ██║ ███████║
╚═╝ ╚═╝ ╚═╝ ╚═══╝ ╚═╝ ╚═╝ ╚═╝ ╚═╝ ╚═════╝ ╚═╝ ╚═╝ ╚═╝ ╚══════╝

Selecting significantly enriched motifs...

as well as a copy of stderr:

Traceback (most recent call last):
File "/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/m3_light/regions/merge_overlapping_regions.py", line 87, in
for rid, (chr, strand, list_start, list_stop) in regions.iteritems():
AttributeError: 'dict' object has no attribute 'iteritems'
Traceback (most recent call last):
File "/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tmp.py", line 1, in
import m3_light
File "/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/m3_light/init.py", line 31
print index+1, motif
^^^^^^^^^^^^^^^^^^^^
SyntaxError: Missing parentheses in call to 'print'. Did you mean print(...)?
mkdir: impossible de créer le répertoire «tetramers»: Le fichier existe
mkdir: impossible de créer le répertoire «tetramers/NOVA_regulation»: Le fichier existe
mkdir: impossible de créer le répertoire «tetramers/NOVA_regulation/r»: Le fichier existe
mkdir: impossible de créer le répertoire «tetramers/NOVA_regulation/nr»: Le fichier existe
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/A*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/C*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/T*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/G*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/W*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/Y*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/S*': Aucun fichier ou dossier de ce nom
cp: impossible d'évaluer 'm3_light/results/NOVA_regulation/motifs.final/pth_0.5/R*': Aucun fichier ou dossier de ce nom
mkdir: impossible de créer le répertoire «results»: Le fichier existe
mkdir: impossible de créer le répertoire «results/NOVA_regulation»: Le fichier existe
wc: '/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/nr/.bed': Aucun fichier ou dossier de ce nom
wc: '/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/nr/
.bed': Aucun fichier ou dossier de ce nom
wc: '/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/r/.bed': Aucun fichier ou dossier de ce nom
wc: '/mnt/crct-share/CRCT21/Private/Yann/Tools/RNAmotifs/tetramers/NOVA_regulation/r/
.bed': Aucun fichier ou dossier de ce nom
Erreur dans strsplit(sapply(strsplit(res[, 1], "/"), function(x) x[length(x)]), :
l'argument n'est pas une chaîne de caractères
Appels : sapply -> lapply -> strsplit
Exécution arrêtée

Not sure if this error has is origin from the faulty mm9.downlaod.sh script or if this is unrelated.

Final point, is there any plans to update RNAmotifs to accomodate more recent mouse and human genome build ? (i.e. GRCm39/mm39; GRCh38) ?

Looking forward for your answer.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant