परिचय¶
AI-सहायता प्राप्त अनुवाद - अधिक जानें और सुधार सुझाएं
प्रशिक्षण वातावरण में इस प्रशिक्षण कोर्स को पूरा करने के लिए आवश्यक सभी सॉफ़्टवेयर, कोड और डेटा शामिल हैं, इसलिए आपको स्वयं कुछ भी इंस्टॉल करने की आवश्यकता नहीं है। हालांकि, लॉग इन करने के लिए आपको एक (मुफ़्त) खाता चाहिए, और आपको इंटरफ़ेस से परिचित होने के लिए कुछ मिनट लेने चाहिए।
यदि आपने अभी तक ऐसा नहीं किया है, तो कृपया आगे बढ़ने से पहले वातावरण सेटअप मिनी-कोर्स देखें।
उपलब्ध सामग्री¶
इस प्रशिक्षण कोर्स के दौरान, हम nf4-science/rnaseq/ डायरेक्टरी में काम करेंगे, जिसमें आपको प्रशिक्षण workspace खोलने पर जाना होगा।
इस डायरेक्टरी में सभी कोड फ़ाइलें, टेस्ट डेटा और सहायक फ़ाइलें शामिल हैं जिनकी आपको आवश्यकता होगी।
इस डायरेक्टरी की सामग्री को एक्सप्लोर करने के लिए स्वतंत्र महसूस करें; ऐसा करने का सबसे आसान तरीका VSCode इंटरफ़ेस में प्रशिक्षण workspace के बाईं ओर फ़ाइल एक्सप्लोरर का उपयोग करना है।
वैकल्पिक रूप से, आप tree कमांड का उपयोग कर सकते हैं।
पूरे कोर्स में, हम डायरेक्टरी संरचना और सामग्री को पठनीय रूप में प्रस्तुत करने के लिए tree के आउटपुट का उपयोग करते हैं, कभी-कभी स्पष्टता के लिए मामूली संशोधनों के साथ।
यहां हम दूसरे स्तर तक सामग्री की तालिका बनाते हैं:
डायरेक्टरी सामग्री
rnaseq
├── data
│ ├── genome.fa
│ ├── paired-end.csv
│ ├── reads
│ │ ├── ENCSR000COQ1_1.fastq.gz
│ │ ├── ENCSR000COQ1_2.fastq.gz
│ │ ├── ENCSR000COQ2_1.fastq.gz
│ │ ├── ENCSR000COQ2_2.fastq.gz
│ │ ├── ENCSR000COR1_1.fastq.gz
│ │ ├── ENCSR000COR1_2.fastq.gz
│ │ ├── ENCSR000COR2_1.fastq.gz
│ │ ├── ENCSR000COR2_2.fastq.gz
│ │ ├── ENCSR000CPO1_1.fastq.gz
│ │ ├── ENCSR000CPO1_2.fastq.gz
│ │ ├── ENCSR000CPO2_1.fastq.gz
│ │ └── ENCSR000CPO2_2.fastq.gz
│ └── single-end.csv
├── nextflow.config
├── rnaseq.nf
└── solutions
├── modules
│ ├── fastqc.nf
│ ├── fastqc_pe.nf
│ ├── hisat2_align.nf
│ ├── hisat2_align_pe.nf
│ ├── multiqc.nf
│ ├── trim_galore.nf
│ └── trim_galore_pe.nf
├── rnaseq-2.1.nf
├── rnaseq-2.2.nf
├── rnaseq-2.3.nf
├── rnaseq-3.1.nf
├── rnaseq-3.2.nf
└── rnaseq_pe-3.3.nf
Note
चिंता न करें अगर यह बहुत कुछ लगता है; हम कोर्स के प्रत्येक चरण में प्रासंगिक हिस्सों को देखेंगे। यह केवल आपको एक सामान्य अवलोकन देने के लिए है।
शुरुआत करने के लिए आपको यह जानना चाहिए:
-
rnaseq.nfफ़ाइल workflow स्क्रिप्ट की रूपरेखा है जिसे हम विकसित करने के लिए काम करेंगे। -
फ़ाइल
nextflow.configएक कॉन्फ़िगरेशन फ़ाइल है जो न्यूनतम वातावरण गुण सेट करती है। आप इसे अभी के लिए अनदेखा कर सकते हैं। -
dataडायरेक्टरी में इनपुट डेटा और संबंधित संसाधन शामिल हैं: -
एक संदर्भ जीनोम जिसे
genome.faकहा जाता है, जिसमें मानव क्रोमोसोम 20 (hg19/b37 से) का एक छोटा क्षेत्र शामिल है। - RNAseq डेटा जिसे फ़ाइल आकार कम रखने के लिए एक छोटे क्षेत्र में विभाजित किया गया है,
reads/डायरेक्टरी में। -
CSV फ़ाइलें जो बैच प्रोसेसिंग के लिए उदाहरण डेटा फ़ाइलों की ID और पथ को सूचीबद्ध करती हैं।
-
solutionsडायरेक्टरी में कोर्स के प्रत्येक चरण से प्राप्त पूर्ण workflow स्क्रिप्ट और modules शामिल हैं। वे आपके काम की जांच करने और किसी भी समस्या का निवारण करने के लिए संदर्भ के रूप में उपयोग किए जाने के लिए हैं। फ़ाइल नाम में संख्या कोर्स के संबंधित भाग के चरण से मेल खाती है।
Tip
यदि किसी कारण से आप इस डायरेक्टरी से बाहर चले जाते हैं, तो आप इसमें वापस लौटने के लिए हमेशा यह कमांड चला सकते हैं:
अब, कोर्स शुरू करने के लिए, इस पृष्ठ के निचले दाएं कोने में तीर पर क्लिक करें।