Hur man konverterar en TXT-fil till FASTA

Kliniska studier utförs för att analysera proteinsekvensdata och hitta behandlingar för sjukdomar. Proteinsekvensdata placeras i FASTA-formatet (snabb-allt) så att programvara förstår hur man bearbetar datasekvensen. FASTA-formatet har upp till 80 tecken per sekvensdatarad och använder kodstandarden IUB / IUPAC (International Union of Biochemistry / International Union of Pure and Applied Chemistry). Omvandla en TXT-fil (ren text) till FASTA-format innebär att du redigerar eller lägger till FASTA-formaterad sekvensdata till en befintlig textfil med proteinsekvensdatalinjer. Textredigeringsprogram som Notepad gör det enkelt att göra.

Öppna den proteinsekvenstextfil du vill redigera i ett textredigeringsprogram, t.ex. Anteckningar.

Redigera eller lägg till beskrivningsraden för att följa FASTA-formatet. Till exempel är> gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) en giltig FASTA-beskrivningsrad. Den här raden ger en unik beskrivning för de följddatalinjer som följer. FASTA-formatet kräver användning av symbolen som är större än (>) så att programvaran kan identifiera den unika beskrivande informationen och undvika att bearbeta beskrivningen som en proteinsekvensrad.

Tryck på "Enter" för att infoga en radbrytning när beskrivningsraden har redigerats.

Redigera eller lägg till proteinsekvensens dataradformat för att överensstämma med IUB / IUPAC-standardkoderna. IUB / IUPAC-standarden använder bokstäverna i alfabetet för att representera acceptabla koder eller frågesekvenser för aminosyror eller nukleinsyror i FASTA-format. Exempelvis representerar QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE en rad giltig sekvensdata eftersom den börjar med bokstaven "Q" som representerar glutamin och slutar med bokstaven "E" som representerar glutam.

Lägg till fler sekvensdatarader, redigera befintliga sekvensdatarader eller lägg till radbrytningar efter 80 tecken efter behov. Att följa FASTA-sekvensens datalinjestandarder och radbrytningar säkerställer att programmet följer instruktionerna relaterade till glutamin, glutamat och andra bokstavskoder. Bokstäverna i IUB / IUPAC-standarden är helt enkelt instruktioner till programvaran som behandlar FASTA-formaterad data.

Klicka på "Arkiv", välj "Spara" och klicka sedan på "Spara" -knappen. Din TXT-fil är nu i FASTA-format.