Εμφάνιση 1-4 από 4

Θέμα: text manipulation

  1. #1
    Εγγραφή
    20-09-2005
    Μηνύματα
    215
    Downloads
    1
    Uploads
    0
    χρόνια και σαμάνια, και καλώς σας ξαναβρήκα.

    έχω το αρχείο με τις ακόλουθες tab διαχωρισμένες αλληλουχίες:
    chr1 0 600 15 Repetitive/CNV 0 . 0 600 245,245,245
    chr1 1000 1600 8 Insulator 0 . 1000 1600 10,190,254
    chr1 100004000 100005200 2 Weak Promoter 0 . 100004000 100005200 255,105,105
    chr1 100005200 100016800 13 Heterochrom/lo 0 . 100005200 100016800 245,245,245
    chr1 10001600 10014800 13 Heterochrom/lo 0 . 10001600 10014800 245,245,245
    chr1 100016800 100022800 12 Repressed 0 . 100016800 100022800 127,127,127
    chr1 100022800 100026800 13 Heterochrom/lo 0 . 100022800 100026800 245,245,245
    chr1 100026800 100028600 12 Repressed 0 . 100026800 100028600 127,127,127
    chr1 100028600 100037000 13 Heterochrom/lo 0 . 100028600 100037000 245,245,245
    chr1 100037000 100046600 12 Repressed 0 . 100037000 100046600 127,127,127
    chr1 100046600 100046800 6 Weak Enhancer 0 . 100046600 100046800 255,252,4
    chr1 100046800 100047000 2 Weak Promoter 0 . 100046800 100047000 255,105,105
    chr1 100047000 100047200 4 Strong Enhancer 0 . 100047000 100047200 250,202,0
    chr1 100047200 100047400 6 Weak Enhancer 0 . 100047200 100047400 255,252,4
    chr1 100047400 100054200 13 Heterochrom/lo 0 . 100047400 100054200 245,245,245
    chr1 100054200 100055000 12 Repressed 0 . 100054200 100055000 127,127,127
    chr1 100055000 100087400 13 Heterochrom/lo 0 . 100055000 100087400 245,245,245
    chr1 100087400 100087600 6 Weak Enhancer 0 . 100087400 100087600 255,252,4
    με ενδιαφέρει η τέταρτη στήλη.
    Θα ήθελα αρχικά να μπορέσω να βγάλω τον αριθμό κενό πχ

    6 Weak Enhancer --> Weak Enhancer

    μετά να μπορέσω να μετρήσω πόσα ίδια στοιχεία υπάρχουν, πχ
    πόσα Weak Enhancer υπάρχουν στο αρχείο στην 4η στήλη
    και να γίνει εξαγωγή ενός αρχείου όπως:
    Weak Enhancer 13
    Repressed 200
    .
    .
    .

    έχει κάποιος καμιά ιδέα;

    Ευχαριστώ.

    Υ.Γ. ακόμα και αν μπορεί να γίνει από spreadsheat δεν έχω κανένα πρόβλημα.

  2. #2
    Εγγραφή
    31-12-2007
    Περιοχή
    Αθήνα
    Ηλικία
    51
    Μηνύματα
    324
    Downloads
    1
    Uploads
    0
    ISP
    HOL
    DSLAM
    HOL - ΜΑΡΟΥΣΙ
    Έχεις κάποια προτίμηση/περιορισμό σε γλώσσα;
    Περιβάλλον windows;

  3. #3
    Εγγραφή
    20-09-2005
    Μηνύματα
    215
    Downloads
    1
    Uploads
    0
    Περιβάλλον linux... και μόνο...
    Γλώσσα προγραμματισμού, ότι απλότερο υπάρχει που μπορεί να κάνει σωστά τη δουλειά.
    ΝΑ πώ ότι δοκίμασα το
    Κώδικας:
    sort 'file.bed' | awk '{print $4}' | uniq -c -D -i
    ή και χωρίς το awk
    Κώδικας:
    sort 'file.bed' | awk '{print $4}' | uniq -c -D -i
    και τα αποτελέσματα δεν είναι τα δέοντα... πρέπει να βγουν και οι αριθμοί εμπρός.

  4. #4
    Εγγραφή
    31-12-2007
    Περιοχή
    Αθήνα
    Ηλικία
    51
    Μηνύματα
    324
    Downloads
    1
    Uploads
    0
    ISP
    HOL
    DSLAM
    HOL - ΜΑΡΟΥΣΙ
    Σε εμένα έπαιξε έτσι:

    Κώδικας:
    sort 'file.bed' | awk '{print $5}' | sort | uniq -c

Παρόμοια Θέματα

  1. Windows hosting (Shared) στην Γερμανία με full text indexing
    Από grayden στο φόρουμ Internet, web surfing και online υπηρεσίες
    Μηνύματα: 0
    Τελευταίο Μήνυμα: 01-11-13, 01:02
  2. text decoration
    Από mixaverros88 στο φόρουμ Web authoring, development & web design
    Μηνύματα: 7
    Τελευταίο Μήνυμα: 19-06-13, 11:51

Bookmarks

Bookmarks

Δικαιώματα - Επιλογές

  • Δεν μπορείτε να δημοσιεύσετε νέα θέματα
  • Δεν μπορείτε να δημοσιεύσετε νέα μηνύματα
  • Δεν μπορείτε να αναρτήσετε συνημμένα
  • Δεν μπορείτε να επεξεργαστείτε τα μηνύματα σας
  •  
  • Τα BB code είναι σε λειτουργία
  • Τα Smilies είναι σε λειτουργία
  • Το [IMG] είναι σε λειτουργία
  • Το [VIDEO] είναι σε λειτουργία
  • Το HTML είναι εκτός λειτουργίας