Εμφάνιση 1-5 από 5
  1. #1
    Εγγραφή
    08-10-2006
    Περιοχή
    Utrecht, NL
    Ηλικία
    37
    Μηνύματα
    356
    Downloads
    1
    Uploads
    0
    Τύπος
    Cable
    Ταχύτητα
    150/15 Mbit/s
    ISP
    Ziggo
    Router
    Cisco EPC 3925
    Έχω ένα πρόβλημα, στο οποίο οι γνώσεις μου περί βάσεων δεδομένων είναι μάλλον ανεπαρκείς.
    Έχω μια πολύ μεγάλη βάση δεδομένων με tweets και θέλω να βρω ποιες είναι οι 10 πιο συχνές
    λέξεις που ξεκινούν με hashtag. Σαν συμβουλή, ο καθηγητής μας είπε ότι μπορούμε να χρησιμοποιήσουμε
    regular expressions και επίσης MapReduce αν ξέρουμε να το χρησιμοποιούμε, οπότε το ξεχνάω.
    Καμιά ιδέα για το πως θα μπορούσα να ξεκινήσω;

    - - - Updated - - -

    Μιας και βλέπω ότι δεν απαντάει κανένας, ας γράψω τι σκέφτομαι και τι έχω κάνει ως τώρα, μήπως γίνει πιο κατανοητό.
    Χρησιμοπιώντας την regular expression #[\\w]+ έχω απομονώσει τα tweets που έχουν μία ή περισσότερες λέξεις που
    ξεκινάν με hashtag και θέλω τώρα να βάλω όλες τις λέξεις σε μια καινούρια στήλη για να μπορέσω να τις κατατάξω.

  2. #2
    Εγγραφή
    06-10-2008
    Ηλικία
    35
    Μηνύματα
    515
    Downloads
    2
    Uploads
    0
    Ταχύτητα
    6144/1024
    ISP
    HOL
    DSLAM
    Forthnet - ΑΓΙΟΥ ΓΕΩΡΓΙΟΥ
    Router
    WAG54G2 Linksys
    Path Level
    Interleaved
    Ίσως θα μπορούσες να δοκιμάσεις κάτι σαν αυτό

    SELECT tweet FROM
    (
    SELECT tweet, count(*) as TOTAL
    FROM tweets_table
    WHERE tweet LIKE '% #%'
    GROUP BY tweet
    ORDER BY TOTAL) as Temp
    LIMIT 10

    Δεν υπόσχομαι ότι θα δουλέψει μιας και έχω να πιάσω καιρό sql αλλά αν έδινες και την δομή των tables
    θα βοηθούσε πιο πολύ κάποιον για να σου δώσει μια πιο σωστή απάντηση. Υπέθεσα ότι τα tweets βρίσκονται μέσα στον πίνακα
    με όνομα tweets_table.
    Τελευταία επεξεργασία από το μέλος xcyanx : 10-10-12 στις 21:07.

  3. #3
    Εγγραφή
    30-03-2012
    Ηλικία
    37
    Μηνύματα
    7
    Downloads
    0
    Uploads
    0
    ISP
    Forthnet
    Καλημέρα, η μορφή των tweets που ψάχνουμε είναι ότι σε κάθε κελί του πίνακα υπάρχει σκέτο ένα hashtag και λέξη ή ολόκληρη πρόταση που κάπου περιέχει και μια λέξη με hashtag ή και παραπάνω ή και καμία;

    PHP script μπορούμε να χρησιμοποιήσουμε;

  4. #4
    Εγγραφή
    06-10-2008
    Ηλικία
    35
    Μηνύματα
    515
    Downloads
    2
    Uploads
    0
    Ταχύτητα
    6144/1024
    ISP
    HOL
    DSLAM
    Forthnet - ΑΓΙΟΥ ΓΕΩΡΓΙΟΥ
    Router
    WAG54G2 Linksys
    Path Level
    Interleaved
    Αν είναι έτσι όπως το λες τότε φαντάζομαι το sql ερώτημα που έδωσα ότι θα πρέπει να δουλεύει...
    Το έτρεξα σε μία άλλη βάση που έφτιαξα για να το testarw και δούλεψε.

  5. #5
    Εγγραφή
    08-10-2006
    Περιοχή
    Utrecht, NL
    Ηλικία
    37
    Μηνύματα
    356
    Downloads
    1
    Uploads
    0
    Τύπος
    Cable
    Ταχύτητα
    150/15 Mbit/s
    ISP
    Ziggo
    Router
    Cisco EPC 3925
    Αν ήταν έτσι θα ήταν εύκολο ακόμα και για μένα, που έχω χάσει την επαφή με SQL. Τα tweets είναι σε ένα πίνακα με πολλές στήλες, από τις οποίες εμάς μας ενδιαφέρει μόνο η content, που είναι δηλαδή το κείμενο. Μια φίλη μου με βοήθησε τελικά και μου πρότεινε το εξής το οποίο δουλεύει σωστά

    Κώδικας:
    Select  substring_index(substring_index(content,'#',-1), ' ',1) as hashtag
    Το πρόβλημα μου όμως ήταν ότι η regular expression που χρησιμοποιούσα για να απομονώσω τα σχετικά tweets ήταν λάθος, οπότε την αντικατέστησα με την '#\w*'.

Παρόμοια Θέματα

  1. διαγραφή λέξης
    Από leon_23 στο φόρουμ Προγραμματισμός και γλώσσες προγραμματισμού
    Μηνύματα: 2
    Τελευταίο Μήνυμα: 19-04-10, 03:09
  2. Ετυμολογία της λέξης φυλής
    Από YiannisM στο φόρουμ Εκτός θέματος
    Μηνύματα: 11
    Τελευταίο Μήνυμα: 30-08-07, 16:58
  3. Ξαφνικά το VIRTUAL DUB μου βγαζει πιο συχνά σφάλμα VBR!
    Από johnalepou στο φόρουμ Audio, Video και Φωτογραφία
    Μηνύματα: 13
    Τελευταίο Μήνυμα: 14-02-07, 18:10
  4. Εκτυπωση αναποδης λεξης..
    Από cflour στο φόρουμ Windows
    Μηνύματα: 34
    Τελευταίο Μήνυμα: 01-08-06, 15:25

Tags για αυτό το Θέμα

Bookmarks

Bookmarks

Δικαιώματα - Επιλογές

  • Δεν μπορείτε να δημοσιεύσετε νέα θέματα
  • Δεν μπορείτε να δημοσιεύσετε νέα μηνύματα
  • Δεν μπορείτε να αναρτήσετε συνημμένα
  • Δεν μπορείτε να επεξεργαστείτε τα μηνύματα σας
  •  
  • Τα BB code είναι σε λειτουργία
  • Τα Smilies είναι σε λειτουργία
  • Το [IMG] είναι σε λειτουργία
  • Το [VIDEO] είναι σε λειτουργία
  • Το HTML είναι εκτός λειτουργίας