Εμφάνιση 1-13 από 13
  1. #1
    Το avatar του μέλους European
    European Guest
    Θέλω να σκανάρω τις σελίδες ενός βιβλίου και να τις αποθηκεύσω σε μορφή επεξεργάσιμου κειμένου το οποίο με την σειρά του να έχει την δυνατότητα μετατροπής σε .chm αρχείο. Υπάρχει τρόπος για να γίνει αυτό και με ποιά εφαρμογή γίνεται; (δεν ξέρω κάν αν ρωτάω κάτι με σωστό τρόπο). Προκαταβολικές ευχαριστίες σε όσους απαντήσουν

  2. #2
    Εγγραφή
    27-08-2004
    Περιοχή
    internet
    Μηνύματα
    23.371
    Downloads
    58
    Uploads
    17
    Άρθρα
    9
    Ταχύτητα
    49999 / 4999
    ISP
    ΟΤΕ Conn-x
    DSLAM
    ΟΤΕ - ΚΟΥΝΟΥΠΙΔΙΑΝΩΝ
    Από όσο γνωρίζω οι δωρεάν λύσεις δεν είναι καθόλου καλές στο τομέα αυτό. Η καλύτερη επιλογή είναι το FineReader το οποίο όμως κοστίζει και είναι μόνο για windows.

    Γενικά οι εφαρμογές που μετατρέπουν σκαναρισμένο κείμενο σε κανονικό λέγονται OCR.
    Gentoo Linux: mess with the best and you might learn something
    δικτυακή παράσταση | twitter | within specifications
    Αν φτάσω τα 100 και με ρωτήσουν το μυστικό της μακροζωίας θα πω: Πάντα είχα 3 ποτήρια μπροστά μου· ένα με νερό, ένα με καφέ & ένα με αλκοόλ.

  3. #3
    Το avatar του μέλους European
    European Guest
    Παράθεση Αρχικό μήνυμα από mrsaccess Εμφάνιση μηνυμάτων
    Από όσο γνωρίζω οι δωρεάν λύσεις δεν είναι καθόλου καλές στο τομέα αυτό. Η καλύτερη επιλογή είναι το FineReader το οποίο όμως κοστίζει και είναι μόνο για windows.

    Γενικά οι εφαρμογές που μετατρέπουν σκαναρισμένο κείμενο σε κανονικό λέγονται OCR.
    Άρα για linux δεν παίζει κάτι μου λές
    Οπότε ανοίγω τα vista να δώ και πως είναι και να ψάξω να βρώ finereader
    Ευχαριστώ

  4. #4
    Το avatar του μέλους daemonicus
    daemonicus Guest
    Αν μπορείς να δουλέψεις το scanner μέσω vbox θα είναι μιά χαρα. Αλλά δέν υπάρχουν λύσεις για Linux απ ότι ξέρω

  5. #5
    Εγγραφή
    18-10-2006
    Ηλικία
    55
    Μηνύματα
    5.627
    Downloads
    50
    Uploads
    0
    Τύπος
    ADSL OTE
    Ταχύτητα
    20370/935
    ISP
    Conn-X 24Mbit
    DSLAM
    Cyta Hellas - ΚΟΖΑΝΗ
    Router
    level-one FBR-1416A
    Το kpdf εξάγει κείμενο από pdf που προέρχεται από σκαναρισμένο βιβλίο ή φωτοτυπία.
    Πατήστε στην εικόνα για να τη δείτε σε μεγέθυνση. 

Όνομα:  snapshot94.png 
Εμφανίσεις:  11 
Μέγεθος:  36,4 KB 
ID: 48668
    Κώδικας:
    R. M. Shackelford   -"Domestic   Production of Mink  and Foxes"
          Bob Smyth - Does the mink have yellow   or pheomelanin   pigment?    If not,
    how do the buffy pastels and light silvers    differ? •
          R. M. Shackelford   - Yes, in the palomino and others phenotypically      similar.
    Years ago I extracted the pigment from the hair of the silverblu and pastel color
    phases--in   the former the granules are dark brown to black as in the "wild type",
    reduced in quantity, and are clumped in the hair shaft rat.her than bei'ng evenly
    distributed:    in the pastel the granules are much smaller, considerably       lighter
    brown, but are arranged in the hair shaft as in the "wild type".
          Jim Craig - Please tell us how effective selection has been       (or other
    methods) in decreasing pair bonding behavior in red foxes.

  6. #6
    Εγγραφή
    27-08-2004
    Περιοχή
    internet
    Μηνύματα
    23.371
    Downloads
    58
    Uploads
    17
    Άρθρα
    9
    Ταχύτητα
    49999 / 4999
    ISP
    ΟΤΕ Conn-x
    DSLAM
    ΟΤΕ - ΚΟΥΝΟΥΠΙΔΙΑΝΩΝ
    Πως το κάνει αυτό;
    Gentoo Linux: mess with the best and you might learn something
    δικτυακή παράσταση | twitter | within specifications
    Αν φτάσω τα 100 και με ρωτήσουν το μυστικό της μακροζωίας θα πω: Πάντα είχα 3 ποτήρια μπροστά μου· ένα με νερό, ένα με καφέ & ένα με αλκοόλ.

  7. #7
    Εγγραφή
    18-10-2006
    Ηλικία
    55
    Μηνύματα
    5.627
    Downloads
    50
    Uploads
    0
    Τύπος
    ADSL OTE
    Ταχύτητα
    20370/935
    ISP
    Conn-X 24Mbit
    DSLAM
    Cyta Hellas - ΚΟΖΑΝΗ
    Router
    level-one FBR-1416A
    Παράθεση Αρχικό μήνυμα από mrsaccess Εμφάνιση μηνυμάτων
    Πως το κάνει αυτό;
    Select+Copy to Clipboard+Paste σαν αρχείο κειμένου.

    Στον Adobe Reader 8 που έχω στο kubuntu δεν γίνεται σε pdf από φωτοτυπία, μόνο σε pdf που προέρχεται από επεξεργαστή κειμένου.

    Σε μαθηματικές πράξεις, πίνακες, κλπ όμως δεν ξέρω τι παίζει.
    Πατήστε στην εικόνα για να τη δείτε σε μεγέθυνση. 

Όνομα:  Ανώνυμο.png 
Εμφανίσεις:  8 
Μέγεθος:  22,6 KB 
ID: 48670
    Κώδικας:
     U.S. Mink Pelts and Ranches
     6
                                                        :         _ _,
    4
                     "   PeRsproduced(mgi_ns)                            . . 
    3                          _                                            "
        %%
       F   _.,,
    2
                _                           Dollar_   (millions).-
                        Mink ranches (_saods)                    ,     J
    o         t     !    I      =        =    t   ,   t     ', i
    1969   1970   1971 1972   1973    1974 1975     1976   1977   1978
                                Crop year

  8. #8
    Το avatar του μέλους European
    European Guest
    @giorgosts
    Καταπληκτική πληροφορία!
    Δεν με ενδιαφέρουν εν προκειμένω οι μαθηματικές πράξεις και τα σχεδιαγράμματα
    Για λογοτεχνικό βιβλίο πρόκειται που θέλω να ανεβάσω αρκετές σελίδες και δεν λέει να δακτυλογραφώ
    Ευχαριστώ!

  9. #9
    Εγγραφή
    10-06-2006
    Μηνύματα
    3.963
    Downloads
    3
    Uploads
    0
    Τύπος
    ADSL
    Ταχύτητα
    2048/256
    ISP
    OTEnet
    SNR / Attn
    31(dB) / 30(dB)
    Θα υποφέρεις, αφού πρέπει να γράψεις όλους του χαρακτήρες Κεφαλαία, μικρά και τονισμένα. Το λειτούργησα από κονσόλα.

    Κώδικας:
    gocr -i arxeio_isws_kalytera_ASPROMAYRO -o ocr.txt -f UTF8 -m 130 -m 256 -m 23
    ........Auto merged post: ludist πρόσθεσε 1 λεπτά και 15 δευτερόλεπτα αργότερα ........

    @giorgosts, δεν δουλέυει με ελληνικά ή μου φαίνεται;
    Τελευταία επεξεργασία από το μέλος ludist : 14-12-08 στις 13:12. Αιτία: auto merged post
    Από το «Ο πελάτης έχει πάντα δίκιο», στο «Η εταιρία έχει πάντα δίκιο».
    Επιλογή linux διανομής.
    Αγγλικά <- Απορίες για το Slack; Διάβασε -> Ελληνικά. Οδηγίες εγκατάστασης από imitheos
    Θησαυρός πληροφοριών ΑΝΕΞΑΡΤΗΤΑ διανομής GNU/Linux.

  10. #10
    Το avatar του μέλους European
    European Guest
    Παράθεση Αρχικό μήνυμα από ludist Εμφάνιση μηνυμάτων
    Θα υποφέρεις, αφού πρέπει να γράψεις όλους του χαρακτήρες Κεφαλαία, μικρά και τονισμένα. Το λειτούργησα από κονσόλα.

    Κώδικας:
    gocr -i arxeio_isws_kalytera_ASPROMAYRO -o ocr.txt -f UTF8 -m 130 -m 256 -m 23
    Τι εννοείς να γράψω όλους τους χαρακτήρες Κεφαλαία μικρά και τονισμένα;
    Όταν σκανάρει το κείμενο δεν θα το σκανάρει όπως είναι γραμμένο;
    Τελευταία επεξεργασία από το μέλος European : 14-12-08 στις 13:52.

  11. #11
    Εγγραφή
    10-06-2006
    Μηνύματα
    3.963
    Downloads
    3
    Uploads
    0
    Τύπος
    ADSL
    Ταχύτητα
    2048/256
    ISP
    OTEnet
    SNR / Attn
    31(dB) / 30(dB)
    Το gocr έχει μία "βιβλιοθήκη" για λατινικούς χαρακτήρες αλλά όχι για ελληνικούς.

    Έτσι θα σε ρωτάει για κάθε χαρακτήρα ποιός είναι. Το καλό είναι πως αποθηκεύει και έχει "νοημοσύνη", έτσι δεν σε ρωτάει συνέχεια (εξαρτάται και από την ποιότητα της εικόνας + γραμματοσειρά). Αυτό βέβαια σημαίνεις πως θα γράψεις κάπου στα.. 60 γράμματα (εκνευριστικό).

    Το κακό είναι πως αν δώσεις λάθος αντιστοιχία δεν είναι εύκολο να το διορθώσεις (αν καταφέρεις να καταλάβεις πως να διορθώσεις την βάση δεδομένων του) και ότι δεν το χρησιμοποίησα σε scanαρισμένα κείμενα να σου γράψω πραγματικές εντυπώσεις παρά μόνο σε υπότιτλους (άριστο) και δοκιμαστικά (πάλι άριστο).

    Τώρα που το ξανασκέφτομαι, αν πέσεις σε διαγράμματα και εικόνες θα πέσει μεγάλη καταστροφή
    Από το «Ο πελάτης έχει πάντα δίκιο», στο «Η εταιρία έχει πάντα δίκιο».
    Επιλογή linux διανομής.
    Αγγλικά <- Απορίες για το Slack; Διάβασε -> Ελληνικά. Οδηγίες εγκατάστασης από imitheos
    Θησαυρός πληροφοριών ΑΝΕΞΑΡΤΗΤΑ διανομής GNU/Linux.

  12. #12
    Το avatar του μέλους European
    European Guest
    Kαλά .. φαντάζομαι αν πέσω σε πολυτονικό θα γίνει μεγάλο γλέντι!
    Δεν σκοπεύω πάντως για εικόνες και διαγράμματα..
    Κυρίως για κείμενο
    Ευχαριστώ πάντως ούτως ή άλλως!

    Υγ. όλα με κονσόλα τα τρέχεις;
    εγώ μόνο το hylafax τρέχω με κονσόλα επειδή δεν ξέρω αλλοιώς

  13. #13
    Εγγραφή
    10-06-2006
    Μηνύματα
    3.963
    Downloads
    3
    Uploads
    0
    Τύπος
    ADSL
    Ταχύτητα
    2048/256
    ISP
    OTEnet
    SNR / Attn
    31(dB) / 30(dB)
    Όχι ανοίγω και τον firefox Το ξεκίνησα ως άσκηση αλλά.. κόλλησα. Ειδικά το gocr το έτρεχα από ssh από υπολογιστή δουλειάς
    Τελευταία επεξεργασία από το μέλος ludist : 15-12-08 στις 01:14. Αιτία: auto merged post
    Από το «Ο πελάτης έχει πάντα δίκιο», στο «Η εταιρία έχει πάντα δίκιο».
    Επιλογή linux διανομής.
    Αγγλικά <- Απορίες για το Slack; Διάβασε -> Ελληνικά. Οδηγίες εγκατάστασης από imitheos
    Θησαυρός πληροφοριών ΑΝΕΞΑΡΤΗΤΑ διανομής GNU/Linux.

Παρόμοια Θέματα

  1. εκθετική μορφή στην C
    Από kzdev στο φόρουμ Προγραμματισμός και γλώσσες προγραμματισμού
    Μηνύματα: 12
    Τελευταίο Μήνυμα: 07-08-08, 00:39
  2. Μορφή Κωδικών VIVODI
    Από worthapp στο φόρουμ ADSL
    Μηνύματα: 5
    Τελευταίο Μήνυμα: 06-07-08, 15:27
  3. μορφή .nth
    Από sevi στο φόρουμ Σταθερή & Κινητή Τηλεφωνία
    Μηνύματα: 3
    Τελευταίο Μήνυμα: 01-09-07, 18:50
  4. ταινιες σε μορφη iso
    Από panathas στο φόρουμ Audio, Video και Φωτογραφία
    Μηνύματα: 17
    Τελευταίο Μήνυμα: 10-07-07, 11:10
  5. 12ωρη μορφή ώρας
    Από panos78 στο φόρουμ Web authoring, development & web design
    Μηνύματα: 5
    Τελευταίο Μήνυμα: 26-04-06, 18:05

Bookmarks

Bookmarks

Δικαιώματα - Επιλογές

  • Δεν μπορείτε να δημοσιεύσετε νέα θέματα
  • Δεν μπορείτε να δημοσιεύσετε νέα μηνύματα
  • Δεν μπορείτε να αναρτήσετε συνημμένα
  • Δεν μπορείτε να επεξεργαστείτε τα μηνύματα σας
  •  
  • Τα BB code είναι σε λειτουργία
  • Τα Smilies είναι σε λειτουργία
  • Το [IMG] είναι σε λειτουργία
  • Το [VIDEO] είναι σε λειτουργία
  • Το HTML είναι εκτός λειτουργίας