Η Reddit, η δημοφιλής πλατφόρμα συζητήσεων στο διαδίκτυο, υπέβαλε μήνυση κατά της εταιρείας τεχνητής νοημοσύνης Anthropic, ισχυριζόμενη ότι η εταιρεία "απέσπααε" παράνομα σχόλια εκατομμυρίων χρηστών της Reddit (data scraping)για να εκπαιδεύσει το chatbot της, Claude.
Η αγωγή, που κατατέθηκε στο Ανώτατο Δικαστήριο του Σαν Φρανσίσκο, υποστηρίζει ότι η Anthropic παραβίασε τους συμβατικούς όρους και τους τεχνικούς φραγμούς της Reddit, χρησιμοποιώντας αυτοματοποιημένα bots για να αποκτήσει πρόσβαση στο περιεχόμενο της Reddit, παρά τις επανειλημμένες αιτήσεις να σταματήσει. Η Reddit ισχυρίζεται ότι η Anthropic εκπαίδευσε σκόπιμα τα μοντέλα της στα προσωπικά δεδομένα των χρηστών της Reddit χωρίς να ζητήσει τη συγκατάθεσή τους, παραβιάζοντας τη Συμφωνία Χρήστη του ιστότοπου και αποτελώντας αθέμιτο ανταγωνισμό σύμφωνα με τη νομοθεσία της Καλιφόρνια.
Εκπρόσωπος της Reddit δήλωσε ότι η εταιρεία πιστεύει στο "Ανοιχτό Διαδίκτυο", αλλά αυτό δεν δίνει στην Anthropic το δικαίωμα να αποσπάσει παράνομα περιεχόμενο της Reddit, να το εκμεταλλευτεί για δισεκατομμύρια δολάρια κέρδους και να αγνοήσει τα δικαιώματα και την ιδιωτικότητα των χρηστών της.
Η Anthropic, από την πλευρά της, δήλωσε ότι διαφωνεί με τους ισχυρισμούς της Reddit και θα υπερασπιστεί τον εαυτό της σθεναρά.
Αυτή η μήνυση έρχεται σε μια περίοδο που η Reddit έχει υιοθετήσει μια πιο σκληρή στάση απέναντι στις εταιρείες που χρησιμοποιούν τα δεδομένα της για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης, επιδιώκοντας συμφωνίες αδειοδότησης. Η Reddit αναφέρει ότι η Anthropic αρνήθηκε να συμμετάσχει σε συζητήσεις για αδειοδότηση.
Αναλυτικά : ArsTechnica
Εμφάνιση 1-15 από 26
-
05-06-25, 20:20 Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #1
- Εγγραφή
- 22-09-2003
- Μηνύματα
- 82.638
- Downloads
- 218
- Uploads
- 48
- Άρθρα
- 6
- Τύπος
- VDSL2
- Ταχύτητα
- 204800/20480
- ISP
- Wind
- Router
- Technicolor DGA4130
- SNR / Attn
- 6(dB) / 2.8(dB)
- Path Level
- Interleaved
-
06-06-25, 06:57 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #2
Νομίζω ότι και παλιότερα είχε απαγορεύσει το reddit την χρήση των post τους για εκπαίδευση ΑΙ.
Δεν ξέρω τι τεχνική χρησιμοποιούν για την εκπαίδευση
λογικά σκανάρουν όλες τις αναρτήσεις
αλλά σχεδόν καθημερινά βλέπω σε διάφορα φόρουμ αναρτήσεις που βγάζουν μάτι ότι δεν είναι από άνθρωπο.
Μιλάω για λογαριασμούς μάλλον φτιαγμένους από ή για ΑΙ
που κάνουν αναρτήσεις και εκπαιδεύονται από τις απαντήσεις.
Και εδώ έχει πάρει το μάτι μου κάτι αντίστοιχο.
Σαν φόρτο στο σύστημα δεν νομίζω ότι προσφέρει κάτι παραπάνω από ένα σκανάρισμα πχ της google για να βρει την απάντηση.
Το όλο θέμα είναι για τα πνευματικά διακαιώματα νομίζω
και πάλι το θεωρώ βλακεία γιατί έτσι είναι σαν να δίνεις οντότητα στο ΑΙ.
Δηλαδή... το να σου δώσει την απάντηση στο ερώτημά σου η google μέσω αναρτήσεων δεν υπάρχει πρόβλημα
αλλά αν ρωτήσεις το chatgpt και σου απαντήσει με κάτι που βρήκε από το reddit είναι θέμα;| "Anyone can build a fast CPU.
| The trick is to build a fast system."
|____________Seymour Cray...
-
06-06-25, 09:40 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #3
Γενικά αυτές οι εταιρίες δεν υπολογίζουν τίποτα. Scraping και δεν λογαριάζουν κανένα, ότι και αν λένε σε PR. H Anthropic δεν είναι η μόνη.
-
06-06-25, 11:02 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #4
-
06-06-25, 11:30 Re: Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #5
Το θέμα φαντάζομαι είναι το αν θα δώσει η google την απάντηση, χρησιμοποιώντας content του Reddit, χωρίς να κερδίσει κάτι το Reddit, ούτε καν την επίσκεψη του χρήστη.
Το ίδιο ισχύει για κάθε google, chatgpt.
Δηλαδή έχεις γράψει εσύ εδώ πέρα ένα μήνυμα, το zusgpt έχει χρησιμοποιήσει την πληροφορία και απαντά στα ερωτήματα χρηστών του, με το content το δικό σου και ταυτόχρονα του adslgr. Όλοι χαρούμενοι εκτός του adslgr που δεν κέρδισε κάτι.Όσο περισσότερο σου κλέβουν τη ζωή, τόσο σε ταΐζουν με έθνος και φυλή..
Εθνικισμός και μετανάστες
Μία τάξη, φυλετικά διαχωρισμένη
-
06-06-25, 13:47 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #6
Η μύνηση πέφτει όχι γιατί χρησιμοποίησαν τα reddit posts, αλλά γιατί δεν τους πλήρωσαν. Καλά πάμε...
Υπογραφή
-
06-06-25, 13:51 Re: Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #7Όσο περισσότερο σου κλέβουν τη ζωή, τόσο σε ταΐζουν με έθνος και φυλή..
Εθνικισμός και μετανάστες
Μία τάξη, φυλετικά διαχωρισμένη
-
06-06-25, 14:16 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #8
- Εγγραφή
- 29-05-2007
- Περιοχή
- δυο κλικ πιο κατω
- Ηλικία
- 49
- Μηνύματα
- 8.185
- Downloads
- 38
- Uploads
- 0
- Άρθρα
- 24
- Τύπος
- ADSL2+
- Ταχύτητα
- 9500 εως 6500 /650
- ISP
- βρωμονταφον
- Router
- της hol
- SNR / Attn
- 9.5(dB) / 29(dB)
- Path Level
- Interleaved
δημοσια ειναι η χρηση του reddit , το περιεχομενο δεν ανηκει ολοκληρωτικα σε εναν ή δυο αφου ειναι προιον των χρηστων του . οποτε μονο το traffic που σχολιαζει ο nek ως αντιστοιχα υπευθυνος με τους ιδιοκτητες του reddit μπορω να θεωρησω ως ουσιαστικο προβλημα .
υπαρχει βεβαια και η ενασχοληση των moderators αλλα και των διαχειρηστων με την επιτηρηση των χρηστων και την συντηρηση του εκαστοτε forum ωστε να λειτουργει σε βαθμο που κραταει ενα επιπεδο συγκεντρωσης πληροφοριας .
απο την αλλη , αν δεν ησαν τα web crawlers , δεν θα ηταν δυνατη η αναζητηση ωστε να βρει καποιος αδαης την υπαρξη της πληροφοριας .
η γνωση παντως αν δεν μοιραστει ,χανεται μεχρι να ξανα ανακαλυφθει .και καποια στοιχεια της παρακμαζουν γιατι αλλαζουν οι συνθηκες λειτουργιας του κοσμου μας επειδη νεα γνωση θα την αντικαταστησει .αντεχεις να αμφιβαλεις για ολα οσα εχεις διδαχτει ;εξαιρετικη η μετριοτης !
Cancel my subscription to the Resurrection. Send my credentials to the House of Detention
ο φασισμος ειναι ο νομος των δουλων
AV tip:να ακολουθεις αυτο που ψαχνεις , οχι αυτο που σε βρισκει .
αν δεν υπαρχει δικαιοσυνη δεν υπαρχει νομιμοτητα
-
06-06-25, 14:50 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #9
Το "δημόσια χρήση" είναι πολύ γενική έννοια και είναι προβληματική.
Τα πράματα είναι απλά: αν το site που είσαι έχει ως κανόνα "το περιεχόμενο δεν επιτρέπεται να χρησιμοποιηθεί για AI training ή whatever" τότε αυτοί με τα bot αυτά παραβιάζουν αυτόν τον κανόνα.
Τα website προσφέρουν το περιεχόμενό τους για ανάγνωση από χρήστες, όχι για άλλου είδους χρήσεις, με εξαίρεση τα bots αναζήτησης και αρχειοθέτησης και μόνο για συγκεκριμένη χρήση.
Όπως μια εταιρεία λογισμικού επιτρέπει να εγκαταστήσεις το λογισμικό και να το τρέξεις αλλά δεν επιτρέπει να το κάνεις αντίγραφα και να το μοιάζεις/πουλάς, ή να το κάνεις reverse-engineer ή whatever έτσι και εδώ.
Όπως μία εταιρεία μουσικής επιτρέπει να κατεβάσεις ένα τραγούδι και να το ακούς όσο θες και όποτε θες αλλά δεν επιτρέπει να το αντιγράψεις και να το δώσεις σε όλο το κόσμο έτσι και εδώ.
Όπως μία εταιρεία ταινιών επιτρέπει να δεις μια ταινία αλλά δεν σου επιτρέπει να την προβάλλεις σε σινεμά να την δουνε 500 άτομα, έτσι και εδώ.
και ούτω κάθε εξής...
Ο κάτοχος πνευματικής ιδιοκτησίας έχει λόγο ως προς την χρήση του περιεχομένου. Αυτός είναι και ο κύριος σκοπός των πνευματικών δικαιωμάτων.
Το reddit έχει χίλια δίκια εδώ. (Φυσικά και εννοείται πως το κάνουν για τα λεφτά, αλλά δεν έχει να λέει).
Με άλλα λόγια το περιεχόμενο του reddit, όπως και σχεδόν όλου του internet, δεν είναι public domain.
-
06-06-25, 15:06 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #10
- Εγγραφή
- 29-05-2007
- Περιοχή
- δυο κλικ πιο κατω
- Ηλικία
- 49
- Μηνύματα
- 8.185
- Downloads
- 38
- Uploads
- 0
- Άρθρα
- 24
- Τύπος
- ADSL2+
- Ταχύτητα
- 9500 εως 6500 /650
- ISP
- βρωμονταφον
- Router
- της hol
- SNR / Attn
- 9.5(dB) / 29(dB)
- Path Level
- Interleaved
το "χρηση" ισως να ηταν λαθος λεξη , προβολη ισως ; αλλιως θα ηταν κλειδωμενο και θα εξυπηρετουσε μονο τους χρηστες που κανουν login .
θα ηθελα να αμοιβονται οσοι εχουν καταβαλει προσηλωση και συνεπεια στην δημιουργια και την στηριξη του καθε εργου . γιατι ναι μεν οι χρηστες γεμιζουν το περιεχομενο ,αλλα ο καθε χρηστης αποφασιζει αυτος αν θα αποκριθει σε κατι ή αν θα ειναι παρον .
ο ρολος των διαχειριστων και των ιδιοκτητων ειναι πολυ πιο απαιτητικος ακομη και αν δεν προκυπτει η αναγκη να κανουν κατι , γιατι ειναι κατι που χρειαζεται ετοιμοτητα για στηριξη για οτι και οποτε συμβει . που σιγουρα καταναλωνει ενα κομματι του εαυτου τους και της προσοχης τους σε μονιμη βαση σε ολη την διαρκεια της λειτουργιας τουαντεχεις να αμφιβαλεις για ολα οσα εχεις διδαχτει ;εξαιρετικη η μετριοτης !
Cancel my subscription to the Resurrection. Send my credentials to the House of Detention
ο φασισμος ειναι ο νομος των δουλων
AV tip:να ακολουθεις αυτο που ψαχνεις , οχι αυτο που σε βρισκει .
αν δεν υπαρχει δικαιοσυνη δεν υπαρχει νομιμοτητα
-
06-06-25, 15:09 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #11
Πάντως τζάμπα μαγκιά κάνει η reddit.
Στην google αν δώσεις κάτι και του πεις να ψάξει στο reddit
ο ΑΙ της θα σου απαντήσει κάνοντας χρήση αυτού όπως του το ζήτησες.
Άρα πιστεύω ότι είναι απλά θέμα συμφωνίας/χρημάτων.| "Anyone can build a fast CPU.
| The trick is to build a fast system."
|____________Seymour Cray...
-
06-06-25, 15:23 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #12
Όπως είπα για μένα τα πράγματα είναι απλά:
Δεν επιτρέπεται η χρήση του περιεχομένου για οποιαδήποτε χρήση εκτός από:
1. επιτρέπεται σε όλους τους ανθρώπους χρήστες του site να αναγνώσουν το περιεχόμενο, με κανονικό browser μία-δυο σελίδες τη φορά. Και μόνο για την προσωπική τους ανάγνωση.
2. την αυτοματοποιημένη συλλογή του για αποκλειστική χρήση σε μηχανές αναζήτησης και αρχειοθέτησης και μόνο για τις χρήσεις αναζητήσεως και αρχειοθέτησης.
Δεν αφήνει κανένα περιθώριο αμφισβήτησης ή θολώματος και εννοείται πως δεν επιτρέπει τη χρήση για ai training και τα λοιπά.
-
06-06-25, 15:33 Απάντηση: Re: Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση τη #13
Συμφωνώ και επαυξάνω.
Δεν είναι μόνο ότι δεν θα κέρδιζε το adslgr κάτι, αλλά και ο ίδιος ο χρήστης που το έγραψε θα μείνει στην αφάνεια, ό,τι και αν σημαίνει αυτό. Εδώ στο stackoverflow χτίστηκαν καριέρες και καριέρες επειδή γράψαν μία καλή απάντηση σε κάποια ερώτηση και το όνομά τους φαινόταν. Δηλαδή το περιεχόμενο αποσυνδέεται παντελώς από την πηγή και χάνεται ένα σημαντικό και θεμελιώδες κομμάτι: ποιος το έγραψε και γιατί.
Αυτό θα είναι και η κατάρρευση των AI, θα χαθούν στο τέλος οι πηγές και οι ίδιες οι πηγές θα έχουν χάσει πας ενδιαφέρον για να γράψουν κάτι καινούριο και έτσι θα καταλήξουμε στην αντιφατική κατάσταση της έλλειψης και συνάμα μη-παραγωγής άλλης γνώσεως.
-
06-06-25, 19:32 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #14
Υπάρχει μια συμφωνία μέσω του robots.txt με βάση τι είναι επιτρεπτό και τι όχι για ένα bot/crawler να κάνει. Παράνομο δεν ξέρω αν είναι αν το παραβιάζεις (το scraping είναι αρκετά γκρι, μπαίνει μέσα η έννοια του fair use), σίγουρα είναι ανήθικο. Πολλές φορές είναι απλά power posturing και όλας. Αν το ADSLgr ήταν gallery με εικόνες πχ και τα μποτάκια (OpenAI/Anthropic/δενξέρωτι) αποφάσιζανε να κάνουν scrape όλο το σαιτ για να εκπαιδεύσουν τα μοντέλα τους τότε ο φόρτος για serving θα έκανε peak για το adslgr και σε κάποιο σερβερ θα χτυπούσαν καμπανάκια (το χω δει να γίνεται). Πληρώνετε εσείς traffic/εργατοώρες κορόϊδα για να πληρώνουν οι χρήστες της Anthropic το Claude 80 και να μην χρειάζεται να κάνουν visit καν το site σας στο μέλλον.
-
06-06-25, 21:56 Απάντηση: Το Reddit μηνύει την Anthropic για data scraping ακόμα και διαγραμμένων posts, για εκπαίδευση της AI της #15
Στο παρελθόν τα δικαστήρια δεν έχουν συμφωνήσει με TOS όπου απαγορεύουν το scrapping. Αν είναι accessible σε ανθρώπους τότε είναι accessibleσε bots όπως search engine crawlers. Τώρα το ερώτημα είναι αν αυτό περιλαμβάνει και crawlers που προορίζονται για ΑΙ training.
Bookmarks