Αρχείο μαύρου κουτιού: Διατήρηση της κουλτούρας στην εποχή της γενετικής τεχνητής νοημοσύνης

Κυριακή 12 Ιανουαρίου 2025 ·

 


Το περιεχόμενο που δημιουργείται από AI θα κυριαρχήσει στο διαδίκτυο; Η Florence Smith Nicholls διερευνά αυτοματοποιημένες απειλές για την ανοιχτή πρόσβαση – και τη φροντίδα για τη διατήρηση των διαδικτυακών πολιτισμών

Αν σας ζητήσω να απεικονίσετε ένα αρχείο, τι βλέπετε; Σκονισμένα ράφια, σειρές βιβλίων; Περιέργειες πίσω από το γυαλί; Ή μήπως μια αποθήκη ανενεργών μέσων; Προσωπικά, δεν βλέπω πραγματικό χώρο – ή τουλάχιστον δεν είναι «πραγματικός» με την παραδοσιακή έννοια. Ως μέρος της έρευνάς μου σχετικά με τις αρχαιολογικές προσεγγίσεις στη συντήρηση παιχνιδιών υπολογιστή, έχω εργαστεί με μια πληθώρα διαδικτυακών αρχείων, από επίσημες κεντρικές βάσεις δεδομένων έως ad hoc wiki fan. Όλοι αυτοί είναι ανεκτίμητοι πόροι για τη διατήρηση της εφήμερης ψηφιακής κουλτούρας και για να γίνει προσβάσιμη.

Το Διαδικτυακό Αρχείο (archive.org), που ιδρύθηκε το 1996, είναι το πιο γνωστό από αυτά. Ο ιστότοπος της μη κερδοσκοπικής βιβλιοθήκης παρέχει δωρεάν πρόσβαση σε ψηφιοποιημένες συλλογές μουσικής και έντυπου υλικού, καθώς και σε σελίδες ιστοτόπων (μέσω του « Wayback Machine ») που αρχειοθετεί μέσω αυτοματοποιημένης τράτας συστημάτων. Το Αρχείο Διαδικτύου βρίσκεται σε πολυάριθμες νομικές διαμάχες για τη διάρκεια ζωής του, ειδικά όσον αφορά τα πνευματικά δικαιώματα. Τον Σεπτέμβριο του 2024, για παράδειγμα, το εφετείο των ΗΠΑ επικύρωσε μια προηγούμενη απόφαση στο Hachette v Internet Archive , στην οποία μια ομάδα εκδοτικών εταιρειών ισχυρίστηκε ότι ο δανεισμός πλήρων ψηφιακών αντιγράφων βιβλίων από το Αρχείο συνιστούσε παραβίαση πνευματικών δικαιωμάτων. Σε αυτή τη σύνθετη υπόθεση, το πιο σημαντικό εύρημα ήταν ότι ο δανεισμός του δεν θεωρήθηκε «δίκαιη χρήση».

Μια άλλη οντότητα περιηγείται επίσης τον Ιστό σε κλίμακα με την υπεράσπιση της δίκαιης χρήσης προστατεύοντας τη δραστηριότητά της: ο αμερικανικός ερευνητικός οργανισμός τεχνητής νοημοσύνης, OpenAI. Όπως καταδεικνύουν τα πρόσφατα γεγονότα, είναι ένας κανόνας για το OpenAI και τα περιθώρια κέρδους του, άλλος για ερευνητικά ιδρύματα όπως το Internet Archive.
AI Boom

Αυτήν τη στιγμή βρισκόμαστε στη μέση μιας έκρηξης της τεχνητής νοημοσύνης που άρχισε να ανθίζει στα τέλη της δεκαετίας του 2010, με το OpenAI να αποτελεί την πρωτοπορία. Αυτό οφείλεται εν μέρει στην ανάπτυξη του παραγωγικού chatbot AI ChatGPT – τώρα τόσο πανταχού παρόν όσο και αμφιλεγόμενο. Εταιρείες όπως το OpenAI δεν μπορούν να επιβιώσουν χωρίς τον τεράστιο όγκο δεδομένων που παρέχει το Διαδίκτυο για την εκπαίδευση των μοντέλων AI τους. Η εταιρεία δήλωσε μάλιστα σε μια υποβολή στην επιτροπή επικοινωνίας και ψηφιακής επιλογής της Βουλής των Λόρδων ότι: «Ο περιορισμός των δεδομένων εκπαίδευσης σε βιβλία και σχέδια δημόσιου τομέα που δημιουργήθηκαν πριν από περισσότερο από έναν αιώνα μπορεί να αποφέρει ένα ενδιαφέρον πείραμα, αλλά δεν θα παρείχε συστήματα AI που να ανταποκρίνονται στις ανάγκες των σημερινών πολιτών».

Ωστόσο, το Generative AI διαμορφώνει το Διαδίκτυο στη δική του εικόνα, καθιστώντας τις πηγές πληροφοριών ακόμη πιο συγκεχυμένες

Πράγματι, όπως κατέληξε στο συμπέρασμα μια πρόσφατη μελέτη της Πρωτοβουλίας Προέλευσης Δεδομένων , «Ο ιστός έχει λειτουργήσει ως τα κύρια «κοινά δεδομένα» για την τεχνητή νοημοσύνη γενικού σκοπού» – και ως απάντηση, μια ταχεία αύξηση των ιστότοπων που περιορίζει τους οργανισμούς τεχνητής νοημοσύνης από το να τους αφαιρούν περιεχόμενο. Ενώ η μελέτη το χαρακτηρίζει κυρίως ως απώλεια για τα συστήματα AI, επισημαίνει ότι αυτοί οι αυξανόμενοι περιορισμοί θα επηρεάσουν επίσης τους μη κερδοσκοπικούς οργανισμούς και την ακαδημαϊκή έρευνα.

Όπως τόνισε ο Μπραμ Κάερς, επίκουρος καθηγητής λογοτεχνίας της Μέσης Ολλανδίας στο Πανεπιστήμιο του Λέιντεν, πολλές βιβλιοθήκες και αρχεία έχουν υποκινήσει έργα ψηφιοποίησης των συλλογών τους την τελευταία δεκαετία προκειμένου να αυξηθεί η πρόσβαση. Συμβουλεύει ότι, «Πρέπει να κάνουμε μια κριτική συζήτηση σχετικά με την ανοιχτή διαθεσιμότητα πηγών οπτικής κληρονομιάς, όπως χειρόγραφα και πρώιμα έντυπα βιβλία, και πώς μπορεί να αξιοποιηθεί αυτή η πρόσβαση». Τα αρχεία που έχουν ψηφιοποιηθεί για έρευνα πληρώνουν το τίμημα για την εκμετάλλευση της τεχνητής νοημοσύνης δύο φορές, αφαιρούνται από την ανοιχτή διαδικτυακή πρόσβαση από φόβο μήπως ενσωματωθούν σε μοντέλα εκπαίδευσης – αν αυτό δεν έχει ήδη συμβεί.
Αρχεία μαύρου κουτιού

Η έλλειψη διαφάνειας γύρω από τους αλγόριθμους τεχνητής νοημοσύνης έχει δημιουργήσει ένα πρόβλημα μαύρου κουτιού, καθώς υπάρχει ευρεία κατανόηση της εισόδου και της εξόδου ενός συστήματος αλλά όχι της διαδικασίας που συνδέει τα δύο. Στην περίπτωση του ChatGPT, οι χρήστες μπορεί να μην γνωρίζουν καν όλα τα δεδομένα που εισήχθησαν στο σύστημα, πόσο μάλλον πώς και από ποιες πηγές το μοντέλο αντλούσε την έξοδο του.

Παρά τα βήματα που έγιναν για να περιοριστεί η κατανόηση των μοντέλων τεχνητής νοημοσύνης, το ίδιο το OpenAI ισχυρίστηκε ότι είναι « αδύνατο » να δημιουργήσει ένα εργαλείο όπως το ChatGPT χωρίς πρόσβαση σε υλικό που προστατεύεται από πνευματικά δικαιώματα. Με την τράτα του ιστού για τεράστιες ποσότητες δεδομένων, η δραστηριότητα των ανιχνευτών του μιμείται εκείνη των αρχειακών προσπαθειών – αλλά το αποτέλεσμα δεν είναι να συλλεχθεί για δημόσια αναφορά, αλλά μάλλον για ενσωμάτωση σε ένα τεράστιο μοντέλο δεδομένων που επεκτείνεται σε κλίμακα, παράγοντας αποτελέσματα χωρίς εύκολα επαληθεύσιμο πλαίσιο. Αυτός είναι ο λόγος για τον οποίο η γενετική τεχνητή νοημοσύνη μπορεί να θεωρηθεί αρχείο – και ειδικά αρχείο μαύρου κουτιού.

Στο Archive Fever , ο Jacques Derrida παρατηρεί: «Ό,τι δεν αρχειοθετείται πλέον με τον ίδιο τρόπο, δεν ζει πια με τον ίδιο τρόπο». Μπορούμε να ρωτήσουμε τώρα: τι σημαίνει αν κατανοούμε την ανθρώπινη εμπειρία Παρουσίαση στη σύνοδο κορυφής AI ​​For Good το 2023; Διακομιστές εσωτερικού αρχείου στο Σαν Φρανσίσκο. Τα κτίρια που σχεδιάστηκαν από τον χρήστη στο Wurm Online διαθλώνται όλο και περισσότερο μέσω του αρχείου μαύρου κουτιού της γενετικής τεχνητής νοημοσύνης;
Το διαδίκτυο πέθανε, ζήτω το διαδίκτυο;

Το περιεχόμενο που παράγεται από μοντέλα τεχνητής νοημοσύνης κατακλύζει τώρα το διαδίκτυο, καθώς συνεχίζει να χρειάζεται νέα δεδομένα που έχουν δημιουργηθεί από τον άνθρωπο. Εάν τα μοντέλα εκπαιδεύονται σε περιεχόμενο που δημιουργείται αναδρομικά, θα καταρρεύσει. Ωστόσο, το Generative AI διαμορφώνει το Διαδίκτυο στη δική του εικόνα, καθιστώντας τις πηγές πληροφοριών ακόμη πιο συγκεχυμένες.

Αυτή η εικόνα ενός Ouroboros AI που τρώει την ουρά του φέρνει επίσης στο μυαλό μια θεωρία συνωμοσίας που γεννήθηκε από τον διαδικτυακό κόσμο: τη νεκρή θεωρία του Διαδικτύου . Σύμφωνα με τους συνωμότες, από το 2016 το Διαδίκτυο ξεπερνιέται όλο και περισσότερο από τη δραστηριότητα των bot και το περιεχόμενο που δημιουργείται από την τεχνητή νοημοσύνη ως μέσο κρατικού ελέγχου. Ενώ το τελευταίο μέρος αυτής της θεωρίας είναι ακραίο και αβάσιμο, είναι αλήθεια ότι το Διαδίκτυο κατακλύζεται από την παραγωγή μοντέλων τεχνητής νοημοσύνης. Ερευνητές στα πανεπιστήμια του Κέιμπριτζ και της Οξφόρδης προβλέπουν ακόμη ότι η μεγάλη πλειονότητα του περιεχομένου του Διαδικτύου θα δημιουργείται με τεχνητή νοημοσύνη έως το 2026. Εξάλλου, οι άνθρωποι δεν δημιουργούν απλώς περιεχόμενο χρησιμοποιώντας εργαλεία όπως το ChatGPT, αλλά μοιράζονται επίσης αυτό το περιεχόμενο στο Διαδίκτυο. Η Wikipedia έχει ήδη εισαγάγει το δικό της έργο « Εκκαθάριση AI » για την καταπολέμηση του περιεχομένου που δημιουργείται από τεχνητή νοημοσύνη χωρίς πηγή, κακώς γραμμένο, το οποίο έχει πολλαπλασιαστεί σε ολόκληρο τον ιστότοπο.

Τον Οκτώβριο του 2024, το Αρχείο Διαδικτύου δέχτηκε τρεις επιθέσεις στον κυβερνοχώρο και έμεινε εκτός σύνδεσης για αρκετές εβδομάδες. Ήταν μια ανατριχιαστική υπενθύμιση του πώς η μοναδική του αξία για την διαδικτυακή ιστορία το καθιστά επίσης στόχο. Κατά τη διάρκεια αυτής της περιόδου, δεν μπορούσα να το χρησιμοποιήσω για να αποκτήσω πρόσβαση στο δικό μου ερευνητικό υλικό, το οποίο έχω δημοσιοποιήσει εκεί.

Ως μέρος αυτής της έρευνας, διεξήγαγα συνεντεύξεις με παίκτες του μαζικά δημοφιλούς διαδικτυακού παιχνιδιού για πολλούς παίκτες, Wurm Online. Το Wurm είναι ένα παιχνίδι φαντασίας 'sandbox' στο οποίο οι παίκτες μπορούν να δημιουργήσουν και να αλλάξουν πράγματα κατά βούληση, αντί να ακολουθήσουν μια προκαθορισμένη αφήγηση. Πήρα συνέντευξη από τον επιμελητή ενός μουσείου εντός παιχνιδιού που δημιουργήθηκε για να συλλέξει την τέχνη και τον πολιτισμό μιας κοινότητας τυχερών παιχνιδιών που υπάρχει εδώ και σχεδόν δύο δεκαετίες. Επειδή στο παιχνίδι αντικείμενα, που φέρουν τα σημάδια των δημιουργών τους, υποβαθμίζονται με την πάροδο του χρόνου, ο επιμελητής του Μουσείου Rockcliff (και άλλοι συνεργάτες) έχουν ξοδέψει αμέτρητες ώρες δουλεύοντας ψηφιακά για να τα ανακατασκευάσουν. Η φροντίδα που λαμβάνεται για τη διατήρηση της προέλευσης αυτών των ψηφιακών αντικειμένων μοιάζει με ανάθεμα στο αρχείο του μαύρου κουτιού.
Αυτό το άρθρο εμφανίστηκε για πρώτη φορά στο Τεύχος #246 Extremely Online . Εγγραφείτε σήμερα για να υποστηρίξετε τα ανεξάρτητα σοσιαλιστικά μέσα και λάβετε το αντίγραφό σας από τον Τύπο!

Η Επανάσταση του 1943

Η Επανάσταση του 1943

revolution in the world

ελευθερη εκφραση

Η λίστα ιστολογίων μου

προσωπικές ιστοσελίδες

τύπος

διαφορα

È