OSI: Η AI ανοιχτού κώδικα πρέπει να αποκαλύπτει τα δεδομένα που χρησιμοποιούνται για εκπαίδευση

Η Πρωτοβουλία για το Ανοικτό Λογισμικό (Open Source Initiative – OSI) δημοσίευσε τον επίσημο ορισμό της για την «ανοιχτή» τεχνητή νοημοσύνη, σε μια εξέλιξη που μπορεί οδηγεί σε αντιπαράθεση με μεγάλες τεχνολογικές εταιρείες όπως η Meta, της οποίας τα μοντέλα δεν πληρούν τους νέους κανόνες.

Η OSI αποτελεί εδώ και χρόνια τον κύριο οργανισμό για τον καθορισμό των προδιαγραφών του ανοικτού λογισμικού, αλλά τα συστήματα τεχνητής νοημοσύνης περιλαμβάνουν στοιχεία που δεν καλύπτονται από τις συμβατικές άδειες, όπως τα δεδομένα εκπαίδευσης των μοντέλων. Στο εξής, για να θεωρείται ένα σύστημα τεχνητής νοημοσύνης πραγματικά ανοιχτό, πρέπει να παρέχει πρόσβαση σε λεπτομέρειες σχετικά με τα δεδομένα που χρησιμοποιήθηκαν για την εκπαίδευσή του -ώστε να μπορούν άλλοι να το κατανοήσουν και να το αναπαραγάγουν- τον πλήρη κώδικα που χρησιμοποιείται για την κατασκευή και τη λειτουργία του, καθώς και τις ρυθμίσεις από την εκπαίδευση, τα οποία συμβάλλουν στην παραγωγή των αποτελεσμάτων του.

Αυτός ο ορισμός έρχεται σε άμεση αντίθεση με το μοντέλο Llama της Meta, το οποίο προωθείται ως το μεγαλύτερο ανοιχτό μοντέλο τεχνητής νοημοσύνης. Αν και το Llama είναι διαθέσιμο για λήψη και χρήση, περιλαμβάνει περιορισμούς για εμπορική χρήση (για εφαρμογές με πάνω από 700 εκατομμύρια χρήστες) και δεν παρέχει πρόσβαση στα δεδομένα εκπαίδευσης, γεγονός που το αποκλείει από τα πρότυπα της OSI για την ανεμπόδιστη χρήση, τροποποίηση και διανομή.

Η εκπρόσωπος της Meta, Faith Eischen, δήλωσε στο Verge ότι «συμφωνούμε με την OSI σε πολλά», αλλά η εταιρεία διαφωνεί με αυτόν τον ορισμό. «Δεν υπάρχει ένας μοναδικός ορισμός για την ανοιχτή τεχνητή νοημοσύνη, και είναι πρόκληση να διατυπωθεί, καθώς οι προηγούμενοι ορισμοί του ανοικτού λογισμικού δεν καλύπτουν τις πολυπλοκότητες των σημερινών ταχέως εξελισσόμενων μοντέλων τεχνητής νοημοσύνης.» «Θα συνεχίσουμε να συνεργαζόμαστε με την OSI και άλλους κλάδους της βιομηχανίας για να κάνουμε την τεχνητή νοημοσύνη πιο προσβάσιμη και ελεύθερη, ανεξάρτητα από τους τεχνικούς ορισμούς», πρόσθεσε η Eischen.

Για 25 χρόνια, ο ορισμός της OSI για το ανοιχτό λογισμικό ήταν ευρέως αποδεκτός από τους developers που επιθυμούν να βασιστούν στο έργο των άλλων χωρίς φόβο για αγωγές ή παγίδες αδειοδότησης. Τώρα, καθώς η τεχνητή νοημοσύνη επαναπροσδιορίζει το τοπίο, οι τεχνολογικοί κολοσσοί βρίσκονται μπροστά σε μια κρίσιμη επιλογή: να υιοθετήσουν αυτές τις καθιερωμένες αρχές ή να τις απορρίψουν. Το Linux Foundation έχει επίσης επιχειρήσει πρόσφατα να καθορίσει τι σημαίνει «ανοιχτή τεχνητή νοημοσύνη», σηματοδοτώντας έναν αυξανόμενο διάλογο σχετικά με το πώς οι παραδοσιακές αξίες του ανοικτού λογισμικού θα προσαρμοστούν στην εποχή της τεχνητής νοημοσύνης.

«Τώρα που έχουμε έναν σαφή ορισμό, μπορούμε ίσως να αντιταχθούμε πιο δυναμικά σε εταιρείες που “ξεπλένουν” την έννοια του ανοιχτού λογισμικού, δηλώνοντας ότι το έργο τους είναι ανοιχτό όταν στην πραγματικότητα δεν είναι», δήλωσε ο Simon Willison, ανεξάρτητος ερευνητής και δημιουργός του ανοικτού εργαλείου Datasette. Ο διευθύνων σύμβουλος της Hugging Face, Clément Delangue, χαρακτήρισε τον ορισμό της OSI «σημαντικό βήμα για τη διαμόρφωση της συζήτησης γύρω από τη διαφάνεια στην τεχνητή νοημοσύνη, ειδικά σε ό,τι αφορά τον κρίσιμο ρόλο των δεδομένων εκπαίδευσης.»

Ο εκτελεστικός διευθυντής της OSI, Stefano Maffulli, ανέφερε ότι η πρωτοβουλία χρειάστηκε δύο χρόνια για να διαμορφώσει τον συγκεκριμένο ορισμό, σε συνεργασία με εμπειρογνώμονες παγκοσμίως μέσω μιας συνεργατικής διαδικασίας. Αυτή η διαδικασία περιλάμβανε συνεργασία με ειδικούς από την ακαδημαϊκή κοινότητα, στη μηχανική μάθηση και την επεξεργασία φυσικής γλώσσας, φιλοσόφους, δημιουργούς περιεχομένου από τον κόσμο των Creative Commons και άλλους.

Παρόλο που η Meta επικαλείται ανησυχίες για την ασφάλεια για τον περιορισμό της πρόσβασης στα δεδομένα εκπαίδευσής της, οι επικριτές βλέπουν έναν απλούστερο στόχο: την ελαχιστοποίηση της νομικής ευθύνης και την προστασία του ανταγωνιστικού της πλεονεκτήματος. Πολλά μοντέλα τεχνητής νοημοσύνης είναι πιθανότατα εκπαιδευμένα σε υλικό με πνευματικά δικαιώματα. Τον Απρίλιο, οι *New York Times* ανέφεραν ότι η Meta είχε παραδεχτεί εσωτερικά ότι υπήρχε περιεχόμενο με πνευματικά δικαιώματα στα δεδομένα εκπαίδευσης «επειδή δεν υπάρχει τρόπος να το αποφύγουμε». Υπάρχει μια σειρά αγωγών κατά της Meta, OpenAI, Perplexity, Anthropic και άλλων για φερόμενη παραβίαση δικαιωμάτων, αλλά με σπάνιες εξαιρέσεις οι ενάγοντες πρέπει αυτή τη στιγμή να βασίζονται σε ενδείξεις για να αποδείξουν ότι το έργο τους έχει υποστεί λήψη δεδομένων.

Η επίδραση της τεχνητής νοημοσύνης θα ξεπεράσει τη βιομηχανική επανάσταση

Η Δικαιοσύνη αναβαθμίζεται ψηφιακά με συστήματα Τεχνητής Νοημοσύνης

Ξεκινά η υλοποίηση του εμβληματικού έργου AI Factory «Pharos»

Phison: Συμμετείχε στο πρώτο σεληνιακό data center, «βλέπει» Ελλάδα για AI και data centers

Skroutz Βοηθός AI: το επόμενο βήμα στο online shopping

Η Uni Systems αναγνωρίζεται επίσημα για την εξειδίκευσή της στην ανάπτυξη εφαρμογών AI σε Microsoft Azure

OSI: Η AI ανοιχτού κώδικα πρέπει να αποκαλύπτει τα δεδομένα που χρησιμοποιούνται για εκπαίδευση

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ