Friday, September 20, 2024

Traduzione Reddit knowledge DAO e tutto ciò che c’è da sapere sull’addestramento del modello di Gen AI

Il Cryptonomist ha intervistato Anna Kazlauskas, CEO e Co-fondatrice di Vana’s, che Reddit Knowledge DAO, che nella prima settimana ha visto 140k utenti iscriversi con account Reddit verificati. Anna ora sta lavorando con gli sviluppatori per costruire Knowledge DAO per altre piattaforme, come LinkedIn e ChatGPT. 

Oltre ai DAO, hanno altri sbocchi per gli utenti per raggruppare i loro dati in dataset che possono poi essere utilizzati per l’addestramento di modelli GenAI, come la creazione di ritratti o avatar.

Oltre a ciò che Vana sta facendo, con Anna abbiamo parlato della crescita dello spazio AI decentralizzato, poiché le piattaforme aiutano le persone a utilizzare e monetizzare i loro dati per nuove applicazioni. 

Puoi fornire una panoramica di Vana e della sua missione nello spazio AI decentralizzato?

Vana è una piattaforma AI di proprietà degli utenti alimentata da dati di proprietà degli utenti. La nostra missione è che gli utenti possiedano i loro dati e il valore che essi creano attraverso modelli AI. C’è un crescente bisogno di più dati di addestramento per migliorare le prestazioni dei modelli AI, poiché in definitiva i modelli AI sono validi solo quanto i loro dati. 

Advert esempio, LLaMA 3 è addestrato su circa 15 trilioni di parole, che è approssimativamente la quantità di dati disponibili su web pubblico. Le aziende stanno ora cercando di acquisire più dati, a volte pagando centinaia di milioni di dollari per ottenerli. Le principali piattaforme tecnologiche stanno accumulando preziosi dati degli utenti e costruendo nuove tecnologie senza considerare i permessi degli utenti, il che sta frenando l’innovazione. 

Da Vana, stiamo liberando i dati da questi giardini recintati mettendoli sotto il controllo degli utenti. Permettiamo agli utenti di contribuire direttamente ai modelli di AI, scegliere come vengono utilizzati i loro dati e come viene utilizzata l’AI. Crediamo di poter effettivamente superare i modelli chief se possiamo accedere ai dati migliori, superando le prestazioni di modelli come GPT-6 accedendo ai dati disponibili solo direttamente dagli utenti. Vana è architettata come una blockchain di livello 1 progettata da zero per dati privati e di proprietà degli utenti. 

Il Reddit Knowledge DAO ha visto 140k utenti iscriversi nella sua prima settimana. Cosa pensi abbia guidato questa rapida adozione e quali lezioni hai imparato da questo lancio?

Il Reddit Knowledge DAO è stato un incredibile successo dal punto di vista dell’adozione, con oltre 140k utenti che si sono iscritti nella prima settimana. Questo livello di adozione è insolito per i DAOs–è ora il più grande knowledge DAO nella storia. 

Una delle cose che ha guidato l’adozione rapida è che gran parte della storia period già stata delineata, poiché gli utenti stanno diventando sempre più consapevoli del valore dei loro dati attraverso la copertura mediatica delle vendite di dati. Renderti conto che Reddit sta vendendo i tuoi dati per $200M o che Apple sta acquistando dati per $50M ti rende molto più consapevole del loro valore. 

C’è anche un forte appetito per i prodotti di proprietà degli utenti costruiti in web3 che vanno oltre i familiari prodotti DeFi verso una nuova frontiera della proprietà. Stiamo vedendo questa tendenza in progetti come Farcaster, reti DePIN e knowledge DAOs costruiti su Vana, che rappresentano una nuova ondata di prodotti di proprietà degli utenti.

Una lezione importante è stata la necessità di requisiti di prova di contributo. Oltre un milione di persone hanno cercato di unirsi al Reddit Knowledge DAO, ma molti non soddisfacevano i criteri di avere un account Reddit che esistesse da un certo tempo e avesse una quantità minima di dati. Questo evidenzia l’importanza di avere meccanismi per garantire contributi di qualità.

Hai menzionato piani per creare Knowledge DAOs per piattaforme come LinkedIn e Chat GPT. Quali sfide e opportunità uniche vedi nell’espanderti su queste piattaforme?

Vana è una rete peer to see per dati di proprietà degli utenti, e i costruttori hanno creato vari knowledge DAO come il Reddit Knowledge DAO, LinkedIn Knowledge DAO e ChatGPT Knowledge DAO. 

Queste numerous fonti di dati sono incredibilmente preziose per l’addestramento dei modelli di AI, ma attualmente sono bloccate in giardini recintati. Ognuna di queste piattaforme può essere difficile da cui estrarre dati, ma è sempre possibile a causa della regolamentazione dei dati.

Come Vana consente agli utenti di monetizzare i loro dati e quali sono alcuni esempi di come gli utenti hanno beneficiato di questo?

Il nostro obiettivo è aiutare gli utenti a monetizzare e proteggere i loro dati simultaneamente. Advert esempio, con il Reddit Knowledge DAO, stanno ora addestrando un modello di proprietà degli utenti (principalmente focalizzato sul shitposting in questa fase, ma è un inizio). Gli utenti vengono pagati ogni volta che il modello viene utilizzato, creando un incentivo economico per la proprietà congiunta del modello. 

E i dati dell’utente rimangono completamente privati – piuttosto che vendere i dati, i dati vengono semplicemente “affittati” dove i dati sottostanti non lasciano mai l’ambiente sicuro. 

Con la crescente preoccupazione per la privateness dei dati, come garantisce Vana che i dati degli utenti siano sicuri e utilizzati eticamente all’interno dei Knowledge DAOs?

La privateness dei dati è passata dall’essere solo una questione ideologica o di preferenza a una questione economica. Se qualcuno ha i tuoi dati, può potenzialmente creare una versione AI di te che è economicamente preziosa, generando entrate e potenzialmente competendo con te. Ecco perché la privateness è così importante e centrale per Vana. 

Abbiamo inventato un concetto chiamato “dati non-custodial”, che è simile a un portafoglio non-custodial ma per i tuoi dati personali. Mantiene i tuoi dati sotto il tuo pieno controllo, autorizzati dalla tua chiave privata. Questo permette ai tuoi dati di essere portabili tra le applicazioni e aggiunge uno strato finanziario nativo sopra, permettendo la costruzione di cose come i dati DAOs.

Come i dataset creati attraverso i Knowledge DAO di Vana migliorano l’addestramento dei modelli di AI generativa e quali vantaggi offrono rispetto ai dataset tradizionali?

Tipicamente, i modelli di AI vengono addestrati con dati estratti da web pubblico – dati disponibili senza dover effettuare il login da nessuna parte. Ma se ci pensi dal punto di vista di insegnare a un bambino sul mondo, non vorresti che vagasse casualmente su web pubblico. Vorresti dargli informazioni di alta qualità che potrebbero non essere disponibili pubblicamente – cose come scrittura di alta qualità, processi di pensiero o messaggi. L’AI è principalmente addestrata su dati pubblici, ma ha davvero bisogno di dati privati per spingere le frontiere. Questo è ciò che i knowledge DAOs abilitano: utenti che contribuiscono con i loro dati privati per creare AI di proprietà degli utenti. 

Crediamo che l’IA debba essere creata più come software program open supply, da una comunità. Il nostro obiettivo è dare ai ricercatori accesso ai migliori dataset che sono attualmente tenuti prigionieri all’interno di giardini recintati per spingere i confini delle prestazioni dell’IA.

Quali tendenze prevedi nello spazio dell’IA decentralizzata nei prossimi 5-10 anni e come si sta posizionando Vana per guidare in questo panorama in evoluzione?

Lo spazio AI decentralizzato ha davvero accelerato nell’ultimo anno. Advert esempio, all’EthCC di quest’anno, c’period un evento AI decentralizzato quasi ogni giorno, rispetto a nessuno l’anno scorso. Le persone stanno capendo come applicare le tecnologie sovrane che hanno funzionato bene per la finanza allo spazio AI. A Vana, crediamo che la base fondamentale di tutto questo sia i dati. Per costruire AI di proprietà degli utenti e AI sovrana, hai bisogno di dati di proprietà degli utenti, quindi il nostro obiettivo è su quel pezzo di dati.

Nei prossimi 5-10 anni, sono entusiasta di alcuni traguardi: 1) Un modello di fondazione di proprietà degli utenti collettivamente posseduto da 100 milioni di persone. 2) Più agenti AI autonomi che possono guadagnare autonomamente, e garantire che quegli agenti siano veramente di proprietà degli utenti che hanno contribuito al loro addestramento. 

Man mano che l’IA assume un ruolo economico sempre più importante, è fondamentale garantire che il potere sia ampiamente distribuito sia da una prospettiva tecnica che sociale. 

Puoi condividere di più sulla tua collaborazione con gli sviluppatori per costruire Knowledge DAOs? Quali sono alcuni dei progetti innovativi attualmente in cantiere?

Vana è una rete senza permessi, quindi chiunque può costruire un knowledge DAO. È una blockchain layer one progettata da zero per dati privati e di proprietà dell’utente. Ci sono oltre 100 knowledge DAO distribuiti sulla testnet Satori oggi. Molti dei costruttori sono partecipanti iniziali nell’ecosistema Bittensor che comprendono profondamente l’intersezione tra crypto e AI. Alcuni progetti notevoli includono il Twitter Knowledge DAO, LinkedIn Knowledge DAO e GitHub Knowledge DAO. Stiamo anche collaborando con progetti nello spazio ZK e nello spazio degli strumenti DAO per rendere i knowledge DAO ancora più facili da creare e gestire.

Quali considerazioni etiche sono più urgenti nello sviluppo dell’AI decentralizzata, e come affronta Vana queste questioni?

Penso che una delle domande più grandi nell’IA oggi sia chi dovrebbe possedere i modelli e decidere quali dati vi entrano. Man mano che iniziamo a fare sempre più affidamento sull’IA per le informazioni, diventano la nostra fonte di verità. Chiunque decida cosa entra nell’IA sta essenzialmente decidendo la verità. È spaventoso avere un’unica entità che controlla questo. La nostra visione in Vana è che la comunità, non una singola azienda, dovrebbe prendere queste decisioni.

Un’altra domanda che sorge nell’AI decentralizzata è: se l’AI è completamente decentralizzata, cosa succede se l’AI diventa ribelle e non c’è un pulsante di spegnimento? Il modo in cui affrontiamo questo problema a Vana è che i modelli di AI sono in definitiva di proprietà degli utenti che vi hanno contribuito, quindi rimangono sempre sotto il loro pieno controllo. 

Quali consigli daresti agli aspiranti imprenditori che desiderano entrare nello spazio dell’IA decentralizzata, basandoti sulle tue esperienze con Vana e Knowledge DAOs?

È un ottimo momento per iniziare a costruire nello spazio dell’IA decentralizzata. Ci sono molte opportunità per applicare alcuni dei primitivi economici crypto che hanno funzionato bene per DeFi alla nuova categoria emergente di dati e IA decentralizzati. Consiglierei anche di dedicare del tempo advert approfondire lo spazio dell’IA open supply non crypto per conoscere alcuni degli approcci che le persone stanno adottando al di fuori di un contesto crypto. Mi immergerei direttamente in alcuni dei progetti esistenti per vedere quali tipi di primitivi sono disponibili per costruire, incluso provare a iniziare un knowledge DAO su Vana. 

Related Articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Latest Articles