Musica e Intelligenza Artificiale: un dilemma creativo che merita chiarezza

In questo articolo, desidero analizzare la relazione tra musica e modelli generativi di intelligenza artificiale (IA), partendo dal presupposto che il lettore non sia un esperto di machine learning e che, come tanti, sia stato “bombardato” da una pioggia di notizie riguardo a modelli sempre più potenti e competitivi.

In particolare, mi interessa cercare di spiegare brevemente cosa sia un modello generativo (senza alcun formalismo, nè presupposta conoscenza di matematica), come viene addestrato e quali risultati sia realmente in grado di produrre. In modo schematico, le domande a cui vorrei dare una risposta sono:

  • Può un modello generativo creare nuova musica?
  • Che cosa significa “nuova” nell’ambito di questi modelli di intelligenza artificiale?
  • Quali sono le possibilità e limiti di questi modelli?

Per cercare di rendere l’articolo fruibile da un pubblico eterogeneo, eviterò ogni formalismo, ma cercherò di mantenere il rigore necessario per evitare fastidiose derive verso posizioni ideologiche prive di senso. I progressi dell’intelligenza artificiale hanno portato a risultati sorprendenti e inimmaginabili dieci anni fa e molti artisti possono trarre grandi benefici da essa. Tuttavia, come generalmente accade con i prodotti tecnologici, l’eccesso di fiducia e la fantasia possono alimentare idee malsane che non hanno fondamento scientifico.

Dunque, cerchiamo di farci strada tra decine di innovazioni dai nomi criptici per cercare di rispondere alla domanda: può un modello generativo basato su intelligenza artificiale comporre musica come un essere umano?

Un robot basato su intelligenza artificiale che compone e suona musica

Cos’è un modello generativo di intelligenza artificiale (in pillole)

Un modello generativo è un tipo di modello di intelligenza artificiale (IA) che mira a generare nuovi dati simili ai dati di input su cui è stato addestrato. Questi modelli sono progettati per comprendere modelli e relazioni all’interno dei dati per creare qualcosa di nuovo. I modelli generativi funzionano apprendendo la struttura sottostante dei dati di input e quindi utilizzando tale conoscenza per generare nuovi campioni.

Prima di proseguire, è bene chiarire cosa significa “campioni”. Per farlo, farò riferimento a un noto insieme di dati creato dalla MNIST americana per addestrare i primi modelli di OCR (Optical Character Recognition). Il dataset è composto da 70.000 campioni di cifre (da 0 a 9) scritte a mano da soggetti diversi.

Esempi di cifre tratte dal dataset MNIST per l'addrestramento di modelli di intelligenza artificiale
Esempi di cifre scritte a mano tratte dal dataset MNIST.

Come si può vedere, ogni cifra è riportata in 7000 versioni “diverse” prodotte dall’azione manuale di altrettante persone. Nonostante tale dataset sia stato creato per addestrare generalmente modelli cosidetti supervisionati (ovvero, ciascun immagine ha associata un’etichetta che indica il numero rappresentato e il modello deve imparare a trasformare cifre scritte in valori codificati), esso può essere molto utile anche per spiegare ai non addetti ai lavori come funziona un modello generativo.

Se supponete di analizzare la riga delle cifre che rappresentano il “5”, potrete subito rendervi conto che, nonostante, gli elementi strutturali siano gli stessi (e.g., asticella orizzontale in alto, semicerchio in basso, etc.), ogni campione è diverso dagli altri. In altre parole, esistono diversità nella regolarità.

Senza entrare nel merito di discussioni matematiche, possiamo affermare che un modello generativo si basa su tutte le “forme” che vengono usate per l’addestramento per determinare i caratteri astratti comuni. Nella fase, detta appunto “generativa”, esso farà riferimento a tali elementi per estrarre casualmente un campione dalla distribuzione di probabilità appresa. In parole molto povere: esso tira a sorte tra potenzialmente infinite rappresentazioni e produce un output che rispetta le regole astratte pur essendo completamente nuovo (su questo punto torneremo presto).

Una delle caratteristiche principali dei modelli generativi è la loro capacità di creare output realistici e diversificati. Esempi di modelli generativi recenti includono GPT-3 (Generative Pre-trained Transformer 3) sviluppato da OpenAI, noto per le sue capacità di generazione del linguaggio e la capacità di produrre testo simile a quello umano. Un altro esempio degno di nota è StyleGAN2, un modello sviluppato da NVIDIA per generare immagini di alta qualità con dettagli realistici.

I modelli generativi hanno una vasta gamma di applicazioni, tra cui la generazione di testo, la sintesi di immagini e persino la composizione musicale. La loro versatilità e la capacità di creare nuovi contenuti li rendono uno strumento potente nel campo dell’intelligenza artificiale. Tuttavia, prima di adoperarli senza troppi scrupoli, è bene conoscerne sia le possibilità che i limiti.

Un modello generativo di intelligenza artificiale che produce musica, testi e immagini
Un modello generativo di intelligenza artificiale che produce musica, testi e immagini sulla base di regole astratte apprese durante la fase di addestramento (basata su milioni di esempi creati dall’uomo).

Riassumendo:

Pro

I modelli generativi di intelligenza artificiale addestrati con milioni di esempi possono creare costruzioni basate sulla combinazione di elementi imitativi, aprendo nuove possibilità creative nella musica, nell’arte e nella letteratura. Questi modelli sono in grado di armonizzare diversi elementi, offrendo nuove prospettive compositive e stilistiche. Rispettano le regole sintattico-semantiche imparate durante l’addestramento, garantendo una produzione coerente e di alta qualità.

Contro

I modelli generativi di intelligenza artificiale possono creare solo sulla base di ciò che è stato utilizzato per il loro addestramento, mancando di fantasia e originalità umana. Non possono andare oltre ciò che è stato precedentemente imparato, limitando la loro capacità di creare qualcosa di davvero unico e innovativo.

Musica e creatività

La creatività musicale nella storia ha dato vita a una vasta gamma di stili, idee e innovazioni che hanno segnato la produzione artistica. I compositori hanno sperimentato e combinato elementi melodici, armonici, contrappuntistici, strumentali, timbrici, ritmici e molti altri, creando nuove forme musicali e sfidando le convenzioni esistenti.

Spesso, gli artisti hanno superato le regole e le restrizioni tradizionali per creare opere uniche e sorprendenti che non potevano essere assimilate alle precedenti. Ad esempio, l’armonia ha subito notevoli cambiamenti nel corso della storia musicale, alcuni dei quali hanno portato all’introduzione di dissonanze e all’atonalità, aprendo nuovi orizzonti espressivi per i musicisti.

La creatività musicale si è rivelata una forza inarrestabile che continua a plasmare e ridefinire il panorama artistico. In altre parole, è sì possibile osservare analogie tra opere dello stesso compositore e scritte in periodi storicamente vicini, ma è raro che la vere rivoluzioni si siano basate sull’applicazione di principi astratti a temi e melodie diverse.

Per comprendere meglio ciò che voglio dire, ci possiamo porre due domande:

  1. Perchè Mozart, quando ha composto la Sinfonia 35, non ha composto la 40?
  2. Come si può conciliare l’opera di Schoenberg con quella di Bach?

Ho scelto queste due domande con uno scopo preciso che sarà presto chiaro. Proviamo dunque a rispondere alla prima.

Mozart ha composto musica tirando a sorte?

La risposta sembra scontata. Se davvero il genio salisburghese avesse “semplicemente” usato un dado per comporre la sua musica, avrebbe potuto scrivere centinaia di sinfonie in solo qualche mese, ma così non è stato. Ogni scelta si basava (più o meno) su quella che suole chiamarsi “ispirazione”, ovvero dal fiorire e dallo sviluppo di un’idea con un’intenzionalità ben precisa.

E’ vero che il motivo di apertura della Sinfonia n. 40 potrebbe essere prodotto da un programma al computer che genera migliaia di combinazioni (senza alcuna necessità di intelligenza artificiale), ma se anche così fosse, basterebbe ciò a sviluppare 30 minuti di musica? E, soprattutto, che ruolo gioca la volontà di esprimere un particolare affetto e emozione?

La scelta di una tonalità minore, di un ritmo incalzante e di movimenti melodici accompagnati da un’armonia che alterna tensione a un temporaneo rilassamento, sembrano tutti elementi frutto di una decisione deliberata, non del cieco caso. In altre parole, il “processo generativo” di Mozart appare molto più deterministico di quanto si immagini, soprattutto quando si tratta di violare regole astratte per fare qualcosa mai sentito prima.

A questo punto possiamo affrontare la seconda domanda.

Schoenberg e Bach compongono e suonano musica insieme
Uno Schoenberg del XX secolo e un Bach tardo-barocco compongono e suonano musica insieme in uno scenario astratto e surreale.

L’intelligenza (naturale) di Bach e quella di Schoenberg: quando la musica sorprende se stessa

Johann Sebastian Bach, figura di spicco del periodo barocco, è stato un compositore e musicista tedesco rinomato per la sua eccezionale capacità di lavorare con la polifonia armonica. Nato in una famiglia di musicisti, l’eredità di Bach comprende una vasta collezione di composizioni che mettono in mostra la sua maestria nel contrappunto complesso e nelle armonie intricate. Il suo approccio innovativo alla teoria musicale e alla composizione rivoluzionò il panorama musicale dell’epoca, guadagnandosi la reputazione di uno dei più grandi compositori di tutti i tempi.

La profonda conoscenza di Bach delle trame polifoniche gli ha permesso di creare intrecci musicali ricchi e intricati che continuano ad affascinare il pubblico di tutto il mondo. La sua meticolosa attenzione ai dettagli e la sua impareggiabile maestria sono evidenti in opere come i Concerti Brandeburghesi, il Clavicembalo ben temperato, le due Passioni, le Cantate e la Messa in si minore. Attraverso la sua impareggiabile abilità nel lavorare con la polifonia armonica, Bach ha creato un repertorio diversificato che comprende musica corale sacra, opere strumentali solistiche e composizioni per tastiera, lasciando un segno indelebile nella storia della musica.

Adesso facciamo un salto in avanti e facciamo accomodare il Kantor presso il teatro dove stanno per andare in scena i 5 pezzi per orchestra op. 16 di Arnold Schoenberg. Cosa potremmo aspettarci? Forse le buone maniere (molto indubbie, date le testimonianze) di Bach eviterebbero un’esplosione di collera, ma sono certo che in cuor suo, il maestro di Lipsia penserebbe, o a uno scherzo o di stare assistendo all’opera di un compositore internato in un manicomio.

Musica rivoluzionaria contro intelligenza artificiale: un duello che non può avere luogo

Questo è esattamente lo stesso punto di vista di un modello generato di intelligenza artificiale: il mai visto, mai letto, mai sentito equivale, nella migliore delle ipotesi, a un fenomeno estremamente improbabile. L’idea (brillante, a parer mio) di Schoenberg di emancipare le successioni di dissonanze non risolte è stata una rivoluzione dello status quo mai stata ascoltata in precedenza. Dunque, se tali brani non vengono impiegati per l’addestramento di un modello, come può il modello produrli?

La risposta è semplicemente che nessun buon modello produrrebbe tali campioni e, qualora lo facesse, essi sarebbero sintomatici di un malfunzionamento, di una struttura carente o di un addestramento sbagliato. In poche parole: se l’intelligenza artificiale ci stupisce, è molto probabile che, nello stesso tempo, ci deluda enormemente (soprattutto gli ingegneri che l’hanno progettata).

La storia della musica in un'immagine astratta
La storia della musica in un’immagine astratta: ogni rivoluzione passa attraverso la visione di qualcosa si situa oltre le regole comuni.

Conclusioni

I modelli generati di intelligenza artificiale possono generare buona musica secondo regole prestabilite, ma non sono in grado di inventare nulla di veramente rivoluzionario. Essi possono essere utilizzati per vari scopi creativi (come scrivere basi o comporre musica ambientale o di sottofondo da rimaneggiare a piacimento).

Tuttavia la genuina arte compositiva richiede di trascendere le regole astratte per creare la vera novità. I modelli generativi di intelligenza artificiale hanno dei limiti e delle possibilità specifiche, in quanto il loro addestramento si basa sulle creazioni già esistenti. Pertanto, diventa impossibile o improbabile per loro superare le regole apprese per inventarne di nuove.

Temere che l’intelligenza artificiale possa soppiantare l’uomo in compiti di pura creatività (come la musica, la poesia, la pittura, etc.) è una paura infondata che, per il momento, non ha ragione di esistere. L’uomo è stato sempre spinto verso il superamento delle regole e ciò ha permesso la creazione delle più importanti opere mondiali. Fintantochè le rivoluzioni culturali saranno il cuore pulsante dell’avanzamento della civiltà, nessun modello “convervatore” può mai sostitursi a un uomo intrinsecamente “progressista”.

Dunque, lasciamoci sorprendere dalle pure invenzioni dell’uomo e cerchiamo di trarre il massimo beneficio dagli strumenti tecnologici che, dal canto loro, meritano tutto il nostro rispetto, in quanto anch’essi prodotto dell’intelletto umano.

Le immagini presenti in questo articolo sono state generate con l’intelligenza artificiale e, come potete rendervi conto, nessuna di esse mi ha sorpreso per scelte “astratte” mai viste prima.


Se ti piace l’articolo, puoi sempre fare una donazione per supportare la mia attività. Basta un caffè! E non dimenticarti di iscriverti alla mia newsletter settimanale!


Share this post on:
FacebookTwitterPinterestEmail

Articoli correlati