Valori asimmetrici di Shapley

La soluzione di spiegazione del modello di previsione delle serie temporali SageMaker Clarify è un metodo di attribuzione delle funzionalità radicato nella teoria dei giochi cooperativi, simile nello spirito a SHAP. In particolare, Clarify utilizza valori di gruppo in ordine casuale, noti anche come valori asimmetrici di Shapley nel machine learning e nella spiegabilità.

Contesto

L’obiettivo è calcolare le attribuzioni per le funzionalità di input in un determinato modello di previsione f. Il modello di previsione accetta gli input seguenti:

Serie temporali passate (TS di destinazione). Ad esempio, potrebbe trattarsi di passeggeri ferroviari che ogni giorno percorrevano il Paris-Berlin tragitto, indicati con x. _t
(Facoltativo) Una serie temporale covariata. Ad esempio, potrebbe trattarsi di festività e dati meteorologici, indicati con z_t ∈ R^S. Se utilizzata, la TS covariata potrebbe essere disponibile solo per le fasi temporali passate oppure anche per quelle future (incluse nel calendario delle festività).
(Facoltativo) Le covariate statiche, ad esempio la qualità del servizio (ad esempio, prima o seconda classe), sono indicate da u ∈ R^E.

Le covariate statiche, le covariate dinamiche o entrambe possono essere omesse, a seconda dello scenario applicativo specifico. Dato un orizzonte di previsione K ≥ 0 (ad esempio K = 30 giorni), la previsione tramite modello può essere caratterizzata dalla formula: f(x_[1:T], z_[1:T+K], u) = x_{[T+1:T +K+1]}.

Il diagramma seguente mostra una struttura delle dipendenze per un modello di previsione tipico. La previsione nel momento t+1 dipende dai tre tipi di input menzionati in precedenza.

Metodo

Le spiegazioni vengono calcolate eseguendo query sul modello delle serie temporali f su una serie di punti derivati dall’input originale. Seguendo i costrutti della teoria dei giochi, Clarify calcola la media delle differenze nelle previsioni dovute all’offuscamento (ovvero all’impostazione di un valore baseline) iterativo di parti degli input. La struttura temporale può essere esplorata in ordine cronologico, anticronologico o entrambi. Le spiegazioni cronologiche vengono create aggiungendo informazioni in modo iterativo dalla prima fase temporale, mentre per le spiegazioni anticronologiche si inizia dall’ultima fase. Quest’ultima modalità può essere più adatta per i bias di novità, ad esempio quando si prevedono i prezzi delle azioni. Una proprietà importante delle spiegazioni calcolate è che si sommano all’output del modello originale se il modello fornisce risultati deterministici.

Attribuzioni risultanti

Le attribuzioni risultanti sono punteggi che valutano i contributi individuali di specifiche fasi temporali o funzionalità di input alla previsione finale in ogni fase temporale prevista. Clarify offre le due granularità per le spiegazioni:

Le spiegazioni temporali non sono costose e forniscono informazioni mirate su fasi temporali specifiche, ad esempio in che misura le informazioni del 19° giorno nel passato hanno contribuito alla previsione del 1° giorno nel futuro. Queste attribuzioni non spiegano singolarmente le covariate statiche e le spiegazioni aggregate delle serie temporali di destinazione e covariate. Le attribuzioni sono una matrice A in cui ogni A_tk è l’attribuzione della fase temporale t rispetto alla previsione della fase temporale T+k. Nota che se il modello accetta covariate future, t può essere maggiore di T.
Fine-grained le spiegazioni sono più impegnative dal punto di vista computazionale e forniscono una suddivisione completa di tutte le attribuzioni delle variabili di input.

Nota
Fine-grained le spiegazioni supportano solo l'ordine cronologico.

Le attribuzioni risultanti sono una tripletta composta da:
- Matrice A^x ∈ R^T×K relativa alla serie temporale di input, dove A_tk^x è l’attribuzione di x_t rispetto alla fase di previsione T+k
- Tensore A^z ∈ R^T+K×S×K relativo alla serie temporale covariata, dove A_tsk^z è l’attribuzione di z_ts (ad esempio, la s° TS covariata) rispetto alla fase di previsione T+k
- Matrice A^u ∈ R^E×K relativa alle covariate statiche, dove A_ek^u è l’attribuzione di u_e (la covariata statica e°) rispetto alla fase di previsione T+k

Indipendentemente dalla granularità, la spiegazione contiene anche un vettore di offset B ∈ R^K che rappresenta il “comportamento di base” del modello quando tutti i dati sono offuscati.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Valori Shapley

Linee di base SHAP per la spiegabilità

Valori asimmetrici di Shapley

Contesto

Metodo

Attribuzioni risultanti

Nota