Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation du ML avec la syntaxe Athena
La clause USING EXTERNAL FUNCTION spécifie une fonction ML avec Athena ou plusieurs fonctions qui peuvent être référencées par une instruction SELECT ultérieure dans la requête. Vous définissez le nom de la fonction, les noms de variables et les types de données des variables et des valeurs de retour.
Résumé
La syntaxe suivante montre une USING EXTERNAL FUNCTION clause qui spécifie une fonction ML avec Athena.
USING EXTERNAL FUNCTION ml_function_name (variable1 data_type[, variable2 data_type][,...])
RETURNS data_type
SAGEMAKER 'sagemaker_endpoint'
SELECT ml_function_name()
Paramètres
- UTILISATION DE LA FONCTION EXTERNE
ml_function_nom(variable1data_type[,variable2data_type][,...]) -
ml_function_nomdéfinit le nom de la fonction, qui peut être utilisé dans les clauses de requête suivantes. Chaque élémentvariable data_typespécifie une variable nommée et son type de données correspondant admis en entrée par le modèle SageMaker AI. Le type de données spécifié doit être un type de données Athena pris en charge. - RETURNS
type_données -
data_typespécifie le type de données SQL queml_function_namerenvoie à la requête comme sortie du modèle SageMaker AI. - SAGEMAKER '
sagemaker_endpoint' -
sagemaker_endpointspécifie le point de terminaison du modèle SageMaker AI. - SELECT [...]
ml_function_name(expression) [...] -
Requête SELECT qui transmet des valeurs aux variables de la fonction et au modèle SageMaker AI pour renvoyer un résultat.
ml_function_namespécifie la fonction définie précédemment dans la requête, suivie d’uneexpressionqui est évaluée pour la transmission des valeurs. Les valeurs transmises et renvoyées doivent correspondre aux types de données correspondants spécifiés pour la fonction dans la clauseUSING EXTERNAL FUNCTION.
Exemple
L'exemple suivant illustre une requête utilisant ML avec Athena.
USING EXTERNAL FUNCTION predict_customer_registration(age INTEGER) RETURNS DOUBLE SAGEMAKER 'xgboost-2019-09-20-04-49-29-303' SELECT predict_customer_registration(age) AS probability_of_enrolling, customer_id FROM "sampledb"."ml_test_dataset" WHERE predict_customer_registration(age) < 0.5;