Xlera8

Πρόβλεψη εσόδων μεγάλης κλίμακας στη Bosch με προσαρμοσμένα μοντέλα Amazon Forecast και Amazon SageMaker

Αυτή η ανάρτηση συντάχθηκε από τους Goktug Cinar, Michael Binder και Adrian Horvath από το Bosch Center for Artificial Intelligence (BCAI).

Η πρόβλεψη εσόδων είναι ένα δύσκολο αλλά κρίσιμο έργο για στρατηγικές επιχειρηματικές αποφάσεις και δημοσιονομικό σχεδιασμό στους περισσότερους οργανισμούς. Συχνά, η πρόβλεψη εσόδων εκτελείται χειροκίνητα από οικονομικούς αναλυτές και είναι χρονοβόρα και υποκειμενική. Τέτοιες μη αυτόματες προσπάθειες είναι ιδιαίτερα απαιτητικές για μεγάλης κλίμακας, πολυεθνικές επιχειρηματικές οργανώσεις που απαιτούν προβλέψεις εσόδων σε ένα ευρύ φάσμα ομάδων προϊόντων και γεωγραφικών περιοχών σε πολλαπλά επίπεδα ευαισθησίας. Αυτό απαιτεί όχι μόνο ακρίβεια αλλά και ιεραρχική συνοχή των προβλέψεων.

Bosch είναι μια πολυεθνική εταιρεία με οντότητες που δραστηριοποιούνται σε πολλούς τομείς, όπως η αυτοκινητοβιομηχανία, οι βιομηχανικές λύσεις και τα καταναλωτικά αγαθά. Δεδομένου του αντίκτυπου της ακριβούς και συνεκτικής πρόβλεψης εσόδων στις υγιείς επιχειρηματικές δραστηριότητες, η Κέντρο Τεχνητής Νοημοσύνης της Bosch (BCAI) έχει επενδύσει σε μεγάλο βαθμό στη χρήση της μηχανικής μάθησης (ML) για τη βελτίωση της αποτελεσματικότητας και της ακρίβειας των διαδικασιών οικονομικού σχεδιασμού. Ο στόχος είναι να αμβλυνθούν οι μη αυτόματες διαδικασίες παρέχοντας εύλογες βασικές προβλέψεις εσόδων μέσω ML, με μόνο περιστασιακές προσαρμογές που χρειάζονται οι οικονομικοί αναλυτές που χρησιμοποιούν τις γνώσεις τους στον κλάδο και τον τομέα.

Για την επίτευξη αυτού του στόχου, η BCAI έχει αναπτύξει ένα εσωτερικό πλαίσιο πρόβλεψης ικανό να παρέχει ιεραρχικές προβλέψεις μεγάλης κλίμακας μέσω προσαρμοσμένων συνόλων ενός ευρέος φάσματος βασικών μοντέλων. Ένας μετα-μαθητής επιλέγει τα μοντέλα με τις καλύτερες επιδόσεις με βάση τα χαρακτηριστικά που εξάγονται από κάθε χρονοσειρά. Οι προβλέψεις από τα επιλεγμένα μοντέλα υπολογίζονται στη συνέχεια για να ληφθεί η συνολική πρόβλεψη. Ο αρχιτεκτονικός σχεδιασμός είναι αρθρωτός και επεκτάσιμος μέσω της εφαρμογής μιας διεπαφής τύπου REST, η οποία επιτρέπει τη συνεχή βελτίωση της απόδοσης μέσω της συμπερίληψης πρόσθετων μοντέλων.

Η BCAI συνεργάστηκε με την Εργαστήριο Amazon ML Solutions (MLSL) για να ενσωματώσει τις πιο πρόσφατες εξελίξεις στα μοντέλα που βασίζονται σε βαθιά νευρωνικά δίκτυα (DNN) για την πρόβλεψη εσόδων. Οι πρόσφατες εξελίξεις στους νευρωνικούς προγνωστικούς έχουν επιδείξει επιδόσεις αιχμής για πολλά πρακτικά προβλήματα πρόβλεψης. Σε σύγκριση με τα παραδοσιακά μοντέλα πρόβλεψης, πολλοί νευρωνικοί προγνώστες μπορούν να ενσωματώσουν πρόσθετες συμμεταβλητές ή μεταδεδομένα της χρονολογικής σειράς. Περιλαμβάνουμε CNN-QR και DeepAR+, δύο μοντέλα εκτός ραφιού Πρόβλεψη του Αμαζονίου, καθώς και ένα προσαρμοσμένο μοντέλο Transformer που εκπαιδεύεται στη χρήση Amazon Sage Maker. Τα τρία μοντέλα καλύπτουν ένα αντιπροσωπευτικό σύνολο ραχοκοκαλιών κωδικοποιητή που χρησιμοποιούνται συχνά σε νευρωνικούς προγνωστικούς: συνελικτικό νευρωνικό δίκτυο (CNN), διαδοχικό επαναλαμβανόμενο νευρωνικό δίκτυο (RNN) και κωδικοποιητές που βασίζονται σε μετασχηματιστή.

Μία από τις βασικές προκλήσεις που αντιμετώπισε η συνεργασία BCAI-MLSL ήταν να παρέχει ισχυρές και εύλογες προβλέψεις υπό την επίδραση του COVID-19, ενός πρωτοφανούς παγκόσμιου γεγονότος που προκαλεί μεγάλη αστάθεια στα παγκόσμια εταιρικά οικονομικά αποτελέσματα. Επειδή οι νευρωνικοί προγνώστες εκπαιδεύονται σε ιστορικά δεδομένα, οι προβλέψεις που δημιουργούνται με βάση δεδομένα εκτός διανομής από τις πιο ασταθείς περιόδους μπορεί να είναι ανακριβείς και αναξιόπιστες. Ως εκ τούτου, προτείναμε την προσθήκη ενός μηχανισμού συγκαλυμμένης προσοχής στην αρχιτεκτονική του Transformer για την αντιμετώπιση αυτού του ζητήματος.

Οι νευρωνικοί προγνώστες μπορούν να ομαδοποιηθούν ως ένα μοντέλο ενιαίου συνόλου ή να ενσωματωθούν μεμονωμένα στο σύμπαν των μοντέλων της Bosch και να έχουν εύκολη πρόσβαση μέσω των τελικών σημείων REST API. Προτείνουμε μια προσέγγιση για το σύνολο των νευρωνικών προγνωστικών μέσω αποτελεσμάτων backtest, η οποία παρέχει ανταγωνιστική και ισχυρή απόδοση με την πάροδο του χρόνου. Επιπλέον, διερευνήσαμε και αξιολογήσαμε μια σειρά από τεχνικές κλασικής ιεραρχικής συμφωνίας για να διασφαλίσουμε ότι οι προβλέψεις συγκεντρώνονται με συνέπεια μεταξύ ομάδων προϊόντων, γεωγραφιών και επιχειρηματικών οργανισμών.

Σε αυτή την ανάρτηση, επιδεικνύουμε τα εξής:

  • Πώς να εφαρμόσετε την εκπαίδευση προσαρμοσμένων μοντέλων Forecast και SageMaker για ιεραρχικά, μεγάλης κλίμακας προβλήματα πρόβλεψης χρονοσειρών
  • Πώς να συνδυάσετε προσαρμοσμένα μοντέλα με μοντέλα εκτός ραφιού από το Forecast
  • Πώς να μειώσετε τον αντίκτυπο ανατρεπτικών γεγονότων όπως ο COVID-19 στα προβλήματα πρόβλεψης
  • Πώς να δημιουργήσετε μια ροή εργασιών πρόβλεψης από άκρο σε άκρο στο AWS

Προκλήσεις

Αντιμετωπίσαμε δύο προκλήσεις: τη δημιουργία ιεραρχικής πρόβλεψης εσόδων μεγάλης κλίμακας και τον αντίκτυπο της πανδημίας COVID-19 στις μακροπρόθεσμες προβλέψεις.

Ιεραρχική, μεγάλης κλίμακας πρόβλεψη εσόδων

Οι οικονομικοί αναλυτές είναι επιφορτισμένοι με την πρόβλεψη βασικών οικονομικών μεγεθών, συμπεριλαμβανομένων των εσόδων, των λειτουργικών δαπανών και των δαπανών Ε&Α. Αυτές οι μετρήσεις παρέχουν πληροφορίες επιχειρηματικού σχεδιασμού σε διαφορετικά επίπεδα συγκέντρωσης και επιτρέπουν τη λήψη αποφάσεων βάσει δεδομένων. Οποιαδήποτε αυτοματοποιημένη λύση πρόβλεψης πρέπει να παρέχει προβλέψεις σε οποιοδήποτε αυθαίρετο επίπεδο συγκέντρωσης επιχειρηματικών γραμμών. Στη Bosch, οι συναθροίσεις μπορούν να θεωρηθούν ως ομαδοποιημένες χρονοσειρές ως μια γενικότερη μορφή ιεραρχικής δομής. Το παρακάτω σχήμα δείχνει ένα απλοποιημένο παράδειγμα με μια δομή δύο επιπέδων, η οποία μιμείται την ιεραρχική δομή πρόβλεψης εσόδων στη Bosch. Τα συνολικά έσοδα χωρίζονται σε πολλαπλά επίπεδα συγκεντρώσεων με βάση το προϊόν και την περιοχή.

Ο συνολικός αριθμός χρονοσειρών που πρέπει να προβλεφθούν στη Bosch είναι στην κλίμακα των εκατομμυρίων. Παρατηρήστε ότι οι χρονοσειρές ανώτατου επιπέδου μπορούν να χωριστούν ανά προϊόντα ή περιοχές, δημιουργώντας πολλαπλές διαδρομές προς τις προβλέψεις κατώτερου επιπέδου. Τα έσοδα πρέπει να προβλεφθούν σε κάθε κόμβο της ιεραρχίας με ορίζοντα πρόβλεψης 12 μήνες στο μέλλον. Διατίθενται μηνιαία ιστορικά δεδομένα.

Η ιεραρχική δομή μπορεί να αναπαρασταθεί χρησιμοποιώντας την ακόλουθη φόρμα με τη σημείωση ενός αθροιστικού πίνακα S (Hyndman και Αθανασόπουλος):

Στην εξίσωση αυτή, Y ισούται με τα ακόλουθα:

Εδώ, b αντιπροσωπεύει τη χρονολογική σειρά κατώτερου επιπέδου κάθε φορά t.

Επιπτώσεις της πανδημίας COVID-19

Η πανδημία του COVID-19 έφερε σημαντικές προκλήσεις για τις προβλέψεις λόγω των ανατρεπτικών και πρωτοφανών επιπτώσεών της σε όλες σχεδόν τις πτυχές της επαγγελματικής και κοινωνικής ζωής. Όσον αφορά τις μακροπρόθεσμες προβλέψεις εσόδων, η διαταραχή έφερε επίσης απροσδόκητες επιπτώσεις κατάντη. Για να καταδείξει αυτό το πρόβλημα, το παρακάτω σχήμα δείχνει μια δειγματοληπτική χρονοσειρά όπου τα έσοδα προϊόντος παρουσίασαν σημαντική πτώση στην αρχή της πανδημίας και σταδιακά ανέκαμψαν στη συνέχεια. Ένα τυπικό μοντέλο νευρωνικής πρόβλεψης θα λάβει δεδομένα εσόδων, συμπεριλαμβανομένης της περιόδου εκτός διανομής (OOD) COVID ως εισόδου ιστορικού πλαισίου, καθώς και της βασικής αλήθειας για την εκπαίδευση μοντέλων. Ως αποτέλεσμα, οι προβλέψεις που παράγονται δεν είναι πλέον αξιόπιστες.

Προσεγγίσεις μοντελοποίησης

Σε αυτή την ενότητα, συζητάμε τις διάφορες προσεγγίσεις μοντελοποίησης μας.

Πρόβλεψη του Αμαζονίου

Το Forecast είναι μια πλήρως διαχειριζόμενη υπηρεσία AI/ML από την AWS που παρέχει προδιαμορφωμένα, τελευταίας τεχνολογίας μοντέλα πρόβλεψης χρονοσειρών. Συνδυάζει αυτές τις προσφορές με τις εσωτερικές του δυνατότητες για αυτοματοποιημένη βελτιστοποίηση υπερπαραμέτρων, μοντελοποίηση συνόλου (για τα μοντέλα που παρέχονται από το Forecast) και δημιουργία πιθανοτικών προβλέψεων. Αυτό σας επιτρέπει να λαμβάνετε εύκολα προσαρμοσμένα σύνολα δεδομένων, να προεπεξεργάζεστε δεδομένα, να εκπαιδεύετε μοντέλα πρόβλεψης και να δημιουργείτε ισχυρές προβλέψεις. Ο αρθρωτός σχεδιασμός της υπηρεσίας μάς δίνει περαιτέρω τη δυνατότητα να αναζητούμε εύκολα και να συνδυάζουμε προβλέψεις από πρόσθετα προσαρμοσμένα μοντέλα που έχουν αναπτυχθεί παράλληλα.

Ενσωματώνουμε δύο νευρωνικές προβλέψεις από το Forecast: CNN-QR και DeepAR+. Και οι δύο είναι εποπτευόμενες μέθοδοι βαθιάς μάθησης που εκπαιδεύουν ένα παγκόσμιο μοντέλο για ολόκληρο το σύνολο δεδομένων χρονοσειρών. Και τα δύο μοντέλα CNNQR και DeepAR+ μπορούν να λαμβάνουν πληροφορίες στατικών μεταδεδομένων για κάθε χρονοσειρά, που είναι το αντίστοιχο προϊόν, περιοχή και επιχειρηματικός οργανισμός στην περίπτωσή μας. Προσθέτουν επίσης αυτόματα χρονικά χαρακτηριστικά, όπως ο μήνας του έτους ως μέρος της εισαγωγής στο μοντέλο.

Μετασχηματιστής με μάσκες προσοχής για τον COVID

Η αρχιτεκτονική του μετασχηματιστή (Οι Vaswani et al.), που αρχικά σχεδιάστηκε για επεξεργασία φυσικής γλώσσας (NLP), πρόσφατα εμφανίστηκε ως δημοφιλής αρχιτεκτονική επιλογή για την πρόβλεψη χρονοσειρών. Εδώ, χρησιμοποιήσαμε την αρχιτεκτονική του Transformer που περιγράφεται στο Οι Zhou et al. χωρίς πιθανολογική log αραιή προσοχή. Το μοντέλο χρησιμοποιεί μια τυπική αρχιτεκτονική σχεδίαση συνδυάζοντας έναν κωδικοποιητή και έναν αποκωδικοποιητή. Για την πρόβλεψη εσόδων, διαμορφώνουμε τον αποκωδικοποιητή ώστε να εξάγει απευθείας την πρόβλεψη του ορίζοντα των 12 μηνών αντί να παράγει την πρόβλεψη μήνα με μήνα με αυτοπαλινδρομικό τρόπο. Με βάση τη συχνότητα των χρονοσειρών, προστίθενται επιπλέον χαρακτηριστικά που σχετίζονται με το χρόνο, όπως ο μήνας του έτους ως μεταβλητή εισόδου. Πρόσθετες κατηγορικές μεταβλητές που περιγράφουν τις μετα-πληροφορίες (προϊόν, περιοχή, οργανισμός επιχείρησης) τροφοδοτούνται στο δίκτυο μέσω ενός εκπαιδευτικού επιπέδου ενσωμάτωσης.

Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική του Transformer και τον μηχανισμό κάλυψης προσοχής. Εφαρμόζεται κάλυψη προσοχής σε όλα τα επίπεδα κωδικοποιητή και αποκωδικοποιητή, όπως επισημαίνεται με πορτοκαλί χρώμα, για να αποτραπεί η επίδραση των δεδομένων OOD στις προβλέψεις.

Μετριάζουμε τον αντίκτυπο των παραθύρων περιβάλλοντος OOD προσθέτοντας μάσκες προσοχής. Το μοντέλο έχει εκπαιδευτεί να δίνει πολύ λίγη προσοχή στην περίοδο COVID που περιέχει ακραίες τιμές μέσω κάλυψης και εκτελεί πρόβλεψη με καλυμμένες πληροφορίες. Η μάσκα προσοχής εφαρμόζεται σε κάθε επίπεδο της αρχιτεκτονικής του αποκωδικοποιητή και του κωδικοποιητή. Το καλυμμένο παράθυρο μπορεί να καθοριστεί είτε χειροκίνητα είτε μέσω ενός αλγορίθμου ανίχνευσης ακραίων στοιχείων. Επιπλέον, όταν χρησιμοποιείται ένα χρονικό παράθυρο που περιέχει ακραίες τιμές ως ετικέτες εκπαίδευσης, οι απώλειες δεν αναπαράγονται. Αυτή η μέθοδος που βασίζεται στην κάλυψη της προσοχής μπορεί να εφαρμοστεί για τον χειρισμό διαταραχών και περιπτώσεων OOD που προκαλούνται από άλλα σπάνια συμβάντα και βελτιώνει την ευρωστία των προβλέψεων.

Μοντέλο σύνολο

Το σύνολο μοντέλων συχνά υπερτερεί των μεμονωμένων μοντέλων για πρόβλεψη - βελτιώνει τη γενίκευση του μοντέλου και είναι καλύτερο στο χειρισμό δεδομένων χρονοσειρών με ποικίλα χαρακτηριστικά σε περιοδικότητα και διαλείποντα. Ενσωματώνουμε μια σειρά από στρατηγικές συνόλου μοντέλων για να βελτιώσουμε την απόδοση του μοντέλου και την ευρωστία των προβλέψεων. Μια κοινή μορφή συνόλου μοντέλων βαθιάς μάθησης είναι η άθροιση αποτελεσμάτων από εκτελέσεις μοντέλων με διαφορετικές αρχικοποιήσεις τυχαίου βάρους ή από διαφορετικές εποχές εκπαίδευσης. Χρησιμοποιούμε αυτή τη στρατηγική για να λάβουμε προβλέψεις για το μοντέλο Transformer.

Για να δημιουργήσουμε περαιτέρω ένα σύνολο πάνω από διαφορετικές αρχιτεκτονικές μοντέλων, όπως Transformer, CNNQR και DeepAR+, χρησιμοποιούμε μια στρατηγική συνόλου παν-μοντέλων που επιλέγει τα κορυφαία μοντέλα με την καλύτερη απόδοση για κάθε χρονοσειρά με βάση τα αποτελέσματα του backtest και λαμβάνει τα μέσους όρους. Επειδή τα αποτελέσματα του backtest μπορούν να εξαχθούν απευθείας από εκπαιδευμένα μοντέλα Forecast, αυτή η στρατηγική μας δίνει τη δυνατότητα να επωφεληθούμε από υπηρεσίες κλειδί στο χέρι όπως το Forecast με βελτιώσεις που αποκτήθηκαν από προσαρμοσμένα μοντέλα όπως το Transformer. Μια τέτοια προσέγγιση συνόλου μοντέλων από άκρο σε άκρο δεν απαιτεί εκπαίδευση ενός μετα-μαθητή ή υπολογισμό χαρακτηριστικών χρονοσειρών για την επιλογή μοντέλου.

Ιεραρχική συμφιλίωση

Το πλαίσιο είναι προσαρμοστικό ώστε να ενσωματώνει ένα ευρύ φάσμα τεχνικών ως βήματα μεταεπεξεργασίας για την ιεραρχική συμφωνία προβλέψεων, συμπεριλαμβανομένης της συμφωνίας από κάτω προς τα πάνω (BU), της συμφωνίας από πάνω προς τα κάτω με αναλογίες πρόβλεψης (TDFP), το συνηθισμένο ελάχιστο τετράγωνο (OLS) και το σταθμισμένο ελάχιστο τετράγωνο ( WLS). Όλα τα πειραματικά αποτελέσματα σε αυτήν την ανάρτηση αναφέρονται χρησιμοποιώντας συμφωνία από πάνω προς τα κάτω με αναλογίες πρόβλεψης.

Επισκόπηση αρχιτεκτονικής

Αναπτύξαμε μια αυτοματοποιημένη ροή εργασιών από άκρο σε άκρο στο AWS για τη δημιουργία προβλέψεων εσόδων χρησιμοποιώντας υπηρεσίες όπως το Forecast, το SageMaker, Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3), AWS Lambda, Λειτουργίες βημάτων AWS, να Κιτ ανάπτυξης AWS Cloud (AWS CDK). Η αναπτυγμένη λύση παρέχει μεμονωμένες προβλέψεις χρονοσειρών μέσω ενός REST API χρησιμοποιώντας Amazon API Gateway, επιστρέφοντας τα αποτελέσματα σε προκαθορισμένη μορφή JSON.

Το παρακάτω διάγραμμα απεικονίζει τη ροή εργασιών πρόβλεψης από άκρο σε άκρο.

Βασικά ζητήματα σχεδιασμού για την αρχιτεκτονική είναι η ευελιξία, η απόδοση και η φιλικότητα προς το χρήστη. Το σύστημα θα πρέπει να είναι αρκετά ευέλικτο ώστε να ενσωματώνει ένα ποικίλο σύνολο αλγορίθμων κατά την ανάπτυξη και την ανάπτυξη, με ελάχιστες απαιτούμενες αλλαγές, και μπορεί εύκολα να επεκταθεί κατά την προσθήκη νέων αλγορίθμων στο μέλλον. Το σύστημα θα πρέπει επίσης να προσθέσει ελάχιστα γενικά έξοδα και να υποστηρίζει την παράλληλη εκπαίδευση τόσο για το Forecast όσο και για το SageMaker για να μειώσει τον χρόνο εκπαίδευσης και να λάβει την πιο πρόσφατη πρόβλεψη πιο γρήγορα. Τέλος, το σύστημα θα πρέπει να είναι απλό στη χρήση για πειραματικούς σκοπούς.

Η ροή εργασίας από άκρο σε άκρο εκτελείται διαδοχικά μέσα από τις ακόλουθες ενότητες:

  1. Μια ενότητα προεπεξεργασίας για αναδιαμόρφωση και μετασχηματισμό δεδομένων
  2. Ένα μοντέλο εκπαίδευσης που ενσωματώνει τόσο το μοντέλο Forecast όσο και το προσαρμοσμένο μοντέλο στο SageMaker (και τα δύο εκτελούνται παράλληλα)
  3. Μια μονάδα μεταεπεξεργασίας που υποστηρίζει σύνολο μοντέλων, ιεραρχική συμφωνία, μετρήσεις και δημιουργία αναφορών

Το Step Functions οργανώνει και ενορχηστρώνει τη ροή εργασίας από άκρη σε άκρη ως μηχάνημα κατάστασης. Η εκτέλεση του υπολογιστή κατάστασης διαμορφώνεται με ένα αρχείο JSON που περιέχει όλες τις απαραίτητες πληροφορίες, συμπεριλαμβανομένης της τοποθεσίας των ιστορικών αρχείων CSV εσόδων στο Amazon S3, της πρόβλεψης ώρας έναρξης και των ρυθμίσεων υπερπαραμέτρων για την εκτέλεση της ροής εργασίας από άκρο σε άκρο. Δημιουργούνται ασύγχρονες κλήσεις για να παραλληλίσουν την εκπαίδευση μοντέλων στη μηχανή κατάστασης χρησιμοποιώντας συναρτήσεις Lambda. Όλα τα ιστορικά δεδομένα, τα αρχεία διαμόρφωσης, τα αποτελέσματα πρόβλεψης, καθώς και τα ενδιάμεσα αποτελέσματα, όπως τα αποτελέσματα του backtesting αποθηκεύονται στο Amazon S3. Το REST API είναι χτισμένο πάνω από το Amazon S3 για να παρέχει μια διεπαφή με δυνατότητα αναζήτησης για τα αποτελέσματα της πρόβλεψης ερωτημάτων. Το σύστημα μπορεί να επεκταθεί για να ενσωματώσει νέα μοντέλα πρόβλεψης και υποστηρικτικές λειτουργίες, όπως η δημιουργία αναφορών οπτικοποίησης προβλέψεων.

Εκτίμηση

Σε αυτήν την ενότητα, περιγράφουμε λεπτομερώς τη ρύθμιση του πειράματος. Τα βασικά στοιχεία περιλαμβάνουν το σύνολο δεδομένων, μετρήσεις αξιολόγησης, παράθυρα backtest και ρύθμιση και εκπαίδευση μοντέλου.

Σύνολο δεδομένων

Για να προστατεύσουμε το οικονομικό απόρρητο της Bosch ενώ χρησιμοποιούμε ένα ουσιαστικό σύνολο δεδομένων, χρησιμοποιήσαμε ένα συνθετικό σύνολο δεδομένων που έχει παρόμοια στατιστικά χαρακτηριστικά με ένα πραγματικό σύνολο δεδομένων εσόδων από μια επιχειρηματική μονάδα της Bosch. Το σύνολο δεδομένων περιέχει 1,216 χρονοσειρές συνολικά με έσοδα που καταγράφονται σε μηνιαία συχνότητα, που καλύπτουν τον Ιανουάριο 2016 έως τον Απρίλιο του 2022. Το σύνολο δεδομένων παραδίδεται με 877 χρονοσειρές στο πιο αναλυτικό επίπεδο (κάτω χρονοσειρές), με μια αντίστοιχη ομαδοποιημένη δομή χρονοσειρών ως αθροιστικός πίνακας S. Κάθε χρονοσειρά συνδέεται με τρία στατικά κατηγορικά χαρακτηριστικά, τα οποία αντιστοιχούν σε κατηγορία προϊόντος, περιοχή και οργανωτική μονάδα στο πραγματικό σύνολο δεδομένων (ανώνυμα στα συνθετικά δεδομένα).

Μετρήσεις αξιολόγησης

Χρησιμοποιούμε διάμεσο μέσο απόλυτο ποσοστό σφάλματος Arctangent (διάμεσος-MAAPE) και σταθμισμένο-MAAPE για να αξιολογήσουμε την απόδοση του μοντέλου και να εκτελέσουμε συγκριτική ανάλυση, που είναι οι τυπικές μετρήσεις που χρησιμοποιούνται στη Bosch. Το MAAPE αντιμετωπίζει τις ελλείψεις της μέτρησης του μέσου απολύτου ποσοστού σφάλματος (MAPE) που χρησιμοποιείται συνήθως σε επιχειρηματικό πλαίσιο. Το Median-MAAPE δίνει μια επισκόπηση της απόδοσης του μοντέλου υπολογίζοντας τη διάμεση τιμή των MAAPE που υπολογίζονται ξεχωριστά σε κάθε χρονοσειρά. Το Weighted-MAAPE αναφέρει έναν σταθμισμένο συνδυασμό των μεμονωμένων MAAPE. Οι σταθμίσεις είναι το ποσοστό των εσόδων για κάθε χρονοσειρά σε σύγκριση με τα συγκεντρωτικά έσοδα ολόκληρου του συνόλου δεδομένων. Το σταθμισμένο-MAAPE αντικατοπτρίζει καλύτερα τις επακόλουθες επιχειρηματικές επιπτώσεις της ακρίβειας των προβλέψεων. Και οι δύο μετρήσεις αναφέρονται σε ολόκληρο το σύνολο δεδομένων των 1,216 χρονοσειρών.

Backtest παράθυρα

Χρησιμοποιούμε κυλιόμενα παράθυρα backtest 12 μηνών για να συγκρίνουμε την απόδοση του μοντέλου. Το παρακάτω σχήμα απεικονίζει τα παράθυρα backtest που χρησιμοποιήθηκαν στα πειράματα και υπογραμμίζει τα αντίστοιχα δεδομένα που χρησιμοποιούνται για εκπαίδευση και βελτιστοποίηση υπερπαραμέτρων (HPO). Για παράθυρα backtest μετά την έναρξη του COVID-19, το αποτέλεσμα επηρεάζεται από τις εισροές OOD από τον Απρίλιο έως τον Μάιο του 2020, με βάση αυτά που παρατηρήσαμε από τη χρονοσειρά εσόδων.

Ρύθμιση και εκπαίδευση μοντέλου

Για την εκπαίδευση με μετασχηματιστές, χρησιμοποιήσαμε την απώλεια ποσοτικού επιπέδου και κλιμακώσαμε κάθε χρονοσειρά χρησιμοποιώντας τη μέση ιστορική της τιμή πριν την τροφοδοτήσουμε στον Μετασχηματιστή και υπολογίσουμε την απώλεια εκπαίδευσης. Οι τελικές προβλέψεις αναβαθμίζονται για τον υπολογισμό των μετρήσεων ακρίβειας, χρησιμοποιώντας το MeanScaler που εφαρμόζεται στο GluonTS. Χρησιμοποιούμε ένα παράθυρο περιβάλλοντος με δεδομένα μηνιαίων εσόδων από τους τελευταίους 18 μήνες, επιλεγμένα μέσω HPO στο παράθυρο backtest από τον Ιούλιο 2018 έως τον Ιούνιο 2019. Πρόσθετα μεταδεδομένα για κάθε χρονοσειρά με τη μορφή στατικών κατηγορικών μεταβλητών τροφοδοτούνται στο μοντέλο μέσω μιας ενσωμάτωσης στρώση πριν την τροφοδοτήσει στα στρώματα του μετασχηματιστή. Εκπαιδεύουμε το Transformer με πέντε διαφορετικές τυχαίες αρχικοποιήσεις βάρους και μέσο όρο των αποτελεσμάτων πρόβλεψης από τις τρεις τελευταίες εποχές για κάθε εκτέλεση, συνολικά κατά μέσο όρο 15 μοντέλα. Οι πέντε προπονητικές διαδρομές μπορούν να παραλληλιστούν για να μειωθεί ο χρόνος προπόνησης. Για το καλυμμένο Transformer, υποδεικνύουμε τους μήνες από τον Απρίλιο έως τον Μάιο του 2020 ως ακραίες τιμές.

Για όλα τα μοντέλα εκπαίδευσης Forecast, ενεργοποιήσαμε το αυτόματο HPO, το οποίο μπορεί να επιλέξει το μοντέλο και τις παραμέτρους εκπαίδευσης με βάση μια περίοδο backtest που καθορίζεται από τον χρήστη, η οποία ορίζεται στους τελευταίους 12 μήνες στο παράθυρο δεδομένων που χρησιμοποιείται για εκπαίδευση και HPO.

Αποτελέσματα πειράματος

Εκπαιδεύουμε μετασχηματιστές με μάσκα και χωρίς μάσκα χρησιμοποιώντας το ίδιο σύνολο υπερπαραμέτρων και συγκρίναμε την απόδοσή τους για παράθυρα backtest αμέσως μετά το σοκ COVID-19. Στον μετασχηματιστή με μάσκα, οι δύο καλυμμένοι μήνες είναι ο Απρίλιος και ο Μάιος του 2020. Ο παρακάτω πίνακας δείχνει τα αποτελέσματα από μια σειρά περιόδων δοκιμής αναδρομής με παράθυρα πρόβλεψης 12 μηνών που ξεκινούν από τον Ιούνιο του 2020. Μπορούμε να παρατηρήσουμε ότι ο καλυμμένος μετασχηματιστής υπερέχει σταθερά από την έκδοση χωρίς μάσκα .

Πραγματοποιήσαμε περαιτέρω αξιολόγηση της στρατηγικής του συνόλου μοντέλων με βάση τα αποτελέσματα του backtest. Συγκεκριμένα, συγκρίνουμε τις δύο περιπτώσεις όπου επιλέγεται μόνο το μοντέλο με τις καλύτερες επιδόσεις έναντι όταν επιλέγονται τα δύο μοντέλα με τις καλύτερες επιδόσεις και ο μέσος όρος του μοντέλου πραγματοποιείται υπολογίζοντας τη μέση τιμή των προβλέψεων. Συγκρίνουμε την απόδοση των βασικών μοντέλων και των μοντέλων συνόλου στα παρακάτω σχήματα. Παρατηρήστε ότι κανένας από τους νευρωνικούς προγνωστικούς δεν έχει σταθερά καλύτερες επιδόσεις από άλλους για τα κυλιόμενα παράθυρα δοκιμής.

Ο παρακάτω πίνακας δείχνει ότι, κατά μέσο όρο, η μοντελοποίηση συνόλου των δύο κορυφαίων μοντέλων δίνει την καλύτερη απόδοση. Το CNNQR παρέχει το δεύτερο καλύτερο αποτέλεσμα.

Συμπέρασμα

Αυτή η ανάρτηση έδειξε πώς να δημιουργήσετε μια λύση ML από άκρο σε άκρο για προβλήματα πρόβλεψης μεγάλης κλίμακας συνδυάζοντας το Forecast και ένα προσαρμοσμένο μοντέλο που έχει εκπαιδευτεί στο SageMaker. Ανάλογα με τις ανάγκες της επιχείρησής σας και τις γνώσεις ML, μπορείτε να χρησιμοποιήσετε μια πλήρως διαχειριζόμενη υπηρεσία, όπως το Forecast, για να ξεφορτώσετε τη διαδικασία κατασκευής, εκπαίδευσης και ανάπτυξης ενός μοντέλου πρόβλεψης. Δημιουργήστε το προσαρμοσμένο μοντέλο σας με συγκεκριμένους μηχανισμούς συντονισμού με το SageMaker. ή να εκτελέσετε τη σύνθεση μοντέλων συνδυάζοντας τις δύο υπηρεσίες.

Εάν θέλετε βοήθεια για την επιτάχυνση της χρήσης ML στα προϊόντα και τις υπηρεσίες σας, επικοινωνήστε με το Εργαστήριο Amazon ML Solutions προγράμματος.

αναφορές

Hyndman RJ, Αθανασόπουλος Γ. Πρόβλεψη: αρχές και πρακτική. OTexts; 2018 Μαΐου 8.

Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez AN, Kaiser Ł, Polosukhin I. Η προσοχή είναι το μόνο που χρειάζεστε. Πρόοδος στα συστήματα επεξεργασίας νευρωνικών πληροφοριών. 2017; 30.

Zhou H, Zhang S, Peng J, Zhang S, Li J, Xiong H, Zhang W. Informer: Πέρα από τον αποδοτικό μετασχηματιστή για μακροχρόνιες προβλέψεις χρονοσειρών. InProceedings of AAAI 2021 2 Φεβρουαρίου.


Σχετικά με τους Συγγραφείς

Goktug Cinar είναι κορυφαίος επιστήμονας ML και ο τεχνικός επικεφαλής του ML και των προβλέψεων βάσει στατιστικών στην Robert Bosch LLC και το Bosch Center for Artificial Intelligence. Διευθύνει την έρευνα των μοντέλων πρόβλεψης, της ιεραρχικής ενοποίησης και των τεχνικών συνδυασμού μοντέλων καθώς και της ομάδας ανάπτυξης λογισμικού που κλιμακώνει αυτά τα μοντέλα και τα εξυπηρετεί ως μέρος του εσωτερικού λογισμικού οικονομικών προβλέψεων από άκρο σε άκρο.

Μάικλ Μπάιντερ είναι κάτοχος προϊόντος στην Bosch Global Services, όπου συντονίζει την ανάπτυξη, την ανάπτυξη και την εφαρμογή της εφαρμογής προγνωστικής ανάλυσης της εταιρείας για την μεγάλης κλίμακας αυτοματοποιημένη πρόβλεψη βασικών οικονομικών μεγεθών βάσει δεδομένων.

Άντριαν Χόρβαθ είναι προγραμματιστής λογισμικού στο Κέντρο Τεχνητής Νοημοσύνης της Bosch, όπου αναπτύσσει και διατηρεί συστήματα για τη δημιουργία προβλέψεων με βάση διάφορα μοντέλα πρόβλεψης.

Panpan Xu είναι Senior Applied Scientist και Manager στο Amazon ML Solutions Lab στο AWS. Εργάζεται στην έρευνα και την ανάπτυξη αλγορίθμων Μηχανικής Μάθησης για εφαρμογές πελατών υψηλού αντίκτυπου σε μια ποικιλία βιομηχανικών κάθετων για να επιταχύνει την υιοθέτηση της τεχνητής νοημοσύνης και του cloud. Το ερευνητικό της ενδιαφέρον περιλαμβάνει την ερμηνευσιμότητα μοντέλων, την αιτιολογική ανάλυση, την ανθρώπινη τεχνητή νοημοσύνη και τη διαδραστική οπτικοποίηση δεδομένων.

Jasleen Grewal είναι Εφαρμοσμένη Επιστήμονας στο Amazon Web Services, όπου συνεργάζεται με πελάτες της AWS για την επίλυση προβλημάτων του πραγματικού κόσμου χρησιμοποιώντας μηχανική μάθηση, με ιδιαίτερη έμφαση στην ιατρική ακριβείας και τη γονιδιωματική. Έχει ισχυρό υπόβαθρο στη βιοπληροφορική, την ογκολογία και την κλινική γονιδιωματική. Είναι παθιασμένη με τη χρήση υπηρεσιών AI/ML και cloud για τη βελτίωση της φροντίδας των ασθενών.

Selvan Senthivel είναι Ανώτερος Μηχανικός ML με το Amazon ML Solutions Lab στο AWS, με επίκεντρο την παροχή βοήθειας στους πελάτες για τη μηχανική μάθηση, τα προβλήματα βαθιάς μάθησης και τις λύσεις ML από άκρο σε άκρο. Ήταν ιδρυτικός ηγέτης μηχανικής της Amazon Comprehend Medical και συνέβαλε στο σχεδιασμό και την αρχιτεκτονική πολλών υπηρεσιών AWS AI.

Ruilin Zhang είναι SDE με το Amazon ML Solutions Lab στο AWS. Βοηθά τους πελάτες να υιοθετήσουν υπηρεσίες AWS AI δημιουργώντας λύσεις για την αντιμετώπιση κοινών επιχειρηματικών προβλημάτων.

Σέιν Ράι είναι Sr. ML Strategist με το Amazon ML Solutions Lab στο AWS. Συνεργάζεται με πελάτες σε ένα ευρύ φάσμα βιομηχανιών για να λύσει τις πιο πιεστικές και καινοτόμες επιχειρηματικές ανάγκες τους χρησιμοποιώντας το εύρος των υπηρεσιών AI/ML που βασίζονται σε cloud της AWS.

Lin Lee Cheong είναι Διευθυντής Εφαρμοσμένης Επιστήμης με την ομάδα του Amazon ML Solutions Lab στο AWS. Συνεργάζεται με στρατηγικούς πελάτες AWS για να εξερευνήσει και να εφαρμόσει την τεχνητή νοημοσύνη και τη μηχανική μάθηση για να ανακαλύψει νέες ιδέες και να λύσει σύνθετα προβλήματα.

Συνομιλία με μας

Γεια σου! Πώς μπορώ να σε βοηθήσω?