Δυνατά δεδομένα μεγάλης εμβέλειας: Πώς να γεφυρώσετε το χάσμα μεταξύ επιστημόνων δεδομένων και μηχανικών

Το buzz γύρω από τα μεγάλα δεδομένα έχει δημιουργήσει μια ευρέως διαδεδομένη παρανόηση: ότι η απλή ύπαρξή του μπορεί να προσφέρει μια εταιρία με ενεργητικές γνώσεις και θετικά επιχειρησιακά αποτελέσματα. Η πραγματικότητα είναι λίγο πιο περίπλοκη. Για να έχετε αξία από μεγάλα δεδομένα, χρειάζεστε μια ικανή ομάδα επιστημόνων δεδομένων για να τα κοσκινίσετε. Ως επί το πλείστον, οι εταιρείες κατανοούν αυτό το γεγονός, όπως αποδεικνύεται από την αύξηση 15x - 20x στις θέσεις εργασίας επιστημόνων δεδομένων από το 2016 έως το 2019. Ωστόσο, ακόμη και αν έχετε μια ικανή ομάδα επιστημόνων δεδομένων, πρέπει ακόμα να καθαρίσετε το σημαντικό εμπόδιο θέτοντας αυτές τις ιδέες στην παραγωγή. Προκειμένου να επιτευχθεί πραγματική επιχειρησιακή αξία, θα πρέπει να βεβαιωθείτε ότι οι μηχανικοί και οι επιστήμονες δεδομένων συνεργάζονται μεταξύ τους. Στον πυρήνα τους, οι επιστήμονες δεδομένων είναι πρωτοπόροι που εξάγουν νέες ιδέες και σκέψεις από τα δεδομένα που η εταιρία σας καταναλώνει σε καθημερινή βάση, ενώ οι μηχανικοί με τη σειρά τους αναπτύσσουν αυτές τις ιδέες και δημιουργούν βιώσιμους φακούς για να δουν τα δεδομένα μας. Οι επιστήμονες δεδομένων είναι επιφορτισμένοι με την αποκρυπτογράφηση, τον χειρισμό και την εμπορία δεδομένων για θετικά επιχειρηματικά αποτελέσματα. Για να ολοκληρώσουν αυτό το κατόρθωμα, εκτελούν μια ποικιλία εργασιών που κυμαίνονται από την εξόρυξη δεδομένων μέχρι τη στατιστική ανάλυση. Η συλλογή, η οργάνωση και η διερμηνεία των δεδομένων γίνεται όλα με σκοπό τον εντοπισμό σημαντικών τάσεων και σχετικών πληροφοριών. Ενώ οι μηχανικοί εργάζονται σίγουρα σε συνεννόηση με τους επιστήμονες δεδομένων, υπάρχουν κάποιες διακριτές διαφορές μεταξύ των δύο ρόλων. Μία από τις θεμελιώδεις διαφορές είναι ότι οι μηχανικοί τοποθετούν μια αποφασιστικά μεγαλύτερη αξία στην "παραγωγική ετοιμότητα" των συστημάτων. Από την ανθεκτικότητα και την ασφάλεια των μοντέλων που παράγουν οι επιστήμονες δεδομένων με την πραγματική μορφή και την επεκτασιμότητα, οι μηχανικοί θέλουν τα συστήματά τους να είναι γρήγορα και αξιόπιστα λειτουργικά. Με άλλα λόγια: Οι επιστήμονες δεδομένων και οι τεχνικές ομάδες έχουν διαφορετικές καθημερινές ανησυχίες. Αυτό προκαλεί την ερώτηση, πώς μπορείτε να τοποθετήσετε και τους δύο ρόλους επιτυχίας και τελικά να εξαγάγετε τις πιο σημαντικές πληροφορίες από τα δεδομένα σας; Η απάντηση έγκειται στην αφιέρωση του χρόνου και των πόρων για την τελειοποίηση των δεδομένων και των σχέσεων μηχανικής. Ακριβώς όπως είναι σημαντικό να μειώσετε την ακαταστασία ή το "θόρυβο" γύρω από τα σύνολα δεδομένων, είναι επίσης σημαντικό να εξομαλύνετε όλες τις τριβές μεταξύ αυτών των δύο ομάδων που παίζουν ζωτικό ρόλο στην επιτυχία της επιχείρησής σας. Εδώ είναι τρία κρίσιμα βήματα για να γίνει αυτό πραγματικότητα. Δεν αρκεί να τοποθετήσουμε απλώς μερικούς επιστήμονες και μερικούς μηχανικούς σε ένα δωμάτιο και να τους ζητήσουμε να λύσουν τα προβλήματα του κόσμου. Πρώτα πρέπει να τους κάνετε να κατανοήσουν την ορολογία του άλλου και να αρχίσουν να μιλούν την ίδια γλώσσα. Ένας τρόπος για να γίνει αυτό είναι η διασταύρωση των ομάδων. Συνδυάζοντας τους επιστήμονες και τους μηχανικούς σε δύο λοβούς, μπορείτε να ενθαρρύνετε την κοινή μάθηση και να καταργήσετε τα εμπόδια. Για τους επιστήμονες δεδομένων, αυτό σημαίνει να μάθουν τα πρότυπα κωδικοποίησης, να γράψουν τον κώδικα με έναν πιο οργανωμένο τρόπο και, ίσως το σημαντικότερο, να κατανοήσουν την τεχνολογική στοίβα και τις ανταλλαγές υποδομών που σχετίζονται με την εισαγωγή ενός μοντέλου στην παραγωγή. Καταχωρήθηκε στις 7wData.be