Code

Apprentissage supervisé vs algorithmes d'apprentissage non supervisé

Horodatage : 7 juin 2023 9h45 AM
Nœud source : 2544784

Republié par Platon

Introduction

L'apprentissage automatique (ML) est un domaine d'étude qui se concentre sur le développement d'algorithmes pour apprendre automatiquement à partir de données, faire des prédictions et déduire des modèles sans qu'on leur dise explicitement comment le faire. Il vise à créer des systèmes qui s'améliorent automatiquement avec l'expérience et les données.

Cela peut être réalisé grâce à un apprentissage supervisé, où le modèle est formé à l'aide de données étiquetées pour faire des prédictions, ou par un apprentissage non supervisé, où le modèle cherche à découvrir des modèles ou des corrélations dans les données sans sorties cibles spécifiques à anticiper.

Le ML est devenu un outil indispensable et largement utilisé dans diverses disciplines, notamment l'informatique, la biologie, la finance et le marketing. Il a prouvé son utilité dans diverses applications telles que la classification d'images, le traitement du langage naturel et la détection de fraude.

Tâches d'apprentissage automatique

L'apprentissage automatique peut être globalement classé en trois tâches principales :

Enseignement supervisé
Apprentissage non supervisé
Apprentissage par renforcement

Ici, nous nous concentrerons sur les deux premiers cas.

Apprentissage supervisé

L'apprentissage supervisé implique la formation d'un modèle sur des données étiquetées, où les données d'entrée sont associées à la sortie correspondante ou à la variable cible. L'objectif est d'apprendre une fonction qui peut mapper les données d'entrée à la sortie correcte. Les algorithmes d'apprentissage supervisé courants incluent la régression linéaire, la régression logistique, les arbres de décision et les machines à vecteurs de support.

Exemple de code d'apprentissage supervisé utilisant Python :

from sklearn.linear_model import LinearRegression model = LinearRegression() model.fit(X_train, y_train) predictions = model.predict(X_test)

Dans cet exemple de code simple, nous formons le LinearRegression algorithme de scikit-learn sur nos données de formation, puis appliquez-le pour obtenir des prédictions pour nos données de test.

Un cas d'utilisation réel de l'apprentissage supervisé est la classification des spams par e-mail. Avec la croissance exponentielle de la communication par e-mail, l'identification et le filtrage des spams sont devenus cruciaux. En utilisant des algorithmes d'apprentissage supervisé, il est possible de former un modèle pour faire la distinction entre les e-mails légitimes et les spams sur la base de données étiquetées.

Le modèle d'apprentissage supervisé peut être formé sur un ensemble de données contenant des e-mails étiquetés comme "spam" ou "non spam". Le modèle apprend des modèles et des fonctionnalités à partir des données étiquetées, telles que la présence de certains mots-clés, la structure de l'e-mail ou les informations sur l'expéditeur de l'e-mail. Une fois le modèle formé, il peut être utilisé pour classer automatiquement les e-mails entrants comme spam ou non-spam, filtrant efficacement les messages indésirables.

Apprentissage non supervisé

Dans l'apprentissage non supervisé, les données d'entrée ne sont pas étiquetées et l'objectif est de découvrir des modèles ou des structures dans les données. Les algorithmes d'apprentissage non supervisé visent à trouver des représentations ou des clusters significatifs dans les données.

Des exemples d'algorithmes d'apprentissage non supervisés comprennent k-signifie clustering, classification hiérarchiqueet analyse en composantes principales (ACP).

Exemple de code d'apprentissage non supervisé :

from sklearn.cluster import KMeans model = KMeans(n_clusters=3) model.fit(X) predictions = model.predict(X_new)

Dans cet exemple de code simple, nous formons le KMeans algorithme de scikit-learn pour identifier trois clusters dans nos données, puis insérer de nouvelles données dans ces clusters.

Un exemple de cas d'utilisation d'apprentissage non supervisé est la segmentation de la clientèle. Dans divers secteurs, les entreprises cherchent à mieux comprendre leur clientèle pour adapter leurs stratégies marketing, personnaliser leurs offres et optimiser l'expérience client. Des algorithmes d'apprentissage non supervisés peuvent être utilisés pour segmenter les clients en groupes distincts en fonction de leurs caractéristiques et comportements communs.

Consultez notre guide pratique et pratique pour apprendre Git, avec les meilleures pratiques, les normes acceptées par l'industrie et la feuille de triche incluse. Arrêtez de googler les commandes Git et en fait apprendre il!

En appliquant des techniques d'apprentissage non supervisé, telles que le clustering, les entreprises peuvent découvrir des modèles et des groupes significatifs dans leurs données clients. Par exemple, les algorithmes de clustering peuvent identifier des groupes de clients ayant des habitudes d'achat, des données démographiques ou des préférences similaires. Ces informations peuvent être exploitées pour créer des campagnes marketing ciblées, optimiser les recommandations de produits et améliorer la satisfaction client.

Principales classes d'algorithmes

Algorithmes d'apprentissage supervisé

Modèles linéaires : utilisés pour prédire des variables continues basées sur des relations linéaires entre les entités et la variable cible.
Modèles arborescents : construits à l'aide d'une série de décisions binaires pour effectuer des prédictions ou des classifications.
Modèles d'ensemble : méthode qui combine plusieurs modèles (arborescents ou linéaires) pour effectuer des prédictions plus précises.
Modèles de réseaux de neurones : méthodes vaguement basées sur le cerveau humain, où plusieurs fonctions fonctionnent comme des nœuds d'un réseau.

Algorithmes d'apprentissage non supervisé

Clustering hiérarchique : crée une hiérarchie de clusters en les fusionnant ou en les divisant de manière itérative.
Clustering non hiérarchique : divise les données en clusters distincts en fonction de la similarité.
Réduction de la dimensionnalité : réduit la dimensionnalité des données tout en préservant les informations les plus importantes.

Évaluation du modèle

Apprentissage supervisé

Pour évaluer les performances des modèles d'apprentissage supervisé, diverses mesures sont utilisées, notamment l'exactitude, la précision, le rappel, le score F1 et le ROC-AUC. Les techniques de validation croisée, telles que la validation croisée k-fold, peuvent aider à estimer les performances de généralisation du modèle.

Apprentissage non supervisé

L'évaluation des algorithmes d'apprentissage non supervisé est souvent plus difficile car il n'y a pas de vérité fondamentale. Des métriques telles que le score de silhouette ou l'inertie peuvent être utilisées pour évaluer la qualité des résultats de clustering. Les techniques de visualisation peuvent également fournir des informations sur la structure des clusters.

Trucs et astuces

Apprentissage supervisé

Prétraitez et normalisez les données d'entrée pour améliorer les performances du modèle.
Traitez les valeurs manquantes de manière appropriée, soit par imputation, soit par suppression.
L'ingénierie des fonctionnalités peut améliorer la capacité du modèle à capturer des modèles pertinents.

Apprentissage non supervisé

Choisissez le nombre approprié de clusters en fonction de la connaissance du domaine ou en utilisant des techniques telles que la méthode du coude.
Envisagez différentes mesures de distance pour mesurer la similarité entre les points de données.
Régularisez le processus de clustering pour éviter le surajustement.

En résumé, l'apprentissage automatique implique de nombreuses tâches, techniques, algorithmes, méthodes d'évaluation de modèles et conseils utiles. En comprenant ces aspects, les praticiens peuvent appliquer efficacement l'apprentissage automatique aux problèmes du monde réel et tirer des informations importantes des données. Les exemples de code donnés présentent l'utilisation d'algorithmes d'apprentissage supervisés et non supervisés, mettant en évidence leur mise en œuvre pratique.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Financement EVM. Interface unifiée pour la finance décentralisée. Accéder ici.
Groupe de médias quantiques. IR/PR amplifié. Accéder ici.
PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
La source: https://stackabuse.com/supervised-learning-vs-unsupervised-learning-algorithms/

Mots clés: a, capacité, accepté, précision, Avec cette connaissance vient le pouvoir de prendre, atteint, à travers, Réellement, objectif, vise, algorithme, algorithmes, aussi, an, selon une analyse de l’Université de Princeton, et, anticiper, applications, vous inscrire, Application, approprié, de manière appropriée, SONT, AS, aspects, Evaluer, automatiquement , éviter, base, basé, BE, devenez, comportements, va, LES MEILLEURS, mieux, jusqu'à XNUMX fois, binaire, biologie, cerveau, largement, construit, entreprises, by, Les Campagnes, CAN, peut aider, capturer, maisons, cas, certaines, difficile, caractéristiques, Tricher, vérifier, choisir!, les classes, classification, classifié, classer, grappe, regroupement, Clusters, code, moissonneuses-batteuses, commandes, Commun, Communication, composant, comprendre, ordinateur, Informatique, Considérer, construit, comprenant, continu, correct, correspondant, engendrent, traverser, crucial, des clients, clientèle , Données client, Satisfaction client, segmentation de la clientèle, Clients, données, points de données, jeu de données, décision, arbres de décision, décisions, Démographie, Dériver, Détection, développement, différent, Réduction de la dimensionnalité, disciplines, découvrez, distance, distinct, distinguer, plusieurs, divise, domaine, download, Livre électronique, efficacement, non plus, coude, email, emails, émergé, employés, ENGINEERING, de renforcer, estimation, Évaluer, évaluer, évaluation, exemple, Exemples, Découvrez, Expériences, explicitement, exponentiel, croissance exponentielle, F1, Fonctionnalité, Ingénierie des caractéristiques, Fonctionnalités:, champ, filtration, finance, trouver, Prénom, s'adapter, Focus, se concentre, Pour, fraude, détection de fraude, de, fonction, fonctions, Obtenez, Git, donné, objectif, Sol, groupes, Croissance, guide, habitudes, manipuler, mains, mains sur, d’aide, utile, ici, hiérarchie, Soulignant, indices, Comment, How To, humain, cerveau humain, identifier, identifier, image, Classification d'image, la mise en oeuvre, L’, important, améliorer, in, comprendre, inclus, Y compris, nouveau, indispensable, secteurs , industrie, inertie, d'information, contribution, idées., instance, développement, implique, Is, vous aider à faire face aux problèmes qui vous perturbent, IT, SES, K-Moyens, Mots clés, kméens, spécialisées, langue, APPRENTISSAGE, apprentissage, apprend, légitime, à effet de levier, comme, Régression Linéaire, Régression logistique, click, machine learning, Les machines, Entrée, faire, Fabrication, Localisation, Stratégie, Campagnes Marketing, significative, veux dire, mesurer, Fusion, messages, méthode, méthodes, Métrique, manquant, ML, modèle, Évaluation du modèle, numériques jumeaux (digital twin models), PLUS, (en fait, presque toutes), plusieurs, Nature, Langage naturel, traitement du langage naturel, réseau et, Neural, Réseau neuronal, modèles de réseaux de neurones, neufs, aucune, nœuds, nombre, nombreux, of, Offrandes, souvent, on, une fois, ONE, optimiser, or, nos, nos données, ande, sortie, sorties, apparié, motifs, PCA, performant, Personnaliser, Platon, Intelligence des données Platon, PlatonDonnées, des notes bonus, possible, pratique, pratiques, praticiens, avec précision, prévoir, prévoir, Prédictions, préférences, présence, conservation, Directeur, analyse des composants principaux, Processus, traitement, Produit, proven, fournir, achat, Python, qualité, réal, monde réel, rappeler, recommandations, Réduit, réduction, régression, apprentissage par renforcement, Les relations, pertinent, enlèvement, représentations, Résultats, s, client, Sciences, scikit-apprendre, Score, Cherche, clignotant, segmenter les clients, Segmentation, expéditeur, Série, commun, feuille, Vitrine, significative, similaires, similarité, étapes, depuis, le spam, Emails de spam, groupe de neurones, scission, Normes, Arrêter, Stratégies, structure, structures, Étude, Tel, Résumé, Supervisé, enseignement supervisé, support, Système, tailleur, Target, des campagnes marketing ciblées,, marketing ciblé, tâches, techniques, tester, qui, La, leur, Les, puis, Là, Ces, this, ceux, trois , Avec, conseils, trucs et astuces, à, outil, train, Qualifié, Formation, données d'entraînement, arbre, arbres, Astuces, Vérité, deux, devoiler, comprendre, Non supervisé, apprentissage non supervisé, indésirable, utilisé, cas d'utilisation, Occasion, en utilisant, utilitaire, Utilisation, utilisant, validation, valeurs, Variable, les variables, Divers, vecteur, visualisation, vs, we, De, tout en, largement, sera, avec, dans les, sans, PROJETS, world, X, zéphyrnet

CompTIA soutient les efforts du ministère de la Défense visant à renforcer les connaissances et les compétences en matière de cybersécurité

23 avril 2024 4h

Pourquoi un taxi autonome Waymo a roulé du mauvais côté de la route de SF

23 avril 2024 4h

Shiba Inu ou Dogecoin : quel Meme Coin acheter pour un gain 10X ?

23 avril 2024 4h

Mise à jour d'IQT Vancouver/Pacific Rim : Chris Hickman, directeur de la sécurité de Keyfactor, sera conférencier en 2024 – Inside Quantum Technology

23 avril 2024 4h

Xlera8

Apprentissage supervisé vs algorithmes d'apprentissage non supervisé

Republié par Platon

Introduction

Tâches d'apprentissage automatique

Apprentissage supervisé

Apprentissage non supervisé

Principales classes d'algorithmes

Algorithmes d'apprentissage supervisé

Algorithmes d'apprentissage non supervisé

Évaluation du modèle

Apprentissage supervisé

Apprentissage non supervisé

Trucs et astuces

Apprentissage supervisé

Apprentissage non supervisé

Le prix XRP envisage une cassure alors que l'analyste prédit une hausse potentielle de 150 %

Les Bitcoin Runes représentaient 57.7% des transactions le jour de la réduction de moitié

Shiba Inu ou Dogecoin : quel Meme Coin acheter pour un gain 10X ?

Mise à jour d'IQT Vancouver/Pacific Rim : Chris Hickman, directeur de la sécurité de Keyfactor, sera conférencier en 2024 – Inside Quantum Technology

Discutez avec nous