000 03427cam a2200277 4500
090 _a168389
_9168388
001 FRBNF454733730000006
010 _a9782710811817
_bbr.
_d45 EUR - 713 DH
020 _b01841836
073 0 _a9782710811817
100 _a20180327d2018 m y0frey50 ba
101 0 _afre
105 _a||||z 00|y|
106 _ar
200 1 _aData science par analyse des données symboliques
_bLIVR
_eune nouvelle façon d'analyser les données classiques, complexes et massives à partir des classes
_eapplications avec Syr et R
_fFilipe Afonso, Edwin Diday, Carole Toque
210 _e63-Clermont-Ferrand
_gImpr. la Source d'or
_aparis
_céditions TECHNIP
_dDL 2018
_dcop. 2018
_dimpr. 2018
215 _a1 volume de VIII-435 pages
_cillustré en noir, couverture illustrée en couleur
_d24 cm
300 _aBibliographie pages 419-435
330 _aLa numérisation croissante de notre société alimente des bases de données de taille grandissante (Big Data). Ces données sont souvent complexes (hétérogènes et multi-tables) et peuvent être la source de création de valeur considérable à condition qu’elles soient exploitées avec des méthodes d’analyse adéquates. Un « Data Scientist » a justement pour objectif d’extraire des connaissances de ce type de données et c’est l’objectif de cet ouvrage. Les classes constituent un pivot central de la découverTe de connaissances. En Analyse des Données Symboliques (ADS), les classes sont décrites par des variables dites symboliques prenant en compte leur variabilité interne sous forme de distributions, d’intervalles, d’histogrammes, de diagrammes de fréquences, etc. Le livre débute par la construction de différents types de variables symboliques à partir de classes données. Des statistiques descriptives, une méthode de discrétisation automatique adaptée aux données massives (Big Data) suivies par des indices de proximité étendus aux données symboliques y sont présentés. Vient ensuite un ensemble de méthodes présenté dans le contexte de l’ADS. Il s’agit de la méthode des nuées dynamiques (MND), de la décomposition de mélange par partition (issue de la MND) ou par partition floue (EM), de l’analyse en composantes principales, de l’algorithme Apriori, des règles d’association et des arbres de décision. Pour la prévision, le livre présente des méthodes de régressions dont celles pénalisées « ridge », « lasso » et « elastic », et des séries temporelles. Pour la mise en application de ces premières méthodes, des exercices et des applications concrètes réalisées auprès d’administrations, d’industriels, de financiers et de scientifiques sont proposés. Leur mise en œuvre s’appuie aussi bien sur le logiciel innovant Syr que sur le logiciel statistique R. Cet ouvrage d’introduction à l’ADS s’adresse aux étudiants, aux ingénieurs, aux universitaires, ainsi qu’à tous ceux qui désirent comprendre cette nouvelle façon de penser en Science des Données.
606 _313739982
_aAnalyse des données symboliques
_2rameau
_97303
676 _a006.312
_v23
686 _2Cadre de classement de la Bibliographie nationale française
700 _317744628
_aAfonso
_bFilipe
_f1979-....
_4070
_97304
701 _311900130
_aDiday
_bEdwin
_4070
_97305
701 _314141569
_aToque
_bCarole
_4070
_97306
801 0 _aFR
_bFR-751131015
_c20180327
_gAFNOR
_2intermrc