Principal Component Analysis (PCA)

Video: StatQuest: Principal Component Analysis (PCA), Step-by-Step

Inhoud

Definitie - Wat betekent Principal Component Analysis (PCA)?
Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.
Techopedia verklaart Principal Component Analysis (PCA)

Definitie - Wat betekent Principal Component Analysis (PCA)?

Principal component analysis (PCA) is een techniek die wordt gebruikt voor de identificatie van een kleiner aantal niet-gecorreleerde variabelen, bekend als hoofdcomponenten uit een grotere set gegevens. De techniek wordt veel gebruikt om variatie te benadrukken en sterke patronen in een gegevensset vast te leggen. Uitgevonden door Karl Pearson in 1901, belangrijkste componentenanalyse is een hulpmiddel dat wordt gebruikt in voorspellende modellen en verkennende gegevensanalyse. Belangrijkste componentenanalyse wordt beschouwd als een nuttige statistische methode en wordt gebruikt in velden zoals beeldcompressie, gezichtsherkenning, neurowetenschappen en computergraphics.

Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze handleiding leert u wat cloud computing inhoudt en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia verklaart Principal Component Analysis (PCA)

Belangrijkste componentanalyse helpt gegevens gemakkelijker te verkennen en te visualiseren. Het is een eenvoudige niet-parametrische techniek voor het extraheren van informatie uit complexe en verwarrende gegevenssets. De hoofdcomponentanalyse is gericht op de maximale variantie met het minste aantal hoofdcomponenten. Een van de duidelijke voordelen van de analyse van de hoofdcomponenten is dat zodra patronen worden gevonden in de betreffende gegevens, ook compressie van gegevens wordt ondersteund. Men maakt gebruik van principale componentenanalyse om het aantal variabelen te elimineren of wanneer er teveel voorspellers zijn in vergelijking met het aantal waarnemingen of om multicollineariteit te vermijden. Het is nauw verwant aan canonieke correlatieanalyse en maakt gebruik van orthogonale transformatie om de reeks observaties met gecorreleerde variabelen om te zetten in een reeks waarden die bekend staan als hoofdcomponenten. Het aantal hoofdcomponenten dat wordt gebruikt bij de analyse van hoofdcomponenten is kleiner dan of gelijk aan het kleinere aantal observaties. Belangrijkste componentanalyse is gevoelig voor de relatieve schaal van de oorspronkelijk gebruikte variabelen.

Belangrijkste componentenanalyse wordt veel gebruikt op veel gebieden zoals marktonderzoek, sociale wetenschappen en in industrieën waar grote gegevenssets worden gebruikt. De techniek kan ook helpen om een lager-dimensionaal beeld van de originele gegevens te krijgen. In het geval van principale componentenanalyse zijn slechts minimale inspanningen nodig om een complexe en verwarrende gegevensverzameling te reduceren tot een vereenvoudigde nuttige informatieset.