Canonicalization

Schrijver: Monica Porter
Datum Van Creatie: 15 Maart 2021
Updatedatum: 1 Kunnen 2024
Anonim
How to Canonicalize Your URLs
Video: How to Canonicalize Your URLs

Inhoud

Definitie - Wat betekent Canonicalization?

Canonicalisatie is het proces van het converteren van gegevens waarbij meerdere representaties betrokken zijn in een standaard goedgekeurd formaat. Een dergelijke conversie zorgt ervoor dat gegevens voldoen aan canonieke regels. Dit vergelijkt verschillende representaties om gelijkwaardigheid te verzekeren, aantallen verschillende datastructuren te tellen, een zinvolle sorteervolgorde op te leggen en de algoritme-efficiëntie te verbeteren, waardoor herhaalde berekeningen worden geëlimineerd.

Canonicalisatie wordt in tal van internet- en computertoepassingen gebruikt om canonieke gegevens te genereren uit niet-canonieke informatie. Canonieke weergave van gegevens wordt veel gebruikt in
zoekmachineoptimalisatie (SEO), webservers, Unicode en XML.

Deze term staat ook bekend als C14N, standaardisatie of normalisatie.


Een inleiding tot Microsoft Azure en de Microsoft Cloud | In deze gids leert u waar cloud computing over gaat en hoe Microsoft Azure u kan helpen bij het migreren en runnen van uw bedrijf vanuit de cloud.

Techopedia verklaart Canonicalization

In SEO behandelt URL-canonicalisatie webinhoud met meer dan één mogelijke URL. Dit kan verschillen in zoekopdrachten veroorzaken omdat de zoekmachine mogelijk niet weet welke URL moet worden weergegeven. Canonicalization kiest de beste URL uit verschillende keuzes, meestal verwijzend naar startpagina's. Hoewel bepaalde URL's hetzelfde lijken te zijn, retourneren webservers verschillende resultaten voor de URL's. Zoekmachines beschouwen slechts één URL in canonieke vorm.

Computerbeveiliging is gebaseerd op canonicalisatie van bestandsnamen. Sommige webservers hebben mogelijk een beveiligingsregel om bestanden alleen onder een bepaalde map uit te voeren. Het bestand wordt dan alleen uitgevoerd als het pad de opgegeven map in de naam heeft. Er moet speciale aandacht worden besteed aan het controleren of de bestandsnaam een ​​unieke weergave is. Een dergelijke kwetsbaarheid wordt directory doorkruisen genoemd.

De meeste tekens in de Unicode-standaard hebben coderingen met variabele lengte. Dit vereist een overweging van elk stringkarakter en maakt de stringvalidatie complexer. Als niet alle karaktercoderingen in de software-implementatie worden meegenomen, is er een mogelijkheid van bugs. Dit probleem kan worden opgelost met behulp van enkele codering voor elk personage. Het beste alternatief, dat elke software kan nemen, is om te controleren of de string canonicalized is. Strings die niet gecanoniseerd zijn, kunnen worden afgewezen.

Een canoniek XML-document is een XML-document in XML-canonieke vorm. Het wordt bepaald door een canonieke XML-specificatie. Canonicalisatie in XML elimineert witruimte binnen tags, sorteert naamruimtereferenties en elimineert overbodige en gebruikt bepaalde karaktercoderingen. Het verwijdert ook XML- en DOCTYPE-aangiften, naast het transformeren van relatieve URL's in absolute URL's.