Deze pagina behandelt het technische proces van het categoriseren van Wikipedia-pagina's .
"Categorie" betekent:
Kategorie:Frau
).De categoriebeschrijvingspagina 's worden gebruikt om een lijst weer te geven van de pagina's die naar deze categorie linken. In veel gevallen bevatten ze geen tekst die zou worden weergegeven in het bewerkingsvenster bij het bewerken van de beschrijvingspagina. Als hier informatie over de inhoud van de categorie wordt ingevuld, verschijnt deze in de normale weergave boven de automatisch gegenereerde lijst met pagina's die in deze categorie zijn ingedeeld.
In Wikipedia zijn bijna alle categorieën zelf opgenomen in een supercategorie. Categorieën moeten meestal hiërarchisch worden gekoppeld - d.w.z. zonder lussen te vormen - zodat aan elke categoriepagina duidelijke sub- en hoofdcategorieën kunnen worden toegewezen.
1. Welke pagina's zijn gecategoriseerd?
2. Keuze van categorieën
voorbeeld | Hoort bij het onderwerp | Is een onderdeel van) | Lokale/tijdelijke fixatie |
---|---|---|---|
Charles Darwin | Categorie:Auteur , Categorie:Man | Categorie:Brits , Categorie:Geboren 1809 , Categorie:Overleden 1882 | |
cent (valuta) | Categorie:Euro | Categorie:Valutaeenheid |
3. Classificatie van artikelen in categorieën
[[Categorie:Xyz]]
[[:Kategorie:Frau]]
). Hiermee wordt ook voorkomen dat de pagina wordt opgenomen in de genoemde categorie. Een dergelijke verwijzing naar een categorie mag echter normaal gesproken niet worden opgenomen in de hoofdtekst van een normale artikelpagina .)4. Controle van de opdracht
Standaard staan alle pagina's die in een categorie zijn geplaatst in alfabetische volgorde op de categoriepagina.
Er kunnen echter redenen zijn om deze volgorde te wijzigen. Voorbeelden:
In principe moeten echter de specificaties voor de afzonderlijke categorieën en vakgebieden in acht worden genomen. De artikelen worden niet weggelaten voor geografische namen. En voor persoonsnamen gelden in sommige talen andere regels, zie hieronder.
Om de alfabetische volgorde te omzeilen, specificeert men een andere tekst in plaats van het lemma van de pagina. Hiervoor wordt het trefwoord {{SORTIERUNG:}}
(voorheen ook Engels {{DEFAULTSORT:}}
) gebruikt. Het komt direct voor de categorieën in de broncode van het artikel. Na de dubbele punt staat de tekenreeks die de gewenste rangschikking voor alfabetische sortering creëert. De sortering geldt dan voor alle categorieën in het artikel. Als u de sortering voor slechts één categorie wilt wijzigen, raadpleegt u #Sortingsuitzonderingen voor afzonderlijke categorieën .
Bij het sorteren moeten de volgende regels in acht worden genomen (zie onderstaande tabel voor voorbeelden).
niet meer nodig, is verwijderd.
niet meer nodig, is verwijderd.
Alleen de 26 basisletters van het Duitse alfabet worden gebruikt. Er is geen onderscheid tussen hoofdletters en kleine letters, een kleine "a" resulteert in dezelfde sortering als een hoofdletter "A".
Als een lemma andere tekens bevat dan de basisletters, dan moeten deze worden geconverteerd voor de juiste sortering.
Reden: Anders zou de Mediawiki-software alle speciale letters van het Duitse alfabet sorteren op de ASCII - letters.
Dat geldt voor
In afzonderlijke afdelingen is bepaald dat in bepaalde gevallen tekens uit niet-Latijnse alfabetten in het lemma worden gebruikt. Ze blijven behouden zodat de sortering binnen deze speciale alfabetten correct blijft.
Let op: dit punt gaat achterhaald worden, het tijdstip is nog onduidelijk: Wikipedia:Surveys/Sort key simple .
Alle speciale tekens zijn weggelaten.
Reden: De Mediawiki-software sorteert enkele speciale tekens voor en andere na de letters van het alfabet.
zie #eigenaardigheden voor persoonsnamen
Mensen worden (meestal) gesorteerd op achternaam. Zie hieronder voor details .
Voor artikelen waarvan het lemma begint met "Lijst ..." moet een sorteersleutel worden opgegeven zodat de artikelen niet onder L worden ingedeeld. Als sorteersleutel moet, indien mogelijk, het deel van het lemma worden gekozen waarin de lijsten in de categorie van elkaar verschillen, bijvoorbeeld in Category:List (kerkgebouwen op locatie) moet als sorteersleutel de plaatsnaam worden opgegeven.
Lemmata die beginnen met een bepaald of onbepaald lidwoord (ongeacht de naamval of taal) worden gesorteerd op het volgende woord. Het item wordt {{SORTIERUNG:}}
aan het einde van de sorteersleutel ( ) geplaatst en gescheiden door een hekje ( #
). (De komma ( ,
) die vaak wordt gebruikt om het artikel te scheiden, moet worden vermeden, omdat dit tot een onjuiste sortering leidt.)
Reden: Het weglaten van het artikel maakt het zoeken in de categorieën gemakkelijker. Door het artikel aan het einde te plaatsen, kunnen gelijkaardige lemma's met verschillende artikelen correct worden gesorteerd. Scheiding door de hash voorkomt onjuiste sortering, omdat deze, in tegenstelling tot de komma, voorrang heeft op de letters voor de Mediawiki-software.
Een uitzondering zijn geografische namen, deze worden altijd gesorteerd bij hun artikel.
Ondubbelzinnige pagina's worden over het algemeen gesorteerd "zoals ze zijn", zie Wikipedia: WikiProject ondubbelzinnige pagina's/FAQ#Hoe zit het met categorieën? .
Lemmata die beginnen met een getal worden voorafgegaan door een hekje ( #
) en een aantal dubbele punten ( ) dat overeenkomt met het aantal cijfers in dit getal (zonder decimalen). Reden: De hash zorgt ervoor dat alle getallemma's in een kolom vóór de letter A worden vermeld. De dubbele punten zorgen ervoor dat de getallen numeriek worden gesorteerd, d.w.z. eerst alle eencijferige getallen, dan de tweecijferige getallen, dan de driecijferige getallen.
Cijferreeksen die met 0 beginnen, moeten afzonderlijk worden behandeld.
:
Cijfers die niet aan het begin van het lemma staan, blijven behouden. Als er meerdere lemma's van hetzelfde type zijn die alleen in de cijfers verschillen, worden de cijfers zo nodig voorafgegaan door nullen.
Reden: Het getal 10 zou voor 9 worden gesorteerd omdat de Mediawiki-software elk cijfer van een getal afzonderlijk vergelijkt (hier: 1 is minder dan 9).
De toevoeging van haakjes tussen haakjeslemma's wordt weggelaten. Als dit resulteert in dezelfde sorteersleutel binnen een categorie, is dit geen probleem. Aangezien er geen algemene regels zijn voor het toevoegen van haakjes, mogen ze niet worden gebruikt om artikelen met dezelfde naam te sorteren. De interne volgorde van deze gelijknamige artikelen is ondergeschikt. (Deze regel is controversieel.)
Let op: Door het gebruik van hoofdletters en kleine letters zijn de sorteerteksten beter leesbaar. Het verschil wordt echter genegeerd bij het sorteren op de categoriepagina.
Regel | kant | syntaxis | opmerking |
---|---|---|---|
3 | Kaas | {{SORTIERUNG:Kase}}
|
ä/ ö/ ü wordt een/ o/ u |
3 | Creme brulee | {{SORTIERUNG:Creme brulee}}
|
Accenten zijn weggelaten |
3 | Leuk feest voor Duitsland | {{SORTIERUNG:Spasspartei fur Deutschland}}
|
ß wordt ss, ü wordt u |
3 | Aeroskøbing | {{SORTIERUNG:Aeroskobing}}
|
Letters van een "vreemd" alfabet zijn "germaniseerd". |
4 | Albert Einstein High School | {{SORTIERUNG:Alberteinsteinoberschule}}
|
Woorden verbonden door koppeltekens worden één woord. |
4 | Oma's Marathon | {{SORTIERUNG:Grandmas Marathon}}
|
Tekens gescheiden door apostrofs worden samengevoegd. |
4 | O broeder, waar ben je? – Een Mississippi Odyssee | {{SORTIERUNG:O Brother Where Art Thou Eine Mississippiodyssee}}
|
Laat leestekens (komma, vraagteken, streepje) weg, woorden verbonden door koppeltekens worden één woord. |
5 | Gerd Müller | {{SORTIERUNG:Muller, Gerd}}
|
Zet achternaam vooraan (zie ook hieronder), scheid de voornaam met een komma, ü wordt u |
6 | Lijst met afleveringen van Simpsons | {{SORTIERUNG:Simpsonsepisoden}}
|
De inhoud van de lijst is bepalend. |
7 | Het kasteel | {{SORTIERUNG:Schloss #Das}}
|
Artikelen met een voorafgaande ruit achterstevoren |
7 | Het adelaarsnest | {{SORTIERUNG:Adlers Horst #Des}}
|
ook artikelen in een ander geval omgekeerd |
7 | De rollende stenen | {{SORTIERUNG:Rolling Stones #The}}
|
ook artikelen in andere talen achteruit |
8ste | 21 juli | {{SORTIERUNG:#::21 Juli #Der}}
|
Hekje en dubbele punten voor cijfers aan het begin van het lemma zetten |
8ste | 20.000 mijlen onder de zee | {{SORTIERUNG:#:::::20000 Meilen unter dem Meer}}
|
Aantal dubbele punten = aantal cijfers |
9 | Apollo 9 | {{SORTIERUNG:Apollo 09}}
|
een voorloopnul omdat er ook Apollo 10 tot en met 20 . is |
10 | De bestanden (film) | {{SORTIERUNG:Akte #Die}}
|
Laat haakjes weg |
10 | jij (Haggard) | {{SORTIERUNG:Sie #Haggard}}
|
U kunt ook inhoud tussen haakjes toevoegen na de hash als verwarring met een ander lemma tussen haakjes in de categorie mogelijk is. (Hier b.v. met: You (Stephen King) . Beide zijn romans.) |
Meestal worden persoonlijke namen {{SORTIERUNG:Familienname, Vorname}}
opgenomen. Er zijn echter een paar uitzonderingen om op te merken. Verdere details zijn te vinden op de helppagina: Namen in persoonlijke gegevens :
kant | syntaxis | opmerking |
---|---|---|
Kurt Neven DuMont | {{SORTIERUNG:Neven DuMont, Kurt}} |
De achternaam kan uit meerdere woorden bestaan. |
Theodor von Schacht | {{SORTIERUNG:Schacht, Theodor von}} |
Bij Duitse namen wordt een voorzetsel (an, auf, auf der, aus, in, von, zu ...) niet gebruikt voor het sorteren. |
Eric von Schmidt | {{SORTIERUNG:Von Schmidt, Eric}} |
In Engelstalige landen hoort het voorzetsel echter bij de familienaam. |
Melchior op straat | {{SORTIERUNG:Zur Strassen, Melchior}} |
Samengevoegd voorzetsel en lidwoord (zur = zu + der) tellen mee voor de familienaam. |
Heinrich Friedrich Karl van en naar de steen | {{SORTIERUNG:Stein, Heinrich Friedrich Karl vom und zum}} |
Verschillende achtervoegsels verbonden door "en" tellen niet mee voor de familienaam. |
Doris Schröder-Köpf | {{SORTIERUNG:Schroderkopf, Doris}} |
Voor- of achternaam met koppeltekens worden samen geschreven. |
Peter O'Toole Mauro D'Alay |
{{SORTIERUNG:OToole, Peter}} {{SORTIERUNG:DAlay, Mauro}} |
Apostrofs in namen zijn volledig weggelaten. |
Pierre de Coubertin Adolphe d'Archiac |
{{SORTIERUNG:Coubertin, Pierre de}} {{SORTIERUNG:Archiac, Adolphe d}} |
In Franstalige landen worden voorzetsels vóór een naam (de, d') niet gebruikt om te sorteren. |
Jean de la Fontaine | {{SORTIERUNG:La Fontaine, Jean de}} |
Artikelen en hun fusies (Des, Du, La, Le, Les) worden echter geteld als onderdeel van de familienaam in Franse namen. |
Arantxa Sánchez Vicario | {{SORTIERUNG:Sanchez Vicario, Arantxa}} |
Spaanse achternamen bestaan gewoonlijk uit twee namen, waarbij soms de tweede wordt weggelaten, zie Spaanse naam . |
José da Costa Nunes | {{SORTIERUNG:Nunes, Jose da Costa}} |
Portugese achternamen, die vaak uit meerdere achternamen bestaan, worden gesorteerd onder het laatste deel van de naam. |
Olafur Ragnar Grimsson | {{SORTIERUNG:Olafur Ragnar Grimsson}} |
IJslanders zijn gesorteerd op voornaam omdat IJsland patroniemen heeft in plaats van familienamen. |
Al-Ghazal | {{SORTIERUNG:Ghazal}} |
Voor Arabische namen worden lidwoorden (Al-, An-, Ar-, As-, At-, Az-) niet gebruikt om te sorteren. |
Mao Zedong | {{SORTIERUNG:Mao, Zedong}} |
Bij Chinese, Vietnamese en Koreaanse namen wordt meestal eerst de familienaam gegeven, daarna de persoonsnaam, zie ook: Chinese naam . Net als bij Europese namen worden de twee delen van de naam gescheiden door een komma. |
Samak Sundaravej | Hoewel Thaise namen eerst de persoonsnaam (voornaam), daarna de familienaam vermelden, worden ze altijd gesorteerd op persoonsnaam, zie ook: Thaise namen . | |
Lodewijk IX (Frankrijk) | {{SORTIERUNG:Ludwig 09 #Frankreich}} |
Linialen met Romeinse cijfers in het lemma moeten Arabische cijfers in de sorteersleutel hebben, omdat IX alfabetisch voor VIII komt. Voor enkelcijferige getallen moet een voorloopnul worden ingevoegd, zodat 10 niet voor 9 wordt gesorteerd. |
Arthur Wellesley, 1st Hertog van Wellington | {{SORTIERUNG:Wellesley, Arthur, 1 Duke of Wellington}} |
Britse collega's worden voornamelijk gesorteerd op burgerlijke familienaam, niet op adellijke naam. |
Walther von der Vogelweide | {{SORTIERUNG:Walther von der Vogelweide}} |
Europeanen van de oudheid tot de middeleeuwen worden over het algemeen gesorteerd op hun voornaam: de voornaam is geen voornaam en achtervoegsels of oorsprongsbenamingen zijn geen familienamen. |
Andrea Doria (het ondubbelzinnig maken) | Het ondubbelzinnig maken van namen wordt niet gesorteerd op achternaam, zie ook Wikipedia :WikiProject ondubbelzinnig maken pagina's/FAQ#Hoe zit het met categorieën? . |
Over het algemeen worden mensen in alle categorieën ingedeeld volgens de hier genoemde patronen, ook niet-persoonscategorieën.
Chemische verbindingen hebben zogenaamde isomeren , die dezelfde naam hebben met een of meer voorvoegsels . Om ervoor te zorgen dat deze correct in de juiste categorie worden weergegeven, wordt de sortering voor de verbinding 1,1-dijoodethaan bepaald via {{SORTIERUNG:Diiodethan11}}
, verdere details zijn ook te vinden in de chemierichtlijnen :
kant | syntaxis | opmerking |
---|---|---|
1,1-dijoodethaan | {{SORTIERUNG:Diiodethan11}} |
Sorteren gebeurt voornamelijk op de naam dijoodethaan en secundair op de positie van de substituenten (1 en 1), zie categorie: joodalkaan |
1,2-dijoodethaan | {{SORTIERUNG:Diiodethan12}} |
zie hierboven, items 1 en 2 |
1,6-dijoodhexaan | {{SORTIERUNG:Diiodhexan16}} |
zie hierboven, posities 1 en 6 |
p-aminohippuurzuur | {{SORTIERUNG:Aminohippursaurep}} |
zie hierboven, para positie |
De {{SORTIERUNG:}}
volgorde gespecificeerd door is standaard van toepassing op alle categorieën die in het artikel worden gebruikt. Soms kan het wenselijk zijn om in een bepaalde categorie een andere sortering te hanteren. DJ Sammy verschijnt bijvoorbeeld onder "D" in Categorie:Spaans, maar onder "S" in Categorie : DJ zoals Sammy . Om een enkele categorie anders te behandelen, is er de zogenaamde pipe , het |
-karakter.
Met de syntaxis
[[Categorie:DJ|Sammy]]
het artikel is ingedeeld in de categorie DJ onder de tekst na de pijp (hier Sammy ). In alle andere categorieën volgt de sortering de tekst SORTEREN (indien deze specificatie niet beschikbaar is: het lemma).
De tekens spatie , uitroepteken , asterisk en hash zijn beschikbaar voor artikelen die categorieën, portalen of lemma's uitleggen die beginnen met speciale tekens . Ze worden gebruikt om de positie van het item in de categorie te beïnvloeden, bijvoorbeeld om speciale items in de categorie te onderscheiden en te markeren van normale items.
Met de syntaxis
[[Categorie:Xyz| ]]
(d.w.z. het pijpsymbool en een extra spatie) de pagina wordt gesorteerd voor alle andere pagina's.
Als er meerdere pagina's moeten worden weergegeven vóór de eigenlijke alfabetische lijst, kan de sorteersleutel Abc worden opgegeven na de spatie:
[[Categorie:Xyz| ABC]]
Deze optie is handig voor het hoofdartikel en andere categorieverklarende artikelen.
Wordt
[[Categorie:Xyz|!Abc]]
wordt gebruikt, verschijnen deze vermeldingen onder de kop "!" aan het begin na de spatie maar vóór de letters. Deze optie is ideaal voor lijsten en portals.
Voor een verder onderscheid van het voorgaande, zie ook:
[[Categorie:Xyz|*Abc]]
gebruikt. Zo worden belangrijke subtypes van een term (per !
) onderscheiden van lijsten met individuele objecten ( *
in de zin van "meerdere").
Voor pagina's waarvan de naam begint met een cijfer of een speciaal teken, raden we het hekje aan ( #
):
[[Categorie:Xyz|#Abc]]
Dit betekent dat de cijfers 1-9 en de speciale tekens onder één kopje worden gecombineerd en de weergave niet onnodig wordt afgebroken. Deze pagina's verschijnen dan na de review-artikelen, maar voor alle andere pagina's (A-Z). Als meerdere pagina's in een categorie met cijfers beginnen, schrijf dan de volledige paginanaam direct na het hekje. Dan worden de pagina's in de # sectie correct gesorteerd. Een voorbeeld zou zijn:
[[Categorie:Xyz|#::::1984]]
Af en toe worden andere speciale tekens gebruikt in onderwerpclassificaties, waaronder die om artikelen helemaal aan het einde te sorteren. Sommige vakgebieden hebben uitgebreide speciale sleutels (bijvoorbeeld categorie: riviersysteem ).
Als de speciale sleutels in een categorie te complex worden, is het in het algemeen raadzaam om na te denken over subcategorieën voor de gewenste groeperingen. De genoemde categorieverklarende sleutels kunnen dan eventueel ook op deze categorieën van toepassing zijn (zie hieronder Toekenning categorieën aan categorieën ).
Categoriepagina's kunnen op hun beurt worden toegewezen aan andere categorieën. Op elke categoriepagina [[Kategorie:Xyz]]
heeft de bovenliggende categorie bijvoorbeeld de vorm
[[Categorie:Uvw]]
opgegeven (vergelijkbaar met de procedure voor normale pagina's). Dit maakt Xyz een subcategorie van Uvw. De logische samenhang is: Alle pagina's die een Xyz zijn, zijn automatisch ook een Uvw .
Het gebruik van subcategorieën is echter niet triviaal, aangezien de software nog niet de bijbehorende evaluatiefuncties bevat en het moeilijk is om overeenstemming te bereiken over de juiste hiërarchieën.
In grote hoofdcategorieën met meer dan 200 pagina's is het raadzaam om de subcategorieën helemaal aan het begin onder het teken "!" te sorteren, anders verschijnen ze niet op de "startpagina" van de hoofdcategorie en zijn daarom moeilijk te vinden :
[[Categorie:Uvw|!Xyz]]
Zie ook: classificatie van categorieën
Sinds mei 2014 kunnen geregistreerde gebruikers de naam van de categoriebeschrijvingspagina wijzigen . Dit moet van tevoren worden voorgesteld en besproken in de Wikipedia:WikiProject-categorieën .
Alle items in de oude categorie moeten dan echter worden toegewezen aan de hernoemde categoriebeschrijving, wat handmatig kan worden gedaan of met een groter aantal met behulp van een bot .
Geregistreerde gebruikers kunnen de weergave van categorieën onder aan de pagina uitschakelen door de volgende CSS -verklaring in hun common.css in te voeren ; zie ook WP:CSS :
# catlinks {
weergave : geen ;
}
Het heeft geen zin om omleidingen voor categorieën aan te maken, aangezien de gecategoriseerde artikelen niet worden "omgeleid" naar de doelcategorie, maar alleen worden weergegeven in de omleidingscategorie. Dit punt moet niet worden verward met het categoriseren van artikelomleidingen, wat handig kan zijn, zie Wikipedia:Redirect #categorization .
Soms is het nodig om in een discussie naar categorieën te verwijzen (maar bijvoorbeeld ook op ondubbelzinnige pagina's, gebruikerspagina's en gebruikerssubpagina's). Dit dient altijd [[:Kategorie:Ort in Deutschland]]
te gebeuren met een dubbele dubbele punt in het formulier, zodat de discussiebijdrage niet in de lijst met pagina's die tot de categorie behoren, verschijnt.
[[:categorie:categorienaam]] [[:categorie:categorienaam|naam]]
In het tweede voorbeeld zou alleen de term die is opgegeven als 'Label' in de hoofdtekst van de pagina verschijnen.
Probleem: u wilt bijvoorbeeld een artikel over een 20e-eeuwse auteur van boeken voor jonge volwassenen categoriseren, maar u weet niet welke categorieën u moet gebruiken.
Oplossing: je roept het artikel op van een andere bekende jongvolwassen auteur uit de 20e eeuw en kijkt welke categorieën in dit artikel worden gebruikt. Als je niet meteen een vertegenwoordiger van dit onderwerp kunt bedenken, kun je het artikel van een jeugdboek oproepen, dat je naar de categorie Categorie:Kinder- en jeugdliteratuur brengt, bijvoorbeeld , roep het op en zoek een relevante auteur aldaar.
Categorieën die in een tekst ineffectief zijn gemaakt door een dubbele punt achter de dubbele vierkante haken (hiervoor wordt soms de term "afgewaardeerd") kunnen niet worden gevonden met de functie "Links naar deze pagina".
Evenzo kan de Wikimedia-software niet meer traceren welke elementen aan een verwijderde categorie zijn toegewezen.