Et korpus er en større mængde af tekster indsamlet og tilgængelig i elektronisk form.
Faktaboks
- Etymologi
-
Ordet kommer fra latin corpus 'krop, legeme'.
Korpusser bruges hovedsageligt til kvalitative og kvantitative undersøgelser af sproget (korpuslingvistik), til udarbejdelse af ordbøger og til udvikling af sprogteknologi og kunstig intelligens i form af store statistiske repræsentationer af sproget (også kaldet sprogmodeller eller LLM-er).
Kommentarer
Kommentarer til artiklen bliver synlige for alle. Undlad at skrive følsomme oplysninger, for eksempel sundhedsoplysninger. Fagansvarlig eller redaktør svarer, når de kan.
Du skal være logget ind for at kommentere.