Hoppa till huvudinnehåll

Språkresurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.
Resurs Typ Språk Åtkomst
Argumentation sentences 1.0
A translated corpus for classifying sentence stance in relation to a topic.
Korpus svenska
CoDeRooMor, v.01
Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet
Lexikon svenska
DaLAJ-GED-Superlim 2.0
Dataset for Linguistic Acceptability Judgments (and more), v.2.0
Korpus svenska
Dalin: Then Swänska Argus 1732-1734
Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys.
Korpus svenska
Eukalyptus skriven svenska
En trädbank som innnehåller skriven svenska, uppmärkt med ordklasser, syntax i stil med TIGER-trädbanken, flerordsenheter och ordbetydelser
Korpus svenska
SemEval2020 Task 1
Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2)
Korpus svenska
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.
Korpus svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
Korpus svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
Korpus svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
SuperSim (paketterat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
Korpus svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus svenska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
Korpus svenska
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
Korpus svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
Korpus svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
Korpus svenska
Swe-NERC
En resurs för träning och utvärdering av igenkänning av namngiven entitet för svenska.
Korpus svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus svenska
SweDN 1.0
A Swedish text summarization corpus
Korpus svenska
SweFAQ 2.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning
Korpus svenska
SweNLI 1.0
A Swedish NLI dataset
Korpus svenska
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
Lexikon svenska
SweWiC 2.0
En svensk ord-i-sammanhang datamängd
Korpus svenska
SweWinogender 2.0
En svensk datamängd för koreferens och könsbias
Korpus svenska
SweWinograd 2.0
En svensk datamängd för pronomentolkning
Korpus svenska
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.
Korpus svenska
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.
Korpus svenska
TalbankenSTB
Talbanken är en svensk trädbank.
Korpus svenska