Hei,
eg har merka at dei fleste kudos-dokument ikkje har ein «ISO 639-2»-kode, som docstring-en til text.Corpus() inneber dei skal ha. Her kjem eit døme med dokumenta frå 2013.
>>> kudos_corpus = dh.Corpus(doctype="kudos", from_year=2013, to_year=2014, limit=10000)
>>> kudos_df = kudos_corpus.frame.copy()
>>> kudos_df["langs"].value_counts()
langs
no 750
nb 165
en 143
nn 72
nob 63
de 16
en-GB 14
13
sv 1
Name: count, dtype: int64
Takk.