Skip to content

Wordcloud zeigt seltsame Wörter/Lemmas

grafik

  • Es sieht so aus, als würden die Wörter für die Wordcloud lemmatisiert (Englisch vs. Deutsch?) dargestellt werden. (z.B. "geschrieb")
  • Falls Lemmata für die weitere Suche genutzt werden und die Herkunft/Basis (also bspw. "geschrieben" für "geschrieb" - auch wenn das Beispiel nicht unbedingt ein sinnvolles Suchwort ist?) rekonstruierbar ist, wäre mein spontaner Vorschlag: ursprüngliches Wort anzeigen und Lemma als Suchwort nutzen?
  • Bspw. "ii" und "en" sollten mMn in der Wordcloud nicht gezeigt/angeboten werden. Lassen sich dafür Stop-Words vorgeben?