ProTerm Terminologiewerkzeug
  Struktur   Text   News   Events   Links   Downloads      Login  
  Factlist & Suchen  

  Home > Text > ProTerm FH Wien - FAQ
English | Deutsch   Recent Changes (RSS 2.0) - proterm

ProTerm FH Wien - FAQ
 
Hier möchte ich kurz auf aufgetauchte Fragen eingehen.

Frage: Wieso wird keine Wortstammreduzierung vorgenommen?
Antwort: Aus mehrerern Gründen:
  1. Steht im ProTerm Projekt die Performance im Vordergrund. Die Wortstammreduzierung ist sehr rechenintensiv. Wir haben uns bewusst dagegen entschieden. Wir bewegen uns in einem Bereich, in dem wir mehrere tausend bis millionen Dokumente analysieren. Da summieren sich die "verlorenen" Sekunden rasch auf. Vor allem verliert man diese Sekunden bei jedem Einlesevorgang. In unserem Fall muss man ein auftretendes Wort lediglich einmal als "Soppwort" definieren. Wird die Wortstammreduzierung dennoch vom Kunden verlangt, können wir sie gerne einbauen, die Technologie an sich dürfen wir verwenden.
  2. Sind unsere Ressourcen beschränkt. Es sind zur Zeit 3 Personen an der Entwicklung beteiligt, von denen lediglich 2 Codieren. Wir haben den Fokus auf die im Bundesheer verlangte Technologie gelegt und haben zufriedenstellende Ergebnisse im Bereich der Genauigkeit und hervorragende im Bereich der Geschwindigkeit erreicht. Man bedenke, dass bei unseren Referenzdokumenten die Analysezeit von ca 20 Minuten (vor 3 Jahren) auf rund 1 Minute (heute) reduziert wurde.
Frage: Was heißt "Wortstammreduzierung" eigentlich?
Antwort: Das heißt, dass Begriffe erkannt werden und auf ihren Wortstamm reduziert werden.
Beispiel: "ging" wird durch "gehen" ersetzt. "Männer" wird durch "Mann" ersetzt.


Metainfo:
AutorIn: Markus Gruber; Publiziert von: Markus Gruber (MarkusGruber)
factID: 275673.3 (...Archiv); Publiziert am 18 Dez. 2006 10:08