Ich bin ja bekennender Java Programmierer und zudem Arbeite ich noch im Themenbereich NLP (Natural Language Processing). Dazu ist es natürlich immer hilfreich eine Auflistung bereits existierender Bibliotheken zu haben, die sich mit diesem Thema beschäftigen. Hier mal eine Liste, derer, die ich des öfteren benutze, bzw. im Netz gestolpert bin:
- Stanford NLP Group:
- Stanford Parser
- Stanford POS (Part-Of-Speech) Tagger
- Stanford NER (Named Entitiy Recognizer)
- Stanford Classifier
- JWKTL - Java Wikitionary API
- JAWS - Java WordNet API
- Google Translation API
- OpenNLP @ Sourceforge
- Christian Spurks NLP Library
Die jeweils fett-geschriebenen Bibliotheken, habe ich selbst benutzt, bzw werden noch von mir benutzt und kann zu deren Einbindung und Verwendung Tips geben.
[Update (29.01.09 10:42]
Ich habe eben auf der java-nlp-user Mailingliste einen interessanten Link zu dem Thema bekommen. Dies ist ein Blog von Matthew Wilkens, welcher eine Aufstellung einiger POS Tagger gepostet hat und diese hinsichtlich Accuracy und Geschwindigkeit evaluiert hat.
Keine Kommentare:
Kommentar veröffentlichen