Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpErste Schritte mit stanford-nlp


Bemerkungen

In diesem Abschnitt erhalten Sie einen Überblick darüber, was stanford-nlp ist und warum ein Entwickler es verwenden möchte.

Es sollte auch alle großen Themen in stanford-nlp erwähnen und auf die verwandten Themen verweisen. Da die Dokumentation für stanford-nlp neu ist, müssen Sie möglicherweise erste Versionen dieser verwandten Themen erstellen.

Grundeinrichtung von GitHub

In diesem Beispiel wird beschrieben, wie Sie CoreNLP über das GitHub-Repo einrichten. Der GitHub-Code verfügt über neuere Funktionen als die offizielle Version, kann jedoch instabil sein. Dieses Beispiel führt Sie durch das Herunterladen, Erstellen und Ausführen eines einfachen Befehlszeilenaufrufs von CoreNLP.

Voraussetzungen:

  • Java 8 oder neuer.
  • Apache Ant
  • Git
  • Für das Beispiel: Bash oder ähnliche Shell und Wget oder Curl

Schritte:

  1. Klonen Sie das CoreNLP-Git-Repository:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. Geben Sie das CoreNLP-Verzeichnis ein:

    cd CoreNLP
     
  3. Erstellen Sie das Projekt in eine eigenständige Jar-Datei. Am einfachsten geht dies mit:

    ant jar
     
  4. Laden Sie die neuesten Modelle herunter.

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    Oder verwenden Sie curl (was Sie unter macOS standardmäßig erhalten):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. Richten Sie Ihren Klassenpfad ein. Wenn Sie eine IDE verwenden, sollten Sie den Klassenpfad in Ihrer IDE festlegen.

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Wenn Sie häufig CoreNLP verwenden, ist dies eine nützliche Zeile in Ihrer Datei ~/.bashrc (oder einer gleichwertigen Datei), die das Verzeichnis /path/to/corenlp/ durch den entsprechenden Pfad zum entpackten CoreNLP (3 Ersetzungen) ersetzt ):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. Versuch es! Im Folgenden wird beispielsweise eine einfache Textdatei zum Kommentieren erstellt und CoreNLP für diese Datei ausgeführt. Die Ausgabe wird als JSON-Datei in input.txt.out gespeichert. Beachten Sie, dass CoreNLP ziemlich viel Speicher benötigt. In den meisten Fällen sollten Sie mindestens 2 GB ( -mx2g ) geben.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

Grundeinstellung von der offiziellen Version

In diesem Beispiel wird beschrieben, wie Sie CoreNLP von der neuesten offiziellen Version aus einrichten. In diesem Beispiel werden Sie durch das Herunterladen des Pakets und das Ausführen eines einfachen Befehlszeilenaufrufs von CoreNLP geführt.

Voraussetzungen:

  • Java JVM 8. Der Befehl java -version sollte erfolgreich mit einer Zeile wie: Java-Version "1.8.0_92" abgeschlossen werden .
  • Zip-Tool
  • Für das Beispiel: Bash oder ähnliche Shell und Wget

Schritte:

  1. Laden Sie die CoreNLP-Zip-Datei herunter: http://stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. Entpacke die Veröffentlichung:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. Geben Sie das neu entpackte Verzeichnis ein:

    cd stanford-corenlp-full-2015-12-09
     
  4. Richten Sie Ihren Klassenpfad ein. Wenn Sie eine IDE verwenden, sollten Sie den Klassenpfad in Ihrer IDE festlegen.

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Wenn Sie häufig CoreNLP verwenden, ist dies eine nützliche Zeile in Ihrer Datei ~/.bashrc (oder einer gleichwertigen Datei), in der das Verzeichnis /path/to/corenlp/ durch den entsprechenden Pfad zu dem Ordner ersetzt wird, in den Sie CoreNLP entpackt haben:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. Versuch es! Im Folgenden wird beispielsweise eine einfache Textdatei zum Kommentieren erstellt und CoreNLP für diese Datei ausgeführt. Die Ausgabe wird als JSON-Datei in input.txt.out gespeichert. Beachten Sie, dass CoreNLP ziemlich viel Speicher benötigt. In den meisten Fällen sollten Sie mindestens 2 GB ( -mx2g ) geben.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt