Looking for stanford-nlp Answers? Try Ask4KnowledgeBase
Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpIniziare con stanford-nlp


Osservazioni

Questa sezione fornisce una panoramica di ciò che stanford-nlp è, e perché uno sviluppatore potrebbe voler usarlo.

Dovrebbe anche menzionare qualsiasi argomento di grandi dimensioni all'interno di stanford-nlp e collegarsi agli argomenti correlati. Poiché la documentazione di stanford-nlp è nuova, potrebbe essere necessario creare versioni iniziali di tali argomenti correlati.

Impostazione di base da GitHub

Questo esempio spiega come impostare CoreNLP dal repository GitHub . Il codice GitHub ha caratteristiche più nuove rispetto alla versione ufficiale, ma potrebbe essere instabile. Questo esempio ti guiderà attraverso il download, la costruzione e l'esecuzione di una semplice chiamata da riga di comando di CoreNLP.

Prerequisiti:

  • Java 8 o successivo.
  • Apache Ant
  • Idiota
  • Per l'esempio: Bash o shell simile e wget o curl

passi:

  1. Clona il repository Git CoreNLP:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. Inserisci la directory CoreNLP:

    cd CoreNLP
     
  3. Costruisci il progetto in un file jar autonomo. Il modo più semplice per farlo è con:

    ant jar
     
  4. Scarica gli ultimi modelli.

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    O usando curl (cosa ottieni di default su macOS):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. Imposta il tuo classpath. Se stai usando un IDE, dovresti impostare il classpath nel tuo IDE.

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Se si utilizza CoreNLP frequentemente, questa è una riga utile nel file ~/.bashrc (o equivalente), che sostituisce la directory /path/to/corenlp/ con il percorso appropriato dove è stato decompresso CoreNLP (3 sostituzioni ):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. Provalo! Ad esempio, quanto segue farà un semplice file di testo per annotare ed eseguirà CoreNLP su questo file. L'output verrà salvato in input.txt.out come file JSON. Nota che CoreNLP richiede un bel po 'di memoria. Dovresti dargli almeno 2 GB ( -mx2g ) nella maggior parte dei casi.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

Impostazione di base dalla versione ufficiale

Questo esempio spiega come impostare CoreNLP dall'ultima versione ufficiale. Questo esempio ti consentirà di scaricare il pacchetto e di eseguire una semplice chiamata da riga di comando di CoreNLP.

Prerequisiti:

  • Java JVM 8. Il comando java -version dovrebbe essere completato correttamente con una riga come: java version "1.8.0_92" .
  • Strumento Zip
  • Per l'esempio: Bash o shell simile e wget

passi:

  1. Scarica il file zip CoreNLP all'indirizzo: http://stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. Decomprimere la versione:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. Inserisci la directory appena decompressa:

    cd stanford-corenlp-full-2015-12-09
     
  4. Imposta il tuo classpath. Se stai usando un IDE, dovresti impostare il classpath nel tuo IDE.

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Se si utilizza CoreNLP frequentemente, questa è una riga utile nel file ~/.bashrc (o equivalente), che sostituisce la directory /path/to/corenlp/ con il percorso appropriato in cui è stato decompresso CoreNLP:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. Provalo! Ad esempio, quanto segue farà un semplice file di testo per annotare ed eseguirà CoreNLP su questo file. L'output verrà salvato in input.txt.out come file JSON. Nota che CoreNLP richiede un bel po 'di memoria. Dovresti dargli almeno 2 GB ( -mx2g ) nella maggior parte dei casi.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt