Looking for stanford-nlp Answers? Try Ask4KnowledgeBase
Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpRozpoczęcie pracy ze stanford-nlp


Uwagi

W tej sekcji omówiono, czym jest stanford-nlp i dlaczego deweloper może chcieć go użyć.

Powinien również wymieniać wszelkie duże tematy w ramach Stanford-nlp i zawierać linki do powiązanych tematów. Ponieważ dokumentacja dla stanford-nlp jest nowa, może być konieczne utworzenie początkowych wersji tych pokrewnych tematów.

Podstawowa konfiguracja z GitHub

W tym przykładzie omówiono konfigurację CoreNLP z repozytorium GitHub . Kod GitHub ma nowsze funkcje niż oficjalna wersja, ale może być niestabilny. Ten przykład poprowadzi cię przez pobieranie, budowanie i uruchamianie prostego wywołania CoreNLP z wiersza poleceń.

Wymagania wstępne:

  • Java 8 lub nowsza.
  • Apache Ant
  • Git
  • Na przykład: Bash lub podobna powłoka i wget lub curl

Kroki:

  1. Sklonuj repozytorium Git CoreNLP:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. Wejdź do katalogu CoreNLP:

    cd CoreNLP
     
  3. Zbuduj projekt w samodzielnym pliku jar. Najłatwiej to zrobić za pomocą:

    ant jar
     
  4. Pobierz najnowsze modele.

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    Lub używając curl (domyślnie dostajesz na macOS):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. Ustaw swoją ścieżkę klasy. Jeśli używasz IDE, powinieneś ustawić ścieżkę klasy w swoim IDE.

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Jeśli będziesz często używać CoreNLP, jest to przydatna linia w twoim pliku ~/.bashrc (lub równoważnym), zastępując katalog /path/to/corenlp/ odpowiednią ścieżką do miejsca, w którym rozpakowałeś CoreNLP (3 zamienniki) ):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. Wypróbuj to! Na przykład poniższe polecenie utworzy prosty plik tekstowy z adnotacjami i uruchomi CoreNLP na tym pliku. Dane wyjściowe zostaną zapisane w input.txt.out jako plik JSON. Zauważ, że CoreNLP wymaga sporo pamięci. Powinieneś dać mu co najmniej 2 GB ( -mx2g ) w większości przypadków.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

Podstawowa konfiguracja z oficjalnej wersji

W tym przykładzie omówiono konfigurację CoreNLP z najnowszej oficjalnej wersji. Ten przykład poprowadzi cię przez pobranie pakietu i uruchomienie prostej linii poleceń CoreNLP.

Wymagania wstępne:

  • Java JVM 8. Polecenie java -version powinno zakończyć się pomyślnie wierszem: java wersja „1.8.0_92” .
  • Narzędzie Zip
  • Na przykład: Bash lub podobna powłoka i wget

Kroki:

  1. Pobierz plik zip CoreNLP ze strony: http://stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. Rozpakuj wydanie:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. Wejdź do nowo rozpakowanego katalogu:

    cd stanford-corenlp-full-2015-12-09
     
  4. Ustaw swoją ścieżkę klasy. Jeśli używasz IDE, powinieneś ustawić ścieżkę klasy w swoim IDE.

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Jeśli będziesz często używać CoreNLP, jest to przydatny wiersz w pliku ~/.bashrc (lub równoważnym), zastępując katalog /path/to/corenlp/ odpowiednią ścieżką do miejsca, w którym rozpakowałeś CoreNLP:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. Wypróbuj to! Na przykład poniższe polecenie utworzy prosty plik tekstowy z adnotacjami i uruchomi CoreNLP na tym pliku. Dane wyjściowe zostaną zapisane w input.txt.out jako plik JSON. Zauważ, że CoreNLP wymaga sporo pamięci. Powinieneś dać mu co najmniej 2 GB ( -mx2g ) w większości przypadków.

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt