W tej sekcji omówiono, czym jest stanford-nlp i dlaczego deweloper może chcieć go użyć.
Powinien również wymieniać wszelkie duże tematy w ramach Stanford-nlp i zawierać linki do powiązanych tematów. Ponieważ dokumentacja dla stanford-nlp jest nowa, może być konieczne utworzenie początkowych wersji tych pokrewnych tematów.
W tym przykładzie omówiono konfigurację CoreNLP z repozytorium GitHub . Kod GitHub ma nowsze funkcje niż oficjalna wersja, ale może być niestabilny. Ten przykład poprowadzi cię przez pobieranie, budowanie i uruchamianie prostego wywołania CoreNLP z wiersza poleceń.
Wymagania wstępne:
Kroki:
Sklonuj repozytorium Git CoreNLP:
git clone git@github.com:stanfordnlp/CoreNLP.git
Wejdź do katalogu CoreNLP:
cd CoreNLP
Zbuduj projekt w samodzielnym pliku jar. Najłatwiej to zrobić za pomocą:
ant jar
Pobierz najnowsze modele.
wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
Lub używając curl (domyślnie dostajesz na macOS):
curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
Ustaw swoją ścieżkę klasy. Jeśli używasz IDE, powinieneś ustawić ścieżkę klasy w swoim IDE.
export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Jeśli będziesz często używać CoreNLP, jest to przydatna linia w twoim pliku ~/.bashrc
(lub równoważnym), zastępując katalog /path/to/corenlp/
odpowiednią ścieżką do miejsca, w którym rozpakowałeś CoreNLP (3 zamienniki) ):
export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
Wypróbuj to! Na przykład poniższe polecenie utworzy prosty plik tekstowy z adnotacjami i uruchomi CoreNLP na tym pliku. Dane wyjściowe zostaną zapisane w input.txt.out
jako plik JSON. Zauważ, że CoreNLP wymaga sporo pamięci. Powinieneś dać mu co najmniej 2 GB ( -mx2g
) w większości przypadków.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
W tym przykładzie omówiono konfigurację CoreNLP z najnowszej oficjalnej wersji. Ten przykład poprowadzi cię przez pobranie pakietu i uruchomienie prostej linii poleceń CoreNLP.
Wymagania wstępne:
java -version
powinno zakończyć się pomyślnie wierszem: java wersja „1.8.0_92” . Kroki:
Pobierz plik zip CoreNLP ze strony: http://stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
Rozpakuj wydanie:
unzip stanford-corenlp-full-2015-12-09.zip
Wejdź do nowo rozpakowanego katalogu:
cd stanford-corenlp-full-2015-12-09
Ustaw swoją ścieżkę klasy. Jeśli używasz IDE, powinieneś ustawić ścieżkę klasy w swoim IDE.
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Jeśli będziesz często używać CoreNLP, jest to przydatny wiersz w pliku ~/.bashrc
(lub równoważnym), zastępując katalog /path/to/corenlp/
odpowiednią ścieżką do miejsca, w którym rozpakowałeś CoreNLP:
for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Wypróbuj to! Na przykład poniższe polecenie utworzy prosty plik tekstowy z adnotacjami i uruchomi CoreNLP na tym pliku. Dane wyjściowe zostaną zapisane w input.txt.out
jako plik JSON. Zauważ, że CoreNLP wymaga sporo pamięci. Powinieneś dać mu co najmniej 2 GB ( -mx2g
) w większości przypadków.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt