本節概述了stanford-nlp是什麼,以及開發人員可能想要使用它的原因。
它還應該提到stanford-nlp中的任何大型主題,並鏈接到相關主題。由於stanford-nlp的文檔是新的,您可能需要創建這些相關主題的初始版本。
這個例子討論瞭如何從GitHub倉庫設置CoreNLP。 GitHub代碼具有比官方版本更新的功能,但可能不穩定。此示例將指導您下載,構建和運行CoreNLP的簡單命令行調用。
先決條件:
腳步:
克隆CoreNLP Git存儲庫:
git clone git@github.com:stanfordnlp/CoreNLP.git
輸入CoreNLP目錄:
cd CoreNLP
將項目構建為自包含的jar文件。最簡單的方法是:
ant jar
下載最新型號。
wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
或者使用curl(macOS上默認獲得的):
curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
設置類路徑。如果您使用的是IDE,則應在IDE中設置類路徑。
export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
如果你經常使用CoreNLP,這是一個有用的行,你的~/.bashrc
(或等效的)文件,將目錄/path/to/corenlp/
替換為你解壓縮CoreNLP的適當路徑(3個替換):
export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
試試看!例如,以下內容將生成一個簡單的文本文件進行註釋,並在此文件上運行CoreNLP。輸出將作為JSON文件保存到input.txt.out
。請注意,CoreNLP需要相當多的內存。在大多數情況下,你應該給它至少2GB( -mx2g
)。
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
這個例子討論瞭如何從最新的官方版本中設置CoreNLP。此示例將指導您下載程序包,並運行CoreNLP的簡單命令行調用。
先決條件:
java -version
應該成功完成,例如: java version“1.8.0_92” 。 腳步:
下載CoreNLP zip文件: http ://stanfordnlp.github.io/CoreNLP/index.html#download:
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
解壓縮版本:
unzip stanford-corenlp-full-2015-12-09.zip
輸入新解壓縮的目錄:
cd stanford-corenlp-full-2015-12-09
設置類路徑。如果您使用的是IDE,則應在IDE中設置類路徑。
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
如果你經常使用CoreNLP,這是一個有用的行,你的~/.bashrc
(或等效的)文件,將目錄/path/to/corenlp/
替換為你解壓縮CoreNLP的適當路徑:
for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
試試看!例如,以下內容將生成一個簡單的文本文件進行註釋,並在此文件上運行CoreNLP。輸出將作為JSON文件保存到input.txt.out
。請注意,CoreNLP需要相當多的內存。在大多數情況下,你應該給它至少2GB( -mx2g
)。
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt