Looking for stanford-nlp Answers? Try Ask4KnowledgeBase
Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpstanford-nlp入門


備註

本節概述了stanford-nlp是什麼,以及開發人員可能想要使用它的原因。

它還應該提到stanford-nlp中的任何大型主題,並鏈接到相關主題。由於stanford-nlp的文檔是新的,您可能需要創建這些相關主題的初始版本。

GitHub的基本設置

這個例子討論瞭如何從GitHub倉庫設置CoreNLP。 GitHub代碼具有比官方版本更新的功能,但可能不穩定。此示例將指導您下載,構建和運行CoreNLP的簡單命令行調用。

先決條件:

  • Java 8或更新版本。
  • Apache Ant
  • 混帳
  • 例如:Bash或類似的shell,以及wget或curl

腳步:

  1. 克隆CoreNLP Git存儲庫:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. 輸入CoreNLP目錄:

    cd CoreNLP
     
  3. 將項目構建為自包含的jar文件。最簡單的方法是:

    ant jar
     
  4. 下載最新型號。

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    或者使用curl(macOS上默認獲得的):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. 設置類路徑。如果您使用的是IDE,則應在IDE中設置類路徑。

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    如果你經常使用CoreNLP,這是一個有用的行,你的~/.bashrc (或等效的)文件,將目錄/path/to/corenlp/ 替換為你解壓縮CoreNLP的適當路徑(3個替換):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. 試試看!例如,以下內容將生成一個簡單的文本文件進行註釋,並在此文件上運行CoreNLP。輸出將作為JSON文件保存到input.txt.out 。請注意,CoreNLP需要相當多的內存。在大多數情況下,你應該給它至少2GB( -mx2g )。

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

官方發布的基本設置

這個例子討論瞭如何從最新的官方版本中設置CoreNLP。此示例將指導您下載程序包,並運行CoreNLP的簡單命令行調用。

先決條件:

  • Java JVM 8.命令java -version 應該成功完成,例如: java version“1.8.0_92”
  • Zip工具
  • 例如:Bash或類似的shell,以及wget

腳步:

  1. 下載CoreNLP zip文件: http ://stanfordnlp.github.io/CoreNLP/index.html#download:

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. 解壓縮版本:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. 輸入新解壓縮的目錄:

    cd stanford-corenlp-full-2015-12-09
     
  4. 設置類路徑。如果您使用的是IDE,則應在IDE中設置類路徑。

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    如果你經常使用CoreNLP,這是一個有用的行,你的~/.bashrc (或等效的)文件,將目錄/path/to/corenlp/ 替換為你解壓縮CoreNLP的適當路徑:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. 試試看!例如,以下內容將生成一個簡單的文本文件進行註釋,並在此文件上運行CoreNLP。輸出將作為JSON文件保存到input.txt.out 。請注意,CoreNLP需要相當多的內存。在大多數情況下,你應該給它至少2GB( -mx2g )。

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt