Looking for stanford-nlp Answers? Try Ask4KnowledgeBase
Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpНачало работы с stanford-nlp


замечания

В этом разделе представлен обзор того, что такое stanford-nlp, и почему разработчик может захотеть его использовать.

Следует также упомянуть о любых крупных предметах в рамках stanford-nlp и ссылаться на связанные темы. Поскольку документация для stanford-nlp является новой, вам может потребоваться создать начальные версии этих связанных тем.

Базовая установка от GitHub

В этом примере рассматривается, как настроить CoreNLP из репо GitHub . Код GitHub имеет более новые функции, чем официальная версия, но может быть нестабильной. В этом примере вы проведете загрузку, создание и запуск простой командной строки CoreNLP.

Предпосылки:

  • Java 8 или новее.
  • Apache Ant
  • Гит
  • Например: Bash или аналогичная оболочка, wget или curl

шаги:

  1. Клонировать репозиторий CoreNLP Git:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. Войдите в каталог CoreNLP:

    cd CoreNLP
     
  3. Создайте проект в автономный файл jar. Самый простой способ сделать это:

    ant jar
     
  4. Загрузите последние модели.

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    Или используя curl (что вы получаете по умолчанию на macOS):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. Настройте свой путь к классам. Если вы используете IDE, вы должны установить путь к классам в своей среде IDE.

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Если вы будете часто использовать CoreNLP, это полезная строка, которая должна быть в вашем ~/.bashrc (или эквивалентном) файле, заменив каталог /path/to/corenlp/ на соответствующий путь туда, где вы распаковали CoreNLP (3 замены ):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. Попробуйте! Например, следующее будет содержать простой текстовый файл для аннотации и запустить CoreNLP над этим файлом. Выход будет сохранен в input.txt.out как файл JSON. Обратите внимание, что CoreNLP требует довольно много памяти. В большинстве случаев вы должны дать не менее 2 ГБ ( -mx2g ).

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

Основная настройка с официального выпуска

В этом примере рассматривается, как настроить CoreNLP с последней официальной версии. В этом примере вы проведете загрузку пакета и выполните простой вызов командной строки в CoreNLP.

Предпосылки:

  • Java JVM 8. Команда java -version должна завершиться успешно с помощью строки, например: java-версия «1.8.0_92» .
  • Инструмент Zip
  • Например: Bash или аналогичная оболочка и wget

шаги:

  1. Загрузите zip-файл CoreNLP по адресу: http://stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. Разархивируйте выпуск:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. Введите новый распакованный каталог:

    cd stanford-corenlp-full-2015-12-09
     
  4. Настройте свой путь к классам. Если вы используете IDE, вы должны установить путь к классам в своей среде IDE.

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    Если вы будете часто использовать CoreNLP, это полезная строка, которая должна быть в вашем ~/.bashrc (или эквивалентном) файле, заменив каталог /path/to/corenlp/ на соответствующий путь туда, куда вы распаковали CoreNLP:

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. Попробуйте! Например, следующее будет содержать простой текстовый файл для аннотации и запустить CoreNLP над этим файлом. Выход будет сохранен в input.txt.out как файл JSON. Обратите внимание, что CoreNLP требует довольно много памяти. В большинстве случаев вы должны дать не менее 2 ГБ ( -mx2g ).

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt