Esta sección proporciona una descripción general de qué es stanford-nlp y por qué un desarrollador puede querer usarlo.
También debe mencionar cualquier tema importante dentro de stanford-nlp, y vincular a los temas relacionados. Dado que la Documentación para stanford-nlp es nueva, es posible que deba crear versiones iniciales de esos temas relacionados.
Este ejemplo explica cómo configurar CoreNLP desde el repositorio de GitHub . El código de GitHub tiene características más nuevas que la versión oficial, pero puede ser inestable. Este ejemplo lo llevará a través de la descarga, creación y ejecución de una simple invocación de línea de comandos de CoreNLP.
Requisitos previos:
Pasos:
Clona el repositorio de CoreNLP Git:
git clone git@github.com:stanfordnlp/CoreNLP.git
Ingrese al directorio CoreNLP:
cd CoreNLP
Construye el proyecto en un archivo jar autónomo. La forma más fácil de hacer esto es con:
ant jar
Descarga los últimos modelos.
wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
O usando curl (lo que obtienes por defecto en macOS):
curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
Configure su ruta de clase. Si está utilizando un IDE, debe establecer la ruta de clase en su IDE.
export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Si va a usar CoreNLP con frecuencia, esta es una línea útil para tener en su archivo ~/.bashrc
(o equivalente), reemplazando el directorio /path/to/corenlp/
con la ruta apropiada a donde descomprimió CoreNLP (3 reemplazos ):
export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
¡Pruébalo! Por ejemplo, lo siguiente hará un archivo de texto simple para anotar y ejecutar CoreNLP sobre este archivo. La salida se guardará en input.txt.out
como un archivo JSON. Tenga en cuenta que CoreNLP requiere bastante memoria. Debe darle al menos 2GB ( -mx2g
) en la mayoría de los casos.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
Este ejemplo explica cómo configurar CoreNLP desde la última versión oficial. Este ejemplo lo llevará a través de la descarga del paquete y la ejecución de una simple invocación de CoreNLP por línea de comandos.
Requisitos previos:
java -version
debe completarse correctamente con una línea como: versión de java "1.8.0_92" . Pasos:
Descargue el archivo zip CoreNLP en: http://stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
Descomprimir el lanzamiento:
unzip stanford-corenlp-full-2015-12-09.zip
Ingrese al directorio recién descomprimido:
cd stanford-corenlp-full-2015-12-09
Configure su ruta de clase. Si está utilizando un IDE, debe establecer la ruta de clase en su IDE.
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Si va a usar CoreNLP con frecuencia, esta es una línea útil para tener en su archivo ~/.bashrc
(o equivalente), reemplazando el directorio /path/to/corenlp/
con la ruta apropiada a donde descomprimió CoreNLP:
for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
¡Pruébalo! Por ejemplo, lo siguiente hará un archivo de texto simple para anotar y ejecutar CoreNLP sobre este archivo. La salida se guardará en input.txt.out
como un archivo JSON. Tenga en cuenta que CoreNLP requiere bastante memoria. Debe darle al menos 2GB ( -mx2g
) en la mayoría de los casos.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt