Cette section fournit une vue d'ensemble de ce qu'est stanford-nlp et pourquoi un développeur peut vouloir l'utiliser.
Il devrait également mentionner tous les grands sujets de stanford-nlp, et établir un lien avec les sujets connexes. La documentation de stanford-nlp étant nouvelle, vous devrez peut-être créer des versions initiales de ces rubriques connexes.
Cet exemple explique comment configurer CoreNLP à partir du dépôt GitHub . Le code GitHub a des fonctionnalités plus récentes que la version officielle, mais peut être instable. Cet exemple vous guidera dans le téléchargement, la création et l'exécution d'un simple appel de ligne de commande de CoreNLP.
Conditions préalables:
Pas:
Cloner le dépôt CoreNLP Git:
git clone git@github.com:stanfordnlp/CoreNLP.git
Entrez dans le répertoire CoreNLP:
cd CoreNLP
Générez le projet dans un fichier JAR autonome. La manière la plus simple de le faire est de:
ant jar
Téléchargez les derniers modèles.
wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
Ou en utilisant curl (ce que vous obtenez par défaut sur macOS):
curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
Configurez votre chemin de classe. Si vous utilisez un IDE, vous devez définir le classpath dans votre IDE.
export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Si vous utilisez fréquemment CoreNLP, cette ligne est utile dans votre fichier ~/.bashrc
(ou équivalent), en remplaçant le répertoire /path/to/corenlp/
par le chemin approprié vers l'endroit où vous avez décompressé CoreNLP (3 remplacements). ):
export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
Essaye le! Par exemple, les éléments suivants constituent un fichier texte simple à annoter et exécutent CoreNLP sur ce fichier. La sortie sera enregistrée dans input.txt.out
tant que fichier JSON. Notez que CoreNLP nécessite un peu de mémoire. Vous devriez lui donner au moins 2 Go ( -mx2g
) dans la plupart des cas.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
Cet exemple explique comment configurer CoreNLP à partir de la dernière version officielle. Cet exemple vous aidera à télécharger le package et à exécuter un appel simple de CoreNLP par ligne de commande.
Conditions préalables:
java -version
doit se terminer avec une ligne comme: java version "1.8.0_92" . Pas:
Téléchargez le fichier zip CoreNLP à l' adresse : http://stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
Décompressez la version:
unzip stanford-corenlp-full-2015-12-09.zip
Entrez le nouveau répertoire décompressé:
cd stanford-corenlp-full-2015-12-09
Configurez votre chemin de classe. Si vous utilisez un IDE, vous devez définir le classpath dans votre IDE.
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Si vous utilisez fréquemment CoreNLP, cette ligne est utile dans votre fichier ~/.bashrc
(ou équivalent), remplaçant le répertoire /path/to/corenlp/
par le chemin approprié vers l'endroit où vous avez décompressé CoreNLP:
for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
Essaye le! Par exemple, les éléments suivants constituent un fichier texte simple à annoter et exécutent CoreNLP sur ce fichier. La sortie sera enregistrée dans input.txt.out
tant que fichier JSON. Notez que CoreNLP nécessite un peu de mémoire. Vous devriez lui donner au moins 2 Go ( -mx2g
) dans la plupart des cas.
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt