यह खंड स्टैनफोर्ड-एलएमपी क्या है का एक सिंहावलोकन प्रदान करता है, और क्यों एक डेवलपर इसका उपयोग करना चाह सकता है।
इसमें स्टैनफोर्ड-एलएमपी के भीतर किसी भी बड़े विषयों का उल्लेख करना चाहिए, और संबंधित विषयों के लिए लिंक करना चाहिए। चूंकि स्टैनफोर्ड-एलएमपी के लिए प्रलेखन नया है, इसलिए आपको उन संबंधित विषयों के प्रारंभिक संस्करण बनाने की आवश्यकता हो सकती है।
यह उदाहरण GitHub रेपो से CoreNLP सेट करने का तरीका बताता है। GitHub कोड में आधिकारिक रिलीज़ की तुलना में नई सुविधाएँ हैं, लेकिन यह अस्थिर हो सकता है। यह उदाहरण आपको CoreNLP के एक साधारण कमांड-लाइन इनवॉइस को डाउनलोड करने, निर्माण करने और चलाने के माध्यम से ले जाएगा।
आवश्यक शर्तें:
कदम:
क्लोन करें CoreNLP Git रिपॉजिटरी:
git clone git@github.com:stanfordnlp/CoreNLP.git
CoreNLP निर्देशिका दर्ज करें:
cd CoreNLP
प्रोजेक्ट को स्व-निहित जार फ़ाइल में बनाएँ। ऐसा करने का सबसे आसान तरीका है:
ant jar
नवीनतम मॉडल डाउनलोड करें।
wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
या कर्ल का उपयोग करना (जो आपको macOS पर डिफ़ॉल्ट रूप से मिलता है):
curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
अपना वर्गपथ सेट करें। यदि आप एक IDE का उपयोग कर रहे हैं, तो आपको अपने IDE में classpath सेट करना चाहिए।
export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
यदि आप बार-बार CoreNLP का उपयोग कर रहे हैं, तो यह आपकी ~/.bashrc
(या समतुल्य) फ़ाइल में निर्देशिका, /path/to/corenlp/
जहाँ आप unzipped CoreNLP (3 प्रतिस्थापन) के लिए उपयुक्त पथ की जगह है के लिए एक उपयोगी पंक्ति है। ):
export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
कोशिश करके देखो! उदाहरण के लिए, निम्नलिखित एनोटेट करने के लिए एक सरल पाठ फ़ाइल बनाएगा, और इस फ़ाइल पर CoreNLP चलाएगा। आउटपुट को JSON फ़ाइल के रूप में input.txt.out
सहेजा जाएगा। ध्यान दें कि CoreNLP को काफी मेमोरी की आवश्यकता होती है। आपको इसे ज्यादातर मामलों में कम से कम 2GB ( -mx2g
) देना चाहिए।
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
यह उदाहरण नवीनतम आधिकारिक रिलीज़ से कोरएनएलपी को स्थापित करने का तरीका बताता है। यह उदाहरण आपको पैकेज डाउनलोड करने, और CoreNLP का एक सरल कमांड-लाइन इनवॉइस चलाने के माध्यम से ले जाएगा।
आवश्यक शर्तें:
java -version
को एक लाइन की तरह सफलतापूर्वक पूरा करना चाहिए: java version "1.8.0_92" । कदम:
CoreNLP ज़िप फ़ाइल को यहां डाउनलोड करें: http://stanfordnlp.github.io/CoreNLP/index.html#download :
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
रिलीज़ को अनज़िप करें:
unzip stanford-corenlp-full-2015-12-09.zip
नई अनप्लड निर्देशिका दर्ज करें:
cd stanford-corenlp-full-2015-12-09
अपना वर्गपथ सेट करें। यदि आप एक IDE का उपयोग कर रहे हैं, तो आपको अपने IDE में classpath सेट करना चाहिए।
for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
यदि आप बार-बार CoreNLP का उपयोग कर रहे हैं, तो यह आपकी ~/.bashrc
(या समतुल्य) फ़ाइल में निर्देशिका, /path/to/corenlp/
जहाँ आप unzipped CoreNLP है, के लिए उपयुक्त पथ के साथ प्रतिस्थापित करने के लिए एक उपयोगी पंक्ति है।
for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
कोशिश करके देखो! उदाहरण के लिए, निम्नलिखित एनोटेट करने के लिए एक सरल पाठ फ़ाइल बनाएगा, और इस फ़ाइल पर CoreNLP चलाएगा। आउटपुट को JSON फ़ाइल के रूप में input.txt.out
सहेजा जाएगा। ध्यान दें कि CoreNLP को काफी मेमोरी की आवश्यकता होती है। आपको इसे ज्यादातर मामलों में कम से कम 2GB ( -mx2g
) देना चाहिए।
echo "the quick brown fox jumped over the lazy dog" > input.txt
java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt