Looking for stanford-nlp Answers? Try Ask4KnowledgeBase
Looking for stanford-nlp Keywords? Try Ask4Keywords

stanford-nlpस्टैनफोर्ड- nlp के साथ शुरुआत करना


टिप्पणियों

यह खंड स्टैनफोर्ड-एलएमपी क्या है का एक सिंहावलोकन प्रदान करता है, और क्यों एक डेवलपर इसका उपयोग करना चाह सकता है।

इसमें स्टैनफोर्ड-एलएमपी के भीतर किसी भी बड़े विषयों का उल्लेख करना चाहिए, और संबंधित विषयों के लिए लिंक करना चाहिए। चूंकि स्टैनफोर्ड-एलएमपी के लिए प्रलेखन नया है, इसलिए आपको उन संबंधित विषयों के प्रारंभिक संस्करण बनाने की आवश्यकता हो सकती है।

GitHub से मूल सेटअप

यह उदाहरण GitHub रेपो से CoreNLP सेट करने का तरीका बताता है। GitHub कोड में आधिकारिक रिलीज़ की तुलना में नई सुविधाएँ हैं, लेकिन यह अस्थिर हो सकता है। यह उदाहरण आपको CoreNLP के एक साधारण कमांड-लाइन इनवॉइस को डाउनलोड करने, निर्माण करने और चलाने के माध्यम से ले जाएगा।

आवश्यक शर्तें:

  • जावा 8 या नया।
  • अपाचे चींटी
  • Git
  • उदाहरण के लिए: बैश या समान खोल, और विग या कर्ल

कदम:

  1. क्लोन करें CoreNLP Git रिपॉजिटरी:

    git clone git@github.com:stanfordnlp/CoreNLP.git
     
  2. CoreNLP निर्देशिका दर्ज करें:

    cd CoreNLP
     
  3. प्रोजेक्ट को स्व-निहित जार फ़ाइल में बनाएँ। ऐसा करने का सबसे आसान तरीका है:

    ant jar
     
  4. नवीनतम मॉडल डाउनलोड करें।

    wget http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     

    या कर्ल का उपयोग करना (जो आपको macOS पर डिफ़ॉल्ट रूप से मिलता है):

    curl -O http://nlp.stanford.edu/software/stanford-corenlp-models-current.jar
     
  5. अपना वर्गपथ सेट करें। यदि आप एक IDE का उपयोग कर रहे हैं, तो आपको अपने IDE में classpath सेट करना चाहिए।

    export CLASSPATH="$CLASSPATH:javanlp-core.jar:stanford-corenlp-models-current.jar";
    for file in `find lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    यदि आप बार-बार CoreNLP का उपयोग कर रहे हैं, तो यह आपकी ~/.bashrc (या समतुल्य) फ़ाइल में निर्देशिका, /path/to/corenlp/ जहाँ आप unzipped CoreNLP (3 प्रतिस्थापन) के लिए उपयुक्त पथ की जगह है के लिए एक उपयोगी पंक्ति है। ):

    export CLASSPATH="$CLASSPATH:/path/to/corenlp/javanlp-core.jar:/path/to/corenlp/stanford-corenlp-models-current.jar";
    for file in `find /path/to/corenlp/lib -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; don
     
  6. कोशिश करके देखो! उदाहरण के लिए, निम्नलिखित एनोटेट करने के लिए एक सरल पाठ फ़ाइल बनाएगा, और इस फ़ाइल पर CoreNLP चलाएगा। आउटपुट को JSON फ़ाइल के रूप में input.txt.out सहेजा जाएगा। ध्यान दें कि CoreNLP को काफी मेमोरी की आवश्यकता होती है। आपको इसे ज्यादातर मामलों में कम से कम 2GB ( -mx2g ) देना चाहिए।

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt
     

आधिकारिक रिलीज़ से मूल सेटअप

यह उदाहरण नवीनतम आधिकारिक रिलीज़ से कोरएनएलपी को स्थापित करने का तरीका बताता है। यह उदाहरण आपको पैकेज डाउनलोड करने, और CoreNLP का एक सरल कमांड-लाइन इनवॉइस चलाने के माध्यम से ले जाएगा।

आवश्यक शर्तें:

  • Java JVM 8. कमांड java -version को एक लाइन की तरह सफलतापूर्वक पूरा करना चाहिए: java version "1.8.0_92"
  • जिप टूल
  • उदाहरण के लिए: बैश या समान शेल, और विग

कदम:

  1. CoreNLP ज़िप फ़ाइल को यहां डाउनलोड करें: http://stanfordnlp.github.io/CoreNLP/index.html#download :

    wget http://nlp.stanford.edu/software/stanford-corenlp-full-2015-12-09.zip
     
  2. रिलीज़ को अनज़िप करें:

    unzip stanford-corenlp-full-2015-12-09.zip
     
  3. नई अनप्लड निर्देशिका दर्ज करें:

    cd stanford-corenlp-full-2015-12-09
     
  4. अपना वर्गपथ सेट करें। यदि आप एक IDE का उपयोग कर रहे हैं, तो आपको अपने IDE में classpath सेट करना चाहिए।

    for file in `find . -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     

    यदि आप बार-बार CoreNLP का उपयोग कर रहे हैं, तो यह आपकी ~/.bashrc (या समतुल्य) फ़ाइल में निर्देशिका, /path/to/corenlp/ जहाँ आप unzipped CoreNLP है, के लिए उपयुक्त पथ के साथ प्रतिस्थापित करने के लिए एक उपयोगी पंक्ति है।

    for file in `find /path/to/corenlp/ -name "*.jar"`; do export CLASSPATH="$CLASSPATH:`realpath $file`"; done
     
  5. कोशिश करके देखो! उदाहरण के लिए, निम्नलिखित एनोटेट करने के लिए एक सरल पाठ फ़ाइल बनाएगा, और इस फ़ाइल पर CoreNLP चलाएगा। आउटपुट को JSON फ़ाइल के रूप में input.txt.out सहेजा जाएगा। ध्यान दें कि CoreNLP को काफी मेमोरी की आवश्यकता होती है। आपको इसे ज्यादातर मामलों में कम से कम 2GB ( -mx2g ) देना चाहिए।

    echo "the quick brown fox jumped over the lazy dog" > input.txt
    java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -outputFormat json -file input.txt