Looking for r Keywords? Try Ask4Keywords

R LanguageWeb Scraping und Parsing


Bemerkungen

Scraping bezieht sich auf die Verwendung eines Computers zum Abrufen des Codes einer Webseite. Nachdem der Code erhalten wurde, muss er in eine nützliche Form zur weiteren Verwendung in R geparst werden.

In Base R sind nicht viele der für diese Prozesse erforderlichen Tools vorhanden, sodass das Scraping und die Analyse normalerweise mit Paketen durchgeführt werden. Einige Pakete sind am nützlichsten für das Scraping ( RSelenium , httr , curl , RCurl ), einige für die Analyse ( XML , xml2 ) und einige für beide ( rvest ).

Ein verwandter Prozess ist das Scraping einer Web-API, die im Gegensatz zu einer Webseite Daten zurückgibt, die maschinenlesbar sein sollen. Viele der gleichen Pakete werden für beide verwendet.

Rechtmäßigkeit

Einige Websites lehnen Scrap ab, sei es aufgrund einer erhöhten Serverauslastung oder aufgrund von Bedenken hinsichtlich des Dateneigentums. Wenn eine Website das Scraping in den Nutzungsbedingungen verbietet, ist das Scrapfen illegal.

Web Scraping und Parsing Verwandte Beispiele