Looking for apache-spark Keywords? Try Ask4Keywords

apache-sparkSpark-Datenrahmen


Einführung

Ein DataFrame ist eine Abstraktion von Daten, die in Zeilen und typisierten Spalten organisiert sind. Sie ähnelt den Daten in relationalen SQL-basierten Datenbanken. Obwohl es in Spark 2.0 in nur einen Typalias für Dataset [Row] umgewandelt wurde, ist es immer noch weit verbreitet und nützlich für komplexe Verarbeitungspipelines, die seine Schemaflexibilität und SQL-basierte Operationen verwenden.

Spark-Datenrahmen Verwandte Beispiele