Tag: big-data

Gefilterte Auswahl von Tools mit dem Tag big-data.

Apache Flink

Bei Apache Flink lohnt ein nüchterner Blick auf den Alltag hinter dem Versprechen. Im Zentrum steht Stream-Processing und zustandsbehaftete Echtzeitdatenverarbeitung; stark wird das Tool erst, wenn es hilft, Ereignisse kontinuierlich auszuwerten, statt nur Batch-Jobs nachzulagern.

AI Open Source

Apache Spark

Apache Spark ist besonders interessant, wenn verteilte Verarbeitung großer Datenmengen und ML-Workloads nicht nur einmalig ausprobiert, sondern wiederholt im Team genutzt werden soll. Dann geht es nicht um ein einzelnes Aha-Erlebnis, sondern darum, Batch-, Streaming- und Analyseaufgaben skalierbar auszuführen.

AI Open Source

Hadoop MapReduce

Hadoop MapReduce ist ein Daten- und Automatisierungswerkzeug für klassisches verteiltes Batch-Processing für große Datenmengen im Hadoop-Ökosystem.

AI Open Source

Presto

Presto ist eine leistungsstarke, verteilte SQL-Abfrage-Engine, die speziell für schnelle Abfragen großer Datenmengen in verteilten Systemen entwickelt wurde. Ursprünglich von Facebook entwickelt, ermöglicht Presto die Analyse von Big Data über verschiedene Datenquellen hinweg, ohne dass die Daten zuerst verschoben oder in ein zentrales Repository geladen werden müssen. Dies macht Presto zu einem unverzichtbaren Werkzeug für Unternehmen, die flexible und schnelle Datenanalysen in Echtzeit benötigen.

AI Open Source