-
Warum Python für Data Analytics?
Python hat sich in den letzten Jahren zur wichtigsten Programmiersprache im Bereich Data Analytics entwickelt. Ob Datenaufbereitung, statistische Analysen, Machine Learning oder Visualisierungen – mit Python lassen sich nahezu alle Aufgaben der…
-
Was ist ein Python Dictionary?
Ein Dictionary (kurz: dict) ist eine der wichtigsten Datenstrukturen in Python. Es speichert Daten in Form von Schlüssel-Wert-Paaren (Key-Value-Pairs). Statt auf Elemente über eine Position wie bei einer Liste zuzugreifen, verwendest du…
-
Was passiert mit dem Z-Ordering, wenn neue Daten hinzugefügt werden?
In Delta Lake bzw. Databricks ist Z-Ordering kein dauerhafter Zustand, sondern eine Optimierung, die nur auf die Dateien angewendet wird, die zum Zeitpunkt der Ausführung vorhanden sind. Wenn nach einem OPTIMIZE ……
-
Große Delta-Tabellen optimieren – So werden Abfragen deutlich schneller
Delta Lake eignet sich hervorragend für große Datenmengen. Mit zunehmender Größe einer Tabelle können Abfragen jedoch langsamer werden. Durch einige bewährte Optimierungsmaßnahmen lässt sich die Performance deutlich verbessern. Partitionierung sinnvoll einsetzen Eine…
-
Serverless Compute in Databricks und Azure Synapse einfach erklärt
Serverless Compute bedeutet, dass Microsoft oder Databricks die komplette Infrastruktur (VMs, Cluster, Skalierung und Wartung) automatisch verwalten. Als Anwender konzentrierst du dich nur auf die Ausführung deiner Abfragen oder Datenpipelines. Du musst…
Social Media
Links
- Benutzerabnahmetest (UAT) Tool für Power BI Berichte
- SQL Syntax Prüfer
- Alle Excel Funktionen in Deutsch und Englisch
- Die wichtigsten SAP Transaktionen
- Excel Tastenkombinationen
- Excel Tipps
- SAP T-Codes
- SQL-Grundlagen für Excel- und SAP-Nutzer
- Wichtige Excel Funktionen einfach erklärt
