Vpeljava tabelaričnih tokov v podatkovno arhitekturo

Avtorji

Tjaša Heričko
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0002-0410-7724
Saša Brdnik
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0003-3730-2769
Muhamed Turkanović
Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko
https://orcid.org/0000-0002-5079-5468

Kratka vsebina

Sodobne podatkovne arhitekture se vse bolj usmerjajo k agilnemu modelu ELT, temelječemu na podatkovnih jezerih in koliščih. Ključna prednost takšnega pristopa je uporaba odprtih tabelaričnih formatov, kot so Apache Iceberg, Hudi in Delta Lake, ki temeljijo na odprtih datotečnih formatih, kot so Avro, ORC in Parquet. V prispevku predstavljamo Tableflow – novo rešitev iz ekosistema Confluent, ki omogoča neposredno predstavitev podatkov v Kafka temah kot odprte tabele v formatu Iceberg ali Delta. S tem se podatki, pridobljeni iz virov OLTP, že v fazi zajema in vnosa pretvorijo v format, primeren za poizvedovanje in učinkovitejše shranjevanje neobdelanih podatkov v podatkovno jezero/kolišče. Kafka v tem kontekstu ne služi le pretočni obdelavi, temveč tudi kot mehanizem za zajem in vnos podatkov, skladen s sodobno velepodatkovno arhitekturo. To bistveno zmanjša izgubo konteksta in sheme, ki se pogosto pojavlja pri klasičnih prenosih med operativnimi in analitičnimi sistemi. V prispevku bomo predstavili uporabnost tabelaričnega toka, prikazali praktično uporabo rešitve Tableflow znotraj platforme Confluent Cloud in integracijo s sodobnimi podatkovnimi arhitekturami ter izvedli primerjalno analizo z obstoječimi pristopi materializacije pretočnih podatkov v tabelarno obliko. 

Biografije avtorja

Tjaša Heričko, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: tjasa.hericko@um.si

Saša Brdnik, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: sasa.brdnik@um.si

Muhamed Turkanović, Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko

Maribor, Slovenija. E-pošta: muhamed.turkanovic@um.si

Prenosi

Izdano

01.09.2025

Kako citirati

Heričko, T., Brdnik, S., & Turkanović, M. (2025). Vpeljava tabelaričnih tokov v podatkovno arhitekturo . In L. Pavlič, T. Beranič, & M. Heričko (Eds.), & (Ed.), OTS 2025 Sodobne informacijske tehnologije in storitve: Zbornik 28. konference, Maribor, 3. in 4. september 2025 (Vols. 28., pp. 13-24). Univerzitetna založba Univerze v Mariboru. https://doi.org/10.18690/um.feri.7.2025.2