
опенсорс дата екстрактор
Привіт усім.
Пилю свій інструмент для вивантаження даних — Rivet.
Працює з PostgreSQL/MySQL, записує в Parquet/CSV, локально або одразу в GCS/S3.
Основний фокус — безпечне вивантаження з робочих баз без довгих важких запитів, особливо коли немає read replica і інфраструктура невелика.
Що вже є:
- автоматичне розбиття на частини;
- повтор заіейлених чанків;
- продовження після збою;
- планування та виконання експорту;
- метрики виконання й навантаження на базу.
Буду дуже вдячний за фідбек і критику
https://github.com/panchenkoai/rivet