Hoje em dia, o cache são diferentes tabelas cada uma sala num .parquet separado. Uma sugestão do @dhersz seria criar um base em .duckdb com cada uma dessas tabelas indexadas (e daí apagar os arquivos parquet). Seria uma boa fazer um teste para ver quanto essa ideia de arquitetura poderia melhorar a performance do pacote.