Fa pocs dies l'Apache Software Foundation va donar a conèixer el llançament de la nova versió d'Apache Cassandra 4.0 el qual és un sistema d'administració de bases de dades distribuït que pertany a la classe de sistemes NoSQL i està dissenyat per a crear emmagatzematges altament escalables i fiables de grans quantitats de dades emmagatzemades en forma d'una matriu associativa.
Aquesta nova versió d'Apache Cassandra 4.0 es considera una versió estable per la qual cosa pot ser utilitzada per a implementacions de producció i ja s'ha provat en infraestructures d'Amazon, Apple, DataStax, Instaclustr, Iland i Netflix amb clústers de més de 1000 nodes.
Principals novetats d'Apache Cassandra 4.0
Aquesta nova versió de Apache Cassandra 4.0 representa prop de 1,000 correccions d'errors, millores i noves caracterÃstiques de les quals es destaquen les següents:
- Major velocitat i escalabilitat: transmet dades fins a 5 vegades més rà pid durant les operacions d'escalat i un rendiment fins a un 25% més rà pid en lectures i escriptures, el que ofereix una arquitectura més elà stica, particularment en implementacions en el núvol i Kubernetes.
- Consistència millorada: manté les rèpliques de dades sincronitzades per optimitzar la reparació incremental per a una operació i consistència més rà pida i eficient entre les rèpliques de dades.
- Seguretat i observabilitat millorades: el registre d'auditoria rastreja l'accés i l'activitat dels usuaris amb un impacte mÃnim en el rendiment de la cà rrega de treball. La nova captura i reproducció permet l'anà lisi de les cà rregues de treball de producció per ajudar a garantir el compliment normatiu i de seguretat amb SOX, PCI, GDPR o altres requisits.
- Nous parà metres de configuració: les mètriques de sistema exposades i els parà metres de configuració brinden flexibilitat als operadors per garantir que tinguin fà cil accés a les dades que optimitzen les implementacions.
- Latència minimitzada: els temps de pausa de l'recol·lector d'escombraries es redueixen a uns pocs milisegons sense degradació de la latència a mesura que augmenta la mida de la pila.
- Millor compressió: l'eficiència de compressió millorada alleuja la tensió innecessà ria en l'espai del disc i millora el rendiment de lectura.
A més d'això, també es destaca que es va agregar suport de registre d'auditoria per rastrejar les operacions d'autenticació d'usuaris i totes les consultes CGL executades, aixà com també la capacitat de mantenir un registre binari complet de sol·licituds, el que permet guardar tot el trà nsit de sol·licituds i respostes.
Aixà mateix, també es destaca l'opció experimental per comparar tots els arbres Merkle (Merkle Tree). Per exemple, habilitar l'opció en un clúster amb 3 nodes, en què dues rèpliques són iguals i una està desactualitzada, resultarà en l'actualització de la rèplica desactualitzada usant només una operació de còpia de la rèplica actual.
també, es va agregar suport per a taules virtuals que no reflecteixen dades emmagatzemades en SSTables, Sinó informació mostrada a través de l'API (mètriques de rendiment, informació de configuració, contingut de memòria cau, informació sobre clients connectats, etc.).
S'ha millorat l'eficiència de l'emmagatzematge comprimit per reduir el consum d'espai en disc i millorar el rendiment de lectura.
D'altra banda es destaca que es va afegir suport experimental per a la replicació transitòria i Cheap quòrums. Les rèpliques temporals no emmagatzemen totes les dades i utilitzen la recuperació incremental per ser coherents amb les rèpliques completes. Els quòrums lleugers són optimitzacions d'escriptura que no escriuen en rèpliques temporals fins que estigui disponible un conjunt suficient de rèpliques completes.
Pel que fa a les dades relacionades amb l'espai de la clau de sistema (system. *), Aquests ara es troben en el primer directori per defecte en lloc de distribuir-se entre tots els directoris de dades, el que permet que el node estigui operatiu en cas d'una falla d'un dels discos addicionals.
De els altres canvis que es destaquen:
- Es va agregar suport experimental per a Java 11.
- Es va agregar suport per a operacions aritmètiques en consultes CGL.
- La comanda «nodetool cfstats» va afegir suport per ordenar per certes mètriques i limitar el nombre de lÃnies mostrades.
- La configuració es proporciona per a restringir les connexions dels usuaris a centres de dades especÃfiques únicament.
- Es va agregar la capacitat de limitar la intensitat (lÃmit de freqüència) de les operacions per crear i esborrar instantà nies.
- El suport de Python 3 s'implementa en cqlsh i cqlshlib (el suport de Python 2.7 encara es conserva).
Finalment, si estàs interessat en conèixer més a l'respecte d'aquesta nova versió, pots consultar els detalls en el següent enllaç.