NCCHUNKIE: Unterschied zwischen den Versionen
Aus BAWiki
(Versionsdatum modifiziert) |
(Arbeitsgruppe POS) |
||
Zeile 3: | Zeile 3: | ||
|name=NCCHUNKIE | |name=NCCHUNKIE | ||
|version=April 2022 | |version=April 2022 | ||
|version_beschr= | |version_beschr=September 2022 | ||
|stichworte=Datenkonversion<br /> | |stichworte=Datenkonversion<br /> | ||
Postprocessor<br/> | Postprocessor<br/> | ||
Zeile 39: | Zeile 39: | ||
|programmiersprache=Fortran95 | |programmiersprache=Fortran95 | ||
|zus_software= --- | |zus_software= --- | ||
|kontakt_original= | |kontakt_original=G. Lang | ||
|kontakt_pflege=[mailto: | |kontakt_pflege=[mailto:pos.proghome@baw.de Arbeitsgruppe POS] | ||
|dokumentation= | |dokumentation= | ||
* [https://izw-campus.baw.de/ ''IZW-Campus''] (Podcast) | * [https://izw-campus.baw.de/ ''IZW-Campus''] (Podcast) |
Version vom 6. September 2022, 10:25 Uhr
Basisinformationen
Programm-Name
NCCHUNKIE
Version
April 2022
Beschreibung
September 2022
Stichworte
Datenkonversion
Postprocessor
Automatische Anpassung der READ-Daten-Portionen an Chunk-Größe
Automatische Berechnung der Chunk-Größen der Ergebnisvariablen für orthogonalen Datenzugriff
Parallelisierung (collective IO) mit MPI
Danksagung: This project took advantage of netCDF software developed by UCAR/Unidata (www.unidata.ucar.edu/software/netcdf/).
Kurzbeschreibung
Das Programm NCCHUNKIE dient dem Chunken von cf-netcdf.nc Dateien:
- Die Größe der Chunks wird automatisch berechnet, wobei alle Dimensionen gechunkt werden (Kompromiss für orthogonalen Datenzugriff);
- Die erzeugten Chunk-Größen liegen dabei zwischen der Disc Block Size und der Chunk Buffer Size;
- Die Daten der Ergebnisdatei werden Online komprimiert (niedrige Kompressionsstufe, Level 1);
- Es wird eine Datei im netCDF-4-Format erzeugt (serielle Version NetCDF4 Classic Model Format);
- Die Parameter Cache Size und Cache Nelems der netCDF-4 API werden automatisch ermittelt.
Falls beim Lesen von Daten ein HDF error auftritt wird versucht, die Werte des gewünschten Datenrecords aus den Werten zeitlich benachbarter Records zu rekonstruieren (Interpolation). Diese Reparatur funktioniert ausschließlich für von der Zeit abhängige Variablen.
Eingabe-Dateien
- Es wird keine Eingabesteuerdatei benötigt (Parameter in Kommandozeile oder interaktive Eingabe);
- UGRID CF NetCDF Daten (Dateityp cf-netcdf.nc).
Ausgabe-Dateien
- UGRID CF NetCDF Daten (Dateityp cf-netcdf.nc);
- Drucker-Ausgabe (Dateityp NCCHUNKIE.sdr) mit Informationen zum Programmablauf, Zeitaufwand für READ und WRITE, sowie erzielte Transferraten (MB/s);
- Trace-Ausgabe (Dateityp NCCHUNKIE.trc)
Methode
Es wurde auf die in https://support.hdfgroup.org/pubs/papers/2008-06_netcdf4_perf_report.pdf beschriebenen Konzepte zurückgegriffen.
Vorlauf-Programme
DATACONVERT, GRIDCONVERT, NCANALYSE, NCAGGREGATE, NCCUTOUT, NCDELTA, NCDVAR, NCMERGE, NetCDF Operators, UNTRIM2007, UNTRIM2
Nachlauf-Programme
NCANALYSE, NCAGGREGATE, NCCUTOUT, NCDELTA, NCDVAR, NCMERGE, NC2TABLE, NetCDF Operators
Weitere Informationen
Programmiersprache
Fortran95
zusätzliche Software
---
Originalversion
G. Lang
Programmpflege
Dokumentation/Literatur
- IZW-Campus (Podcast)
- 2020-11-02: Chunking und NCCHUNKIE;
- 2019-08-02: Anmerkungen zur Chunked I/O mit NetCDF-4 / HDF5.
- Musterdateien
- Es sind keine Musterdateien vorhanden.
zurück zu Programmkennblätter