You are on page 1of 4

Implementasi ASCII

Umum

Ketika standar diimplementasikan dalam ASCII, satu file biasanya sesuai dengan dataset, sesekali
untuk sebuah subset. Item data kolom-diformat dan diatur dalam kolom dipimpin oleh nama
variabel disingkat. Nama-nama disingkat disajikan di atas variabel atau indikator tingkat pada baris
header yang diawali dengan simbol '@'. Beberapa nama dapat terjadi pada satu baris. Teks biasanya
ditentukan oleh serangkaian titik setelah header untuk menunjukkan lebar penuh lapangan,
misalnya, "TRT_NAME ..............." di bawah Perawatan pada Gambar. 1, dan nilai teks harus disajikan
di bawah header ditambah titik. Untuk item data pada akhir baris, bagaimanapun, teks dapat
digunakan tanpa titik-titik yang diperlukan di tempat lain. Baris kosong dapat dimasukkan di mana
saja di file.

Contoh implementasi berkas ASCII dari standar yang diberikan pada Gambar. 2 sampai 6. Gambar. 2
berisi dokumentasi untuk percobaan tunggal, dan Gambar. 3 dan 4, pengukuran bidang yang terkait,
dipisahkan sebagai ringkasan (Gambar 3) dan time series (Gambar 4) data. Gambar. 5 adalah untuk
data cuaca, dan Gambar. 6, untuk keterangan profil tanah.

Organisasi file dan penamaan

Sebagaimana diuraikan di atas, organisasi file biasa adalah data dari himpunan atau bagian untuk
berada dalam satu file. File bernama menggunakan konvensi dua bagian. Prefiks berkas sama
dengan pengenal khusus untuk mengatur atau bagian, sementara ekstensi file membedakan antara
jenis informasi. Awalan ditambah, jika perlu, bagian dari ekstensi menyediakan identifier tertentu.
Ekstensi file yang dibangun sebagai berikut:

CCX Eksperimental rincian, di mana "cc" menunjukkan tanaman, multi-tanaman, atau kode urutan
rotasi. Contohnya adalah "WH" untuk gandum, "PN" untuk kacang tanah, "MC" untuk multi-
tanaman, dan "SQ" untuk urutan rotasi atau percobaan,

Profil Tanah SOL,

Cuaca WTH.

Untuk kenyamanan, sering diinginkan untuk menempatkan ringkasan dan waktu-kursus subset dari
percobaan dalam file terpisah. Untuk memungkinkan hal ini, dua jenis file tambahan yang
digunakan. Ekstensi masing-masing adalah:

CCA Percobaan - ringkasan hasil,

CCT Percobaan - hasil waktu-kursus.

Selanjutnya, dataset cuaca besar mungkin perlu dibagi untuk penanganan file yang mudah. Dalam
kasus seperti itu, nama-nama bagian menunjukkan periode waktu yang dicakup, dan ini digunakan
sebagai nama file. Dengan demikian, dataset dengan nama UFGA197520, memiliki 20 tahun data
harian dimulai pada tahun 1975, dapat dibagi menjadi dua himpunan bagian sepuluh tahun, dengan
file yang berisi subset diidentifikasi sebagai UFGA197510.WTH dan UFGA198510.WTH.

Beberapa nama file contoh diberikan di bawah ini:

UCEA0501.SBX

UCEA0501.SQX

UCEA0501.MCX

UFGA.WTH

UFGA2005.WTH

UFGALCOR.WTH

UC.SOL

ARIZONA.SOL

Simbol Berkas

Dalam file individual, simbol khusus digunakan untuk memandu pembacaan mesin data dan untuk
memfasilitasi inspeksi visual data. Dataset diidentifikasi dengan tanda dolar ($) pada kolom pertama
baris pertama. Simbol ini diikuti oleh nama umum dan identifier tertentu, seperti yang ditunjukkan
di bawah ini:

$ PERCOBAAN: UCEA9601SB

$ CUACA: UFGA2001

$ TANAH: UC

$ TANAH: ARIZONA

Subset data diidentifikasi dengan menempatkan tanda bintang (*) pada posisi karakter pertama
sebelum identifier, seperti yang ditunjukkan di bawah ini:

* Terapi

* Irigasi

* WEATHER_STATION: UFGA2004S1

* SOIL_PROFILE: UFGA200401

Menghubungkan data di dataset dan subset

Pengidentifikasi tingkat numerik dan string karakter yang digunakan untuk menghubungkan
informasi di seluruh dataset dan subset sebanyak kunci yang digunakan untuk menghubungkan tabel
dalam database relasional. Hubungan antara subset data yang berbeda memerlukan beberapa
pengidentifikasi untuk mengakomodasi kombinasi perawatan, ulangan, dan tanaman rotasi atau
asosiasi gulma sebagaimana ditentukan dalam PERAWATAN bagian (Tabel 4;. Gambar 2). Tingkat
pengobatan dan link yang diidentifikasi dengan bilangan bulat, nomor disukai dari 1 dalam setiap
percobaan. Nilai 0 untuk mereplikasi menyiratkan itu berarti seluruh ulangan diberikan.

Para PERAWATAN subset dari Gambar. 2 menggambarkan kasus tunggal bereplikasi dan berarti dan
komponen spesies tanaman yang berbeda (gandum dan gulma). Perhatikan bahwa sementara data
untuk individu ulangan diberikan untuk gandum, komponen gulma hanya ditentukan pada tingkat
sarana dua ulangan.

Sintaks khusus dan aturan pembentuk

Pelaksanaan ASCII dapat digunakan tanpa pembatasan pada panjang garis atau jumlah karakter
dalam pengidentifikasi, variabel singkatan nama, atau variabel karakter. Namun, untuk
menyederhanakan pengembangan perangkat lunak terkait, dan untuk memudahkan melihat dan
manual pengecekan file, baris berikut dan panjang maksimum nama yang digunakan:
1. Baris 254 karakter
2. Nama variabel singkatan 31 karakter
3. Variabel 31 karakter (tapi 80 untuk teks)
4. Indikator tingkat 31 karakter
5. Dataset dan Subset Identifier 31 karakter

Aturan khusus untuk komentar, data yang hilang, data non-berlaku, bendera data, sub-sampel, dan
penanda akhir-of-file diringkas dalam Tabel 5. Data numerik yang hilang diidentifikasi oleh -99, dan
hilang karakter string atau teks, dengan string "-99". Dalam beberapa kasus, kode-kode tertentu
dapat digunakan untuk menunjukkan bahwa metode aplikasi atau jenis pupuk tidak diketahui.

Tanggal untuk tahap pertumbuhan disajikan dengan menggunakan dua digit untuk tahun dan tiga
digit untuk hari ("yr-hari tahun" format seperti "81253" untuk hari 253 Tahun 1981). Hal ini
memungkinkan presentasi kompak, dan ambiguitas yang bisa timbul dengan format dua digit tahun
ini mudah diselesaikan dengan mengacu pada tanggal tanam seperti yang diberikan dalam subset
TANAM.

Penambahan berkas dan Modifikasi

Untuk memasukkan data barang baru, singkatan tambahan didefinisikan, dan kolom yang sesuai
item data ditambahkan dalam subset ada atau baru. Menambahkan item data tambahan pada akhir
baris yang ada dari item data tidak disarankan. Dua pengecualian adalah ketika variabel diperlukan
sebagai link ke data lain dalam file, misalnya, faktor tambahan dalam subset pengobatan, atau saat
menambahkan baris tambahan item data akan mengganggu konfigurasi keseluruhan dari file,
misalnya, untuk harian baru cuaca variabel.

Berkas Validasi

Sebuah file yang valid tidak memiliki header diulang dalam subset, dan menggunakan nama bagian
yang unik dalam dataset. Untuk percobaan, semua tingkatan didefinisikan dalam PERAWATAN
bagian harus link ke tingkatan dalam subset lain. Selain itu, untuk tanaman tumbuh di lapangan, file
harus berisi subset berurusan dengan GENOTIPE, BIDANG, TANAM, dan INITIAL_CONDITIONS,
sebagai minimum. Untuk bera, subset berurusan dengan BIDANG, INITIAL_CONDITIONS dan panen
yang diperlukan. Dalam implementasi saat ini, panen bagian digunakan untuk menentukan akhir
bera.

You might also like