17 Maret 2021 [Programming, Tech]
Selama saya bekerja di RFC 8771 The Internationalized Deliberately Unreadable Network NOtation (I-DUNNO), saya menemukan sejumlah pertanyaan. Saya mendokumentasikannya di sini sehingga saya dapat mengirimkannya kepada penulis dan mencoba meningkatkan pemahaman saya tentang maksudnya.
Ini adalah RFC yang luar biasa, dan saya berterima kasih kepada penulis atas upaya mereka dalam menciptakannya.
- Karakter yang tidak dapat dicetak
Di dalam 4.2. Tingkat Kebingungan MemuaskanRFC menyatakan bahwa pengkodean dapat dianggap Memuaskan jika mengandung ‘Setidaknya satu karakter yang tidak dapat dicetak’ (serta satu kondisi lain di bagian ini).
Kedua implementasi yang saya ketahui (lilyinstartlight dan audeoudh) mengartikan “dapat dicetak” memiliki arti yang sama dengan fungsi isprintable() Python: yaitu karakter yang tidak dapat dicetak adalah karakter yang didefinisikan dalam database karakter Unicode sebagai “Lainnya” atau “Pemisah”, kecuali spasi ASCII (0x20) yang dianggap dapat dicetak.
Namun, definisi fungsi ini mungkin spesifik untuk Python, karena maksudnya tampaknya terkait dengan internal bahasa seperti fungsi repr.
Akan sangat membantu jika mengetahui secara pasti apa yang dimaksud dengan “karakter yang tidak dapat dicetak” dalam RFC.
- Apakah Simbol Pengubah, Simbol?
Juga di bagian 4.2RFC menyebutkan ‘”Karakter dari kategori “Simbol”‘.
Implementasi Python mengecualikan Simbol Pengubah dari definisinya. Saya yakin ini tidak benar, dan telah mencatat masalah pada topik: Beberapa karakter Simbol tidak dikenali.
Akan sangat membantu jika ada klarifikasi mengenai hal ini.
- Apa yang dimaksud dengan “arah yang berbeda”?
Unicode mengklasifikasikan karakter menjadi beberapa Bidi_Classes (misalnya, U+CED6E adalah Left_To_Right). Di bagian 4.3. Tingkat Kebingungan yang MenyenangkanRFC mengacu pada ‘Karakter dari skrip dengan arah berbeda’.
Sejauh yang saya lihat, ada dua kemungkinan penafsiran atas frasa ini:
- Pengkodean harus berisi karakter dari setidaknya dua Bidi_Classes yang berbeda, atau
- Pengkodean harus berisi karakter yang arahnya dari kiri ke kanan dan dari kanan ke kiri, baik lemah atau kuat.
Kedua implementasi saat ini menafsirkan pernyataan ini seperti nomor 1, tetapi saya menduga maksudnya sebenarnya lebih seperti nomor 2.
Jika yang dimaksud dengan nomor 2, menurut saya itu berarti mengabaikan karakter dengan arah Netral, dan memperlakukan karakter dengan arah lemah sebagai arah yang sama dengan karakter dengan arah kuat.
- Apa itu karakter yang membingungkan?
Bagian 4.3 menyebutkan ‘Karakter diklasifikasikan sebagai “Bingung”‘. Kedua implementasi mengartikan hal ini secara longgar, dengan arti seperti ‘pengkodean berisi karakter atau substring apa pun yang mungkin tertukar dengan karakter atau substring lain’.
Ini berarti banyak karakter “normal” yang disertakan: semua digit ASCII, dan banyak huruf Latin.
Apakah ini niatnya?
Itu semua pertanyaan saya. Sangat menyenangkan mengerjakan RFC ini.
News
Berita Teknologi
Berita Olahraga
Sports news
sports
Motivation
football prediction
technology
Berita Technologi
Berita Terkini
Tempat Wisata
News Flash
Football
Gaming
Game News
Gamers
Jasa Artikel
Jasa Backlink
Agen234
Agen234
Agen234
Resep
Download Film
A gaming center is a dedicated space where people come together to play video games, whether on PCs, consoles, or arcade machines. These centers can offer a range of services, from casual gaming sessions to competitive tournaments.
