What is Unicode?

What is Unicode? ASCII Code, Unicode Text का एक सरल रूप तो है लेकिन ये कई अन्‍य तरह के Alphabets और Encodings में से एक है। यानी Computer में Text को Represent करने के जितने सम्‍भव तरीके होते हैं, ASCII उन सभी में से एक है।

लेकिन ASCII Codes की एक Limitation ये है कि इसके माध्‍यम से हम अधिकतम 256 Characters को ही Represent कर सकते हैं, जबकि दुनियां में हजारों तरह की Different भाषाऐं हैं और उन सभी में Different तरह के Character Symbols हैं।

इसलिए Computer Programming के विकास के साथ ही महसूस किया गया कि केवल English Language आधारित Computer Applications से ही काम नहीं चलेगा, पूरी दुनियां में Computer Technology को Useful बनाने के लिए जरूरी है कि अन्‍य Languages के Character Symbols को भी Computer System में Represent करने का कोई तरीका हो और इस जरूरत को पूरा करने के लिए ही Unicode का विकास किया गया, जिसके अन्‍तर्गत किसी भी Character को Represent करने के लिए 2 Bytes यानी 16 Bits की जरूरत होती है।

जबकि Unicode से पहले केवल English Character Symbols को ही Represent करना होता था, जिसके लिए केवल 1 Byte या 8-Bit पर्याप्‍त होते थे। इसीलिए ASCII में प्रत्‍येक Character केवल 1-Byte की Space लेता है।

Python पूरी तरह से Unicode Supported है, यानी इसमें किसी भी Character Symbol को Represent करने के लिए कम से कम 2-Byte के Memory Space की जरूरत होती है। इसी वजह से Python, TextBinary दोनों प्रकार के Data को क्रमश: Distinct Object TypesFile Interface के माध्‍यम से आसानी से Represent कर पाने में सक्षम हो जाता है।

Python में तीन तरह के String Types होते हैं: str का प्रयोग ASCII सहित Unicode Text को Represent करने के लिए Use किया जाता है। bytes का प्रयोग Encoded Text सहित Binary Data को Represent करने के लिए Use किया जाता है और bytearray, bytes का एक Mutable Variant होता है।

इसी तरह से Files, TextBinary के रूप में दो Modes में काम करते हैं। Text Files में Content str के रूप में Represent होते हुए Unicode Encodings को Implement करते हैं जबकि Binary Files में Content, Raw bytes के रूप में Deal होते हैं और Encoding / Decoding के रूप में कोई Data Translation नहीं करते।

UnicodeASCII में जो मुख्‍य अन्‍तर है वो यही है कि जब Text को File में Write किया जाता हैया जब File से Read किया जाता है, तब Unicode Strings Encode व Decode होते हैं, जबकि ASCII Strings के साथ ऐसा कुछ भी नहीं होता। इस मूल अन्‍तर के अलावा Unicode String व ASCII String में कोई अन्‍तर नहीं होता।

Shared Reference and Equality Check
String Basics in Python

Python in Hindi - BccFalna.comये Article इस वेबसाईट पर Selling हेतु उपलब्‍ध EBook Python in Hindi से लिया गया है। इसलिए यदि ये Article आपके लिए उपयोगी है, तो निश्चित रूप से ये EBook भी आपके लिए काफी उपयोगी साबित होगी।

Python in Hindi | Page: 602 | Format: PDF

BUY NOW GET DEMO REVIEWS