HTML Encoder

HTML Encoder / Decoder

`& < > " '` को सुरक्षित HTML entities में escape करें, या entity-escaped टेक्स्ट को वापस सादे रूप में decode करें। चार एन्कोडिंग स्तर — Minimal, Named, Numeric, All non-ASCII। UTF-8 + emoji + CJK सुरक्षित, आपके ब्राउज़र में।

डिफ़ॉल्ट रूप से Minimal रखें — केवल & < > " ' को escape करें, ये पाँच कैरेक्टर जो HTML body / attribute कॉन्टेक्स्ट तोड़ते हैं। हर आधुनिक टेम्पलेटिंग इंजन यही करता है। Named entities इस्तेमाल करें अगर आप copyright / nbsp / arrows आदि को पठनीय कोड (&copy; के बजाय &#169;) के रूप में चाहते हैं। Numeric इस्तेमाल करें जब HTML को ऐसी पाइपलाइन्स से भेज रहे हों जो named entities न समझती हों। All non-ASCII इस्तेमाल करें जब सख्त ASCII-only सिस्टम (लिगेसी ईमेल सर्वर, टूटे हुए API) को टार्गेट कर रहे हों।

&apos; XML और HTML5 में मान्य है, लेकिन HTML 4.01 में नहीं — पुराने ब्राउज़र इसे लिटरल टेक्स्ट ' के रूप में रेंडर करते हैं। Numeric reference &#39; हर जगह काम करता है। Decoder संगतता के लिए &apos; को इनपुट के रूप में स्वीकार करता है।

इनपुट
आउटपुट

सुरक्षित HTML आउटपुट के लिए बना

टेम्पलेट्स के लिए यूज़र कंटेंट को escape करें, entity-encoded डेटा को decode करें — और कुछ छोटे-छोटे टच जो इसे इस्तेमाल करने में सच में मज़ेदार बनाते हैं।

चार एन्कोडिंग मोड

Minimal केवल पाँच HTML-असुरक्षित कैरेक्टर्स (& < > " ') को escape करता है — सामान्य यूज़र-जनरेटेड कंटेंट के लिए सही डिफ़ॉल्ट। Named जहाँ मौजूद है वहाँ पठनीय HTML5 entities जैसे &copy; / &nbsp; / &hearts; इस्तेमाल करता है। Numeric हर non-ASCII codepoint को &#NN; के रूप में एनकोड करता है। All non-ASCII लिगेसी / ASCII-only पाइपलाइन्स के लिए printable ASCII के बाहर हर codepoint को एनकोड करता है।

किसी भी entity को decode करें

Decoder named entities (&copy;), decimal numeric (&#169;), और hex numeric (&#xA9;) को संभालता है। Surrogate-pair codepoints (emoji, प्राचीन लिपियाँ) UTF-16 के ज़रिए सही ढंग से round-trip करते हैं।

लाइव प्रीव्यू

हर कीस्ट्रोक पर आउटपुट अपडेट होता है — कोई Encode / Decode बटन दबाना नहीं। एक क्लिक में दिशा बदलें; Swap बटन आउटपुट को वापस इनपुट में ले जाता है ताकि आप ट्रांसफ़ॉर्म्स को chain कर सकें।

UTF-8 + emoji + CJK सुरक्षित

हर Unicode codepoint round-trip करता है: 中文, العربية, русский, हिंदी, 🎉, Þorgeir। Encoder प्रति-codepoint iteration इस्तेमाल करता है (charAt नहीं) ताकि surrogate pairs बरकरार रहें।

डिज़ाइन से ही गोपनीयता

आपका टेक्स्ट आपके डिवाइस पर ही रहता है। Encoder, decoder, named-entity टेबल सब लोकल JavaScript के रूप में चलते हैं। DevTools → Network खोलें और शून्य आउटबाउंड रिक्वेस्ट सत्यापित करें।

छोटा + तेज़

शुद्ध JavaScript, कोई फ्रेमवर्क रनटाइम नहीं। Cold load 25 KB gzipped से कम है। 100 KB का HTML डॉक्यूमेंट 5 ms से कम में एनकोड हो जाता है।

HTML entities को कैसे एनकोड या डीकोड करें

कच्चे टेक्स्ट से entity-सुरक्षित आउटपुट तक चार चरण।

  1. 1

    अपना टेक्स्ट पेस्ट करें

    सादा टेक्स्ट या HTML Input पैन में डालें। कुछ भी चलेगा — यूज़र कमेंट्स, ब्लॉग पोस्ट, emoji, CJK, RTL स्क्रिप्ट्स। Encoder codepoint के हिसाब से iterate करता है ताकि multi-byte sequences बरकरार रहें।

  2. 2

    दिशा + मोड चुनें

    Direction को Encode (टेक्स्ट → entities) या Decode (entities → टेक्स्ट) पर सेट करें। Encode के लिए मोड चुनें: टेम्पलेट्स के लिए Minimal, पठनीय entities के लिए Named, non-ASCII को &#NN; के रूप में के लिए Numeric, ASCII-only आउटपुट के लिए All non-ASCII

  3. 3

    लाइव प्रीव्यू देखें

    हर कीस्ट्रोक पर आउटपुट अपडेट होता है। ड्रॉपडाउन बदलकर रियल टाइम में मोड्स की तुलना करें। आउटपुट को वापस इनपुट में ले जाने के लिए Swap इस्तेमाल करें — round-trip सत्यापन के लिए उपयोगी (encode फिर decode = मूल)।

  4. 4

    कॉपी या डाउनलोड करें

    रिज़ल्ट को क्लिपबोर्ड पर भेजने के लिए कॉपी आइकन इस्तेमाल करें, या इसे output.encode.html / output.decode.txt के रूप में सहेजने के लिए डाउनलोड आइकन। साइज़ डिफ़ (chars / bytes इन → आउट) ठीक-ठीक दिखाता है कि एन्कोडिंग ने टेक्स्ट को कितना बढ़ाया या घटाया।

रोज़मर्रा के वेब-डेव काम के लिए बना

चार आम परिदृश्य जहाँ एक privacy-first ब्राउज़र टूल किसी रैंडम ऑनलाइन एनकोडर में कोड पेस्ट करने से बेहतर है।

यूज़र कंटेंट को टेम्पलेट में सुरक्षित रूप से embed करना

यूज़र कमेंट्स, फ़ॉर्म रिस्पॉन्सेज़, सर्च क्वेरीज़ — बाहर से आने वाला कुछ भी जो <p>, <li>, या attribute के अंदर जाता है। अपने HTML में स्ट्रिंग-कॉनकैटनेट करने से पहले Minimal-मोड एनकोड से चलाएँ, और आप टूटी मार्कअप और सबसे सरल XSS पेलोड्स से सुरक्षित हैं।

API से entity-escaped डेटा पढ़ना

कुछ API पहले से entity-escaped स्ट्रिंग्स लौटाते हैं (RSS फ़ीड्स, कुछ CMS एक्सपोर्ट्स, स्क्रैप किया गया HTML)। पेस्ट करें, Decode दबाएँ, मूल Unicode वापस पाएँ। Decoder named, decimal, और hex entities को संभालता है, जिसमें surrogate pairs भी शामिल हैं।

ईमेल सब्जेक्ट लाइन्स + meta टैग्स

<title>, <meta name="description">, <meta property="og:title"> — विशेष कैरेक्टर्स के लिए सबको entity escaping चाहिए। अपनी हेडलाइन एक बार एनकोड करें, तीनों में पेस्ट करें।

संवेदनशील कंटेंट जो थर्ड-पार्टी सर्विस को नहीं जा सकता

आंतरिक CMS कंटेंट, ग्राहक डेटा, NDA-संरक्षित टेम्पलेट्स — कुछ भी जो आप क्लाउड एनकोडर में पेस्ट नहीं कर सकते। केवल-ब्राउज़र टूल हर बाइट को आपके लैपटॉप पर रखता है। DevTools → Network खोलें और सत्यापित करें कि कुछ नहीं जाता।

100% निजी — आपके ब्राउज़र में चलता है

आपका टेक्स्ट कभी आपका डिवाइस नहीं छोड़ता। DevTools → Network खोलें और एनकोड या डीकोड के दौरान आपको शून्य आउटबाउंड रिक्वेस्ट दिखेंगी।

  • Encoder, decoder, और named-entity लुकअप टेबल सब आपकी मशीन पर JavaScript के रूप में चलते हैं — कोई सर्वर-साइड कन्वर्ज़न नहीं, कोई थर्ड-पार्टी API नहीं।
  • Surrogate-pair codepoints (emoji, प्राचीन लिपियाँ) byte-level मैपिंग नहीं, codepoint iteration से संभाले जाते हैं — इसलिए 🎉 का पेस्ट round-trip के बाद भी 🎉 रहता है।
  • कोई लॉगिन नहीं, टेक्स्ट कंटेंट पर कोई टेलीमेट्री नहीं। हम केवल एक कुकी कुकी-सहमति स्थिति के लिए और एक भाषा प्राथमिकता के लिए इस्तेमाल करते हैं।

संबंधित गाइड

HTML escaping, entity टेबल्स और सुरक्षित टेम्पलेटिंग पर हाथ से चुने गए लेख।

अक्सर पूछे जाने वाले प्रश्न

मुझे कौन सा मोड चुनना चाहिए?

डिफ़ॉल्ट रूप से Minimal रखें — केवल & < > " ' को escape करें, ये पाँच कैरेक्टर जो HTML body / attribute कॉन्टेक्स्ट तोड़ते हैं। हर आधुनिक टेम्पलेटिंग इंजन यही करता है। Named entities इस्तेमाल करें अगर आप copyright / nbsp / arrows आदि को पठनीय कोड (&copy; के बजाय &#169;) के रूप में चाहते हैं। Numeric इस्तेमाल करें जब HTML को ऐसी पाइपलाइन्स से भेज रहे हों जो named entities न समझती हों। All non-ASCII इस्तेमाल करें जब सख्त ASCII-only सिस्टम (लिगेसी ईमेल सर्वर, टूटे हुए API) को टार्गेट कर रहे हों।

यह `'` को `&apos;` के बजाय `&#39;` के रूप में क्यों escape करता है?

&apos; XML और HTML5 में मान्य है, लेकिन HTML 4.01 में नहीं — पुराने ब्राउज़र इसे लिटरल टेक्स्ट ' के रूप में रेंडर करते हैं। Numeric reference &#39; हर जगह काम करता है। Decoder संगतता के लिए &apos; को इनपुट के रूप में स्वीकार करता है।

क्या emoji और CJK कैरेक्टर्स बचे रहेंगे?

हाँ। Encoder codepoints पर iterate करता है (UTF-16 code units पर नहीं), इसलिए 🎉 (U+1F389) जैसा emoji एनकोड पर &#127881; बनता है और decode के ज़रिए सही ढंग से round-trip करता है। CJK के लिए भी यही (numeric मोड में 中文 → &#20013;&#25991;)।

क्या एन्कोडिंग के बाद यूज़र इनपुट को सीधे HTML में embed करना सुरक्षित है?

HTML body और attributes के लिए — हाँ, Minimal मोड के साथ। URL कॉन्टेक्स्ट (href="...") के लिए आपको URL एन्कोडिंग भी चाहिए। इनलाइन JavaScript या CSS के लिए, न HTML और न URL एन्कोडिंग पर्याप्त है — एक उचित टेम्पलेटिंग इंजन इस्तेमाल करें जो उन कॉन्टेक्स्ट्स को समझे। बिना escape किए यूज़र इनपुट को कभी <script> ब्लॉक में पेस्ट न करें।

क्या कुछ भी आपके सर्वर पर भेजा जाता है?

नहीं। Encoder, decoder, और named-entity लुकअप टेबल सब आपके डिवाइस पर JavaScript में चलते हैं। DevTools → Network खोलें और एनकोड या डीकोड के दौरान आपको शून्य आउटबाउंड रिक्वेस्ट दिखेंगी। सीक्रेट्स, ग्राहक डेटा, आंतरिक टेम्पलेट्स पेस्ट करें — आपके लैपटॉप से कुछ नहीं जाता।