HTML Encoder

HTML Encoder / Decoder

`& < > " '` کو محفوظ HTML entities میں escape کریں، یا entity-escaped متن کو واپس سادہ متن میں ڈی کوڈ کریں۔ چار encoding سطحیں — Minimal، Named، Numeric، All non-ASCII۔ UTF-8 + emoji + CJK محفوظ، آپ کے براؤزر میں۔

ڈیفالٹ کے طور پر Minimal رکھیں — صرف & < > " ' کو escape کریں، وہ پانچ حروف جو HTML body / attribute contexts کو توڑتے ہیں۔ یہی ہر جدید templating engine کرتا ہے۔ Named entities استعمال کریں اگر آپ copyright / nbsp / تیر وغیرہ کو پڑھنے کے قابل کوڈز کے طور پر چاہتے ہیں (&copy; بجائے &#169;Numeric اس وقت استعمال کریں جب HTML کو ایسی پائپ لائنز کے ذریعے بھیج رہے ہوں جو named entities کو نہ سمجھیں۔ All non-ASCII سخت ASCII-only سسٹمز (پرانے ای میل سرورز، ٹوٹے ہوئے APIs) کو ٹارگٹ کرنے کے لیے استعمال کریں۔

&apos; XML اور HTML5 میں درست ہے، لیکن HTML 4.01 میں نہیں — پرانے براؤزر اسے لفظی متن ' کے طور پر render کرتے ہیں۔ عددی reference &#39; ہر جگہ کام کرتا ہے۔ Decoder مطابقت کے لیے input میں &apos; قبول کرتا ہے۔

ان پٹ
آؤٹ پٹ

محفوظ HTML output کے لیے بنایا گیا

Templates کے لیے user content کو escape کریں، entity-encoded ڈیٹا کو ڈی کوڈ کریں — اور چند چھوٹی باریکیاں جو اسے واقعی استعمال میں مزیدار بناتی ہیں۔

چار encoding موڈز

Minimal صرف پانچ HTML-غیر محفوظ حروف (& < > " ') کو escape کرتا ہے — عام user-generated مواد کے لیے درست ڈیفالٹ۔ Named جہاں موجود ہو پڑھنے کے قابل HTML5 entities جیسے &copy; / &nbsp; / &hearts; استعمال کرتا ہے۔ Numeric ہر non-ASCII codepoint کو &#NN; کے طور پر انکوڈ کرتا ہے۔ All non-ASCII printable ASCII سے باہر کے ہر codepoint کو پرانی / ASCII-only پائپ لائنز کے لیے انکوڈ کرتا ہے۔

کسی بھی entity کو ڈی کوڈ کریں

Decoder named entities (&copy;)، اعشاری عددی (&#169;)، اور hex عددی (&#xA9;) کو سنبھالتا ہے۔ Surrogate-pair codepoints (emoji، قدیم scripts) UTF-16 کے ذریعے درست طور پر round-trip کرتے ہیں۔

لائیو پیش نظارہ

ہر keystroke پر output اپ ڈیٹ ہوتا ہے — کوئی Encode / Decode بٹن دبانے کی ضرورت نہیں۔ ایک کلک سے سمت تبدیل کریں؛ Swap بٹن output کو واپس input میں منتقل کرتا ہے تاکہ آپ transforms کو chain کر سکیں۔

UTF-8 + emoji + CJK محفوظ

ہر Unicode codepoint round-trip کرتا ہے: 中文، العربية، русский، हिंदी، 🎉، Þorgeir۔ Encoder per-codepoint iteration استعمال کرتا ہے (نہ کہ charAt) تاکہ surrogate pairs برقرار رہیں۔

ڈیزائن کے لحاظ سے رازداری

آپ کا متن آپ کے ڈیوائس پر ہی رہتا ہے۔ Encoder، decoder، named-entity table سب JavaScript کے طور پر مقامی طور پر چلتے ہیں۔ DevTools → Network کھولیں اور صفر outbound requests کی تصدیق کریں۔

چھوٹا + تیز

Pure JavaScript، کوئی framework runtime نہیں۔ Cold load gzipped 25 KB سے کم ہے۔ ایک 100 KB HTML دستاویز 5 ms سے کم میں انکوڈ ہوتی ہے۔

HTML entities کو انکوڈ یا ڈی کوڈ کیسے کریں

خام متن سے entity-safe output تک چار مراحل۔

  1. 1

    اپنا متن پیسٹ کریں

    سادہ متن یا HTML کو Input پین میں ڈالیں۔ کچھ بھی چلے گا — user comments، blog posts، emoji، CJK، RTL scripts۔ Encoder codepoint کے لحاظ سے iterate کرتا ہے تاکہ multi-byte sequences برقرار رہیں۔

  2. 2

    سمت + موڈ منتخب کریں

    Direction کو Encode (متن → entities) یا Decode (entities → متن) پر سیٹ کریں۔ Encode کے لیے موڈ منتخب کریں: templates کے لیے Minimal، پڑھنے کے قابل entities کے لیے Named، non-ASCII کو &#NN; کے طور پر کے لیے Numeric، ASCII-only output کے لیے All non-ASCII۔

  3. 3

    لائیو پیش نظارہ دیکھیں

    ہر keystroke پر output اپ ڈیٹ ہوتا ہے۔ Dropdown تبدیل کر کے حقیقی وقت میں موڈز کا موازنہ کریں۔ Swap استعمال کریں تاکہ output کو واپس input میں منتقل کریں — round-trip کی تصدیق کے لیے مفید (انکوڈ پھر ڈی کوڈ = اصل)۔

  4. 4

    کاپی یا ڈاؤن لوڈ کریں

    نتیجے کو اپنے clipboard میں منتقل کرنے کے لیے copy آئیکن استعمال کریں، یا اسے output.encode.html / output.decode.txt کے طور پر محفوظ کرنے کے لیے download آئیکن۔ سائز کا فرق (chars / bytes ان → آؤٹ) بالکل دکھاتا ہے کہ encoding نے متن کو کتنا پھیلایا یا سکیڑا۔

روزمرہ کے ویب-ڈیو کے کام کے لیے بنایا گیا

چار عام منظرنامے جہاں privacy-first browser ٹول کسی random آن لائن encoder میں code paste کرنے سے بہتر ہے۔

User content کو محفوظ طریقے سے template میں ایمبیڈ کرنا

User comments، فارم کے جوابات، تلاش کی queries — باہر سے آنے والی کوئی بھی چیز جو <p>، <li>، یا attribute کے اندر ختم ہوتی ہے۔ اپنی HTML میں string-concatenating سے پہلے Minimal-mode encode سے گزاریں، اور آپ ٹوٹے ہوئے markup اور سادہ ترین XSS payloads سے محفوظ ہیں۔

API سے entity-escaped ڈیٹا پڑھنا

کچھ APIs پہلے سے entity-escaped strings واپس کرتی ہیں (RSS feeds، کچھ CMS exports، scraped HTML)۔ پیسٹ کریں، Decode دبائیں، اصل Unicode واپس حاصل کریں۔ Decoder named، decimal، اور hex entities بشمول surrogate pairs کو سنبھالتا ہے۔

ای میل subject lines + meta tags

<title>، <meta name="description">، <meta property="og:title"> — سب کو خاص حروف کے لیے entity escaping کی ضرورت ہے۔ اپنی headline کو ایک بار encode کریں، تینوں میں paste کریں۔

حساس مواد جو کسی تیسرے فریق کی سروس کو نہیں جا سکتا

اندرونی CMS مواد، گاہک کا ڈیٹا، NDA-محفوظ templates — کچھ بھی جو آپ کسی cloud encoder میں paste نہیں کر سکتے۔ یہ صرف-براؤزر ٹول ہر byte کو آپ کے لیپ ٹاپ پر رکھتا ہے۔ DevTools → Network کھولیں اور تصدیق کریں کہ کچھ نہیں جاتا۔

100% نجی — آپ کے براؤزر میں چلتا ہے

آپ کا متن کبھی آپ کے ڈیوائس سے باہر نہیں جاتا۔ DevTools → Network کھولیں اور آپ کو encode یا decode کے دوران صفر outbound requests نظر آئیں گے۔

  • Encoder، decoder، اور named-entity lookup table سب آپ کی مشین پر JavaScript کے طور پر چلتے ہیں — کوئی server-side conversion نہیں، کوئی تیسرے فریق کا API نہیں۔
  • Surrogate-pair codepoints (emoji، قدیم scripts) codepoint iteration کے ذریعے سنبھالے جاتے ہیں، نہ کہ byte-level mapping سے — لہٰذا 🎉 کا paste round-trip کے بعد 🎉 ہی رہتا ہے۔
  • کوئی login نہیں، متنی مواد پر کوئی telemetry نہیں۔ ہم صرف cookie-consent state کے لیے ایک کوکی اور زبان کی ترجیح کے لیے ایک کوکی استعمال کرتے ہیں۔

متعلقہ رہنما

HTML escaping، entity tables، اور محفوظ templating پر چنی ہوئی پڑھائی۔

عمومی سوالات

مجھے کون سا موڈ منتخب کرنا چاہیے؟

ڈیفالٹ کے طور پر Minimal رکھیں — صرف & < > " ' کو escape کریں، وہ پانچ حروف جو HTML body / attribute contexts کو توڑتے ہیں۔ یہی ہر جدید templating engine کرتا ہے۔ Named entities استعمال کریں اگر آپ copyright / nbsp / تیر وغیرہ کو پڑھنے کے قابل کوڈز کے طور پر چاہتے ہیں (&copy; بجائے &#169;Numeric اس وقت استعمال کریں جب HTML کو ایسی پائپ لائنز کے ذریعے بھیج رہے ہوں جو named entities کو نہ سمجھیں۔ All non-ASCII سخت ASCII-only سسٹمز (پرانے ای میل سرورز، ٹوٹے ہوئے APIs) کو ٹارگٹ کرنے کے لیے استعمال کریں۔

یہ `'` کو `&apos;` کے بجائے `&#39;` کے طور پر کیوں escape کرتا ہے؟

&apos; XML اور HTML5 میں درست ہے، لیکن HTML 4.01 میں نہیں — پرانے براؤزر اسے لفظی متن ' کے طور پر render کرتے ہیں۔ عددی reference &#39; ہر جگہ کام کرتا ہے۔ Decoder مطابقت کے لیے input میں &apos; قبول کرتا ہے۔

کیا emoji اور CJK حروف برقرار رہیں گے؟

ہاں۔ Encoder codepoints پر iterate کرتا ہے (نہ کہ UTF-16 code units)، لہٰذا 🎉 (U+1F389) جیسے emoji انکوڈ ہونے پر &#127881; بن جاتے ہیں اور ڈی کوڈ کے ذریعے درست طور پر round-trip ہوتے ہیں۔ یہی CJK کے لیے بھی ہے (numeric موڈ میں 中文 → &#20013;&#25991;

کیا انکوڈنگ کے بعد user input کو براہ راست HTML میں ایمبیڈ کرنا محفوظ ہے؟

HTML body اور attributes کے لیے — ہاں، Minimal موڈ کے ساتھ۔ URL contexts (href="...") کے لیے آپ کو URL encoding کی بھی ضرورت ہے۔ Inline JavaScript یا CSS کے لیے، نہ HTML اور نہ URL encoding کافی ہے — ایک مناسب templating engine استعمال کریں جو ان contexts کو سمجھتا ہو۔ Unescaped user input کو کبھی <script> بلاک میں paste نہ کریں۔

کیا کچھ آپ کے سرور کو بھیجا جاتا ہے؟

نہیں۔ Encoder، decoder، اور named-entity lookup table سب آپ کے ڈیوائس پر JavaScript میں چلتے ہیں۔ DevTools → Network کھولیں اور آپ کو encode یا decode کے دوران صفر outbound requests نظر آئیں گے۔ راز، گاہک کا ڈیٹا، اندرونی templates پیسٹ کریں — کچھ بھی آپ کے لیپ ٹاپ سے باہر نہیں جاتا۔