vb.net - encoding issue in Perl -
मेरा उपकरण IO informations:
एक ???? मैं VB.net से फ़ाइल नाम paraText.txt के रूप में उत्पादन पाठ फ़ाइल (.txt) बना रहा हूँ
एक ????
paraText.txt पर्ल के लिए इनपुट फाइल होगी
paraText.txt सामग्री:
गेराड इनरहेल्ब डेर कल्चरहॉरिस्टिज़न बैन्डलुंग एनमैल्ट मर क्ल्टिविंग डर जैइट डच डैन मॉन्शेन अंड डेसेन जैइटब्यूस्ससेसेन एनेन ज़ेंट्रेलन प्लाट्स एं। Unter dem Stichwort der Zeitkultur strebt die kulturhistorische Forschung nach der anthropologischen Erkenntnissuche, Bewusstsein der Mensch von seiner Zeit hat, में आपका स्वागत है! आप के बारे में क्या है डेबी विर्ड सिन्फेलिल, दास सिच जेड कल्लत निक्ट ज़ूलेटज़ट डच इहरेन उमगंग मिट डर जेट एंड डेयरी ग्लिडेरंग प्रॉजेक्ट: मैन अनर्सस्केडेट ज्यूर ¼क्क्लेइजेन्डे एंड बेवॉर्स्टेन्डे, टीइल्स विलक ¼ आरलिच, टीआईएसई डच गेसेल्स्काफ्तालिस बज़व। न्यूटर्जेजेबिन ईिनफ्लोआईसीएसईईएन्टीटिएन एंड नोच ज़ू एवरर्टएंड एरेविग्नस। ईनान ग्रोए? टीली डायरेयर ईराइजिस्कील्चर बिल्डैट एक ???? डेर â ???? Komplex des Festlichen।
समस्या:
एक ???? जब VB.net से आउटपुट txt फ़ाइल बनाते हैं तो मुझे निम्न पाठ मिलती है:
एक ???? पर्ल में डिबगिंग चरण पर उस पाठ को पढ़ते समय मैं पाठ को असम्बद्ध रूप से प्राप्त करता हूं:
आप ऊपर की तस्वीर देख सकते हैं कि पहली पंक्ति को corrctly एन्कोड नहीं किया गया है,
नोट: मैं एक ही .txt का उपयोग करके और बाहर दोनों के लिए लेकिन मैं पढ़ नहीं सकता
मैंने कोशिश की:
एक ???? मैं vb.net से UTF8 एन्कोडिंग का टेक्स्ट फ़ाइल लिखता हूं,
System.Text.Encoding.UTF8
एक ???? मैं निम्नलिखित तरीकों से पर्ल में यूटीएफ 8 एन्कोडिंग का उपयोग भी करता हूं:
उपयोग एन्कोड; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8";
मेरा कोड नमूना:
#! / Usr / bin / perl -w सख्त का उपयोग करें; उपयोग सीडब्ल्यूडी; HTML :: Entities; HTML :: Entities :: numbered; का उपयोग करें; एचटीएमएल :: स्ट्रिप का उपयोग करें; एनकोड का उपयोग करें; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8"; मेरी $ इंडपारा = getcwd ()। "/ ParaText.txt"; खुले (इंडांडा, $ इंडपारा) || मरने "स्थान पर अनदेखी पैराटेक्स्ट नहीं मिला!"; मेरी $ इंडेशिनपेरा = & lt; INDPARA & gt;; $ इंडेशिनपेरा = फिक्स_लिटिन ($ इंडेशिनपेरा); प्रिंट decode_entities ($ indesignPara); बंद करें INDPARA; # I $ indesignPara के लिए मूल्य मिल रहा है जैसा कि ऊपर की छवि में दिखाया गया है, जैसा कि अनुपस्थित पाठ में है कृपया कृपया इसे हल करें
पहले से धन्यवाद
विमल
यदि आप फ़ाइल को सही ढंग से VB पक्ष से बना रहे हैं, तो आपको कुछ भी ठीक करने की आवश्यकता नहीं है पर्ल पक्ष पर इसे केवल यूटीएफ -8 के रूप में पढ़ें:
खुले इंडैडा, '& lt;: utf8', $ इंडपारा या मर ...; उसके बाद, आप जो भी पढ़ते हैं वह जाने के लिए तैयार रहना चाहिए।
Comments
Post a Comment