vb.net - encoding issue in Perl -


मेरा उपकरण IO informations:

एक ???? मैं VB.net से फ़ाइल नाम paraText.txt के रूप में उत्पादन पाठ फ़ाइल (.txt) बना रहा हूँ

एक ???? paraText.txt पर्ल के लिए इनपुट फाइल होगी


paraText.txt सामग्री:

गेराड इनरहेल्ब डेर कल्चरहॉरिस्टिज़न बैन्डलुंग एनमैल्ट मर क्ल्टिविंग डर जैइट डच डैन मॉन्शेन अंड डेसेन जैइटब्यूस्ससेसेन एनेन ज़ेंट्रेलन प्लाट्स एं। Unter dem Stichwort der Zeitkultur strebt die kulturhistorische Forschung nach der anthropologischen Erkenntnissuche, Bewusstsein der Mensch von seiner Zeit hat, में आपका स्वागत है! आप के बारे में क्या है डेबी विर्ड सिन्फेलिल, दास सिच जेड कल्लत निक्ट ज़ूलेटज़ट डच इहरेन उमगंग मिट डर जेट एंड डेयरी ग्लिडेरंग प्रॉजेक्ट: मैन अनर्सस्केडेट ज्यूर ¼क्क्लेइजेन्डे एंड बेवॉर्स्टेन्डे, टीइल्स विलक ¼ आरलिच, टीआईएसई डच गेसेल्स्काफ्तालिस बज़व। न्यूटर्जेजेबिन ईिनफ्लोआईसीएसईईएन्टीटिएन एंड नोच ज़ू एवरर्टएंड एरेविग्नस। ईनान ग्रोए? टीली डायरेयर ईराइजिस्कील्चर बिल्डैट एक ???? डेर â ???? Komplex des Festlichen।


समस्या:

एक ???? जब VB.net से आउटपुट txt फ़ाइल बनाते हैं तो मुझे निम्न पाठ मिलती है:

छवि विवरण दर्ज करें यहां

एक ???? पर्ल में डिबगिंग चरण पर उस पाठ को पढ़ते समय मैं पाठ को असम्बद्ध रूप से प्राप्त करता हूं:

छवि विवरण दर्ज करें यहाँ

आप ऊपर की तस्वीर देख सकते हैं कि पहली पंक्ति को corrctly एन्कोड नहीं किया गया है,

नोट: मैं एक ही .txt का उपयोग करके और बाहर दोनों के लिए लेकिन मैं पढ़ नहीं सकता

मैंने कोशिश की:

एक ???? मैं vb.net से UTF8 एन्कोडिंग का टेक्स्ट फ़ाइल लिखता हूं,

System.Text.Encoding.UTF8

एक ???? मैं निम्नलिखित तरीकों से पर्ल में यूटीएफ 8 एन्कोडिंग का उपयोग भी करता हूं:

  उपयोग एन्कोड; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8";    

मेरा कोड नमूना:

  #! / Usr / bin / perl -w सख्त का उपयोग करें; उपयोग सीडब्ल्यूडी; HTML :: Entities; HTML :: Entities :: numbered; का उपयोग करें; एचटीएमएल :: स्ट्रिप का उपयोग करें; एनकोड का उपयोग करें; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8"; मेरी $ इंडपारा = getcwd ()। "/ ParaText.txt"; खुले (इंडांडा, $ इंडपारा) || मरने "स्थान पर अनदेखी पैराटेक्स्ट नहीं मिला!"; मेरी $ इंडेशिनपेरा = & lt; INDPARA & gt;; $ इंडेशिनपेरा = फिक्स_लिटिन ($ इंडेशिनपेरा); प्रिंट decode_entities ($ indesignPara); बंद करें INDPARA; # I $ indesignPara के लिए मूल्य मिल रहा है जैसा कि ऊपर की छवि में दिखाया गया है, जैसा कि अनुपस्थित पाठ में है   

कृपया कृपया इसे हल करें

पहले से धन्यवाद

विमल

यदि आप फ़ाइल को सही ढंग से VB पक्ष से बना रहे हैं, तो आपको कुछ भी ठीक करने की आवश्यकता नहीं है पर्ल पक्ष पर इसे केवल यूटीएफ -8 के रूप में पढ़ें:

  खुले इंडैडा, '& lt;: utf8', $ इंडपारा या मर ...;   

उसके बाद, आप जो भी पढ़ते हैं वह जाने के लिए तैयार रहना चाहिए।

Comments

Popular posts from this blog

python - Writing Greek in matplotlib labels, titles -

c# - LINQ to Entities does not recognize the method 'Int32 IndexOf(System.String, System.StringComparison)' method -

Pygame memory leak with transform.flip -