vb.net - encoding issue in Perl -


मेरा उपकरण IO informations:

एक ???? मैं VB.net से फ़ाइल नाम paraText.txt के रूप में उत्पादन पाठ फ़ाइल (.txt) बना रहा हूँ

एक ???? paraText.txt पर्ल के लिए इनपुट फाइल होगी


paraText.txt सामग्री:

गेराड इनरहेल्ब डेर कल्चरहॉरिस्टिज़न बैन्डलुंग एनमैल्ट मर क्ल्टिविंग डर जैइट डच डैन मॉन्शेन अंड डेसेन जैइटब्यूस्ससेसेन एनेन ज़ेंट्रेलन प्लाट्स एं। Unter dem Stichwort der Zeitkultur strebt die kulturhistorische Forschung nach der anthropologischen Erkenntnissuche, Bewusstsein der Mensch von seiner Zeit hat, में आपका स्वागत है! आप के बारे में क्या है डेबी विर्ड सिन्फेलिल, दास सिच जेड कल्लत निक्ट ज़ूलेटज़ट डच इहरेन उमगंग मिट डर जेट एंड डेयरी ग्लिडेरंग प्रॉजेक्ट: मैन अनर्सस्केडेट ज्यूर ¼क्क्लेइजेन्डे एंड बेवॉर्स्टेन्डे, टीइल्स विलक ¼ आरलिच, टीआईएसई डच गेसेल्स्काफ्तालिस बज़व। न्यूटर्जेजेबिन ईिनफ्लोआईसीएसईईएन्टीटिएन एंड नोच ज़ू एवरर्टएंड एरेविग्नस। ईनान ग्रोए? टीली डायरेयर ईराइजिस्कील्चर बिल्डैट एक ???? डेर â ???? Komplex des Festlichen।


समस्या:

एक ???? जब VB.net से आउटपुट txt फ़ाइल बनाते हैं तो मुझे निम्न पाठ मिलती है:

छवि विवरण दर्ज करें यहां

एक ???? पर्ल में डिबगिंग चरण पर उस पाठ को पढ़ते समय मैं पाठ को असम्बद्ध रूप से प्राप्त करता हूं:

छवि विवरण दर्ज करें यहाँ

आप ऊपर की तस्वीर देख सकते हैं कि पहली पंक्ति को corrctly एन्कोड नहीं किया गया है,

नोट: मैं एक ही .txt का उपयोग करके और बाहर दोनों के लिए लेकिन मैं पढ़ नहीं सकता

मैंने कोशिश की:

एक ???? मैं vb.net से UTF8 एन्कोडिंग का टेक्स्ट फ़ाइल लिखता हूं,

System.Text.Encoding.UTF8

एक ???? मैं निम्नलिखित तरीकों से पर्ल में यूटीएफ 8 एन्कोडिंग का उपयोग भी करता हूं:

  उपयोग एन्कोड; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8";    

मेरा कोड नमूना:

  #! / Usr / bin / perl -w सख्त का उपयोग करें; उपयोग सीडब्ल्यूडी; HTML :: Entities; HTML :: Entities :: numbered; का उपयोग करें; एचटीएमएल :: स्ट्रिप का उपयोग करें; एनकोड का उपयोग करें; उपयोग utf8; ओ ओ ओ = उपयोग करें; ': UTF8'; एन्कोडिंग :: फिक्स लाइटिन क्यूड (फिक्स_लिटिन);; Binmode STDOUT, ": utf8"; बिनमोद एसटीडीईआरआर, ": यूटीएफ 8"; बिनमोद एसटीडीआईएन, ": यूटीएफ 8"; मेरी $ इंडपारा = getcwd ()। "/ ParaText.txt"; खुले (इंडांडा, $ इंडपारा) || मरने "स्थान पर अनदेखी पैराटेक्स्ट नहीं मिला!"; मेरी $ इंडेशिनपेरा = & lt; INDPARA & gt;; $ इंडेशिनपेरा = फिक्स_लिटिन ($ इंडेशिनपेरा); प्रिंट decode_entities ($ indesignPara); बंद करें INDPARA; # I $ indesignPara के लिए मूल्य मिल रहा है जैसा कि ऊपर की छवि में दिखाया गया है, जैसा कि अनुपस्थित पाठ में है   

कृपया कृपया इसे हल करें

पहले से धन्यवाद

विमल

यदि आप फ़ाइल को सही ढंग से VB पक्ष से बना रहे हैं, तो आपको कुछ भी ठीक करने की आवश्यकता नहीं है पर्ल पक्ष पर इसे केवल यूटीएफ -8 के रूप में पढ़ें:

  खुले इंडैडा, '& lt;: utf8', $ इंडपारा या मर ...;   

उसके बाद, आप जो भी पढ़ते हैं वह जाने के लिए तैयार रहना चाहिए।

Comments

Popular posts from this blog

Pass DB Connection parameters to a Kettle a.k.a PDI table Input step dynamically from Excel -

multithreading - PhantomJS-Node in a for Loop -

c++ - MATLAB .m file to .mex file using Matlab Compiler -