unix - recoding of a huge file -
मेरे पास एक बड़ी फ़ाइल है जिसमें निम्न प्रारूप है:
  #pair: 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 # पेयर : 1 2 0 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 # 1: 1 2 1 2 0 0 1    इत्यादि आदि मुझे आशा है कि मैं लिनक्स में कमांड का उपयोग कर सकता हूं, प्रत्येक लाइन को "# पेअर" से शुरू होता है और इसे पिछले 3 कॉलम सीधे इस लाइन को सहारा देते हैं। उदाहरण के लिए:  
  # पेअर: 1 2 1 2 0 0 1    में परिवर्तन:  < पूर्व>  # पेअर: 1 2 1 2 0 0 1    बहुत पहले धन्यवाद!   
 
  Awk के साथ आसान है:  
  awk '/ ^ # pair: / {$ 6 = "\ n" $ 6} 1 'फ़ाइल & gt; नयाफ़ाइल    यह मानता है कि फ़ील्ड गिनती स्थिर है, और  # पेयर के अंत में यह सफेद स्थान है:  लाइन सहनीय है इन दोनों धारणाओं को ठीक करने या आसपास काम करने के लिए मामूली आसान है, लेकिन कोड पठनीयता की कीमत पर। (फ़ील्ड गिनती बदल सकती है, लेकिन आप हमेशा पिछले तीन को बदल सकते हैं, तो  $ (NF-2)  की तरह  $ 6  की तरह कुछ का उपयोग करें। एक सरल  उप जोड़ें ( )  यदि जरूरी हुआ तो रिक्त स्थान को छूने के लिए।)   रिजक्स लाइनों से मेल खाता है जो कि  #pair:  से शुरू होता है और कार्रवाई छठे क्षेत्र से पहले एक नई लाइन को शुरू करने के लिए कहती है।   अकेले  1  मानक आउटपुट के लिए हर इनपुट लाइन को मुद्रित करने के लिए एक अजीब मुहावरा है।   यह  फ़ाइल  पढ़ता है और उसे स्थान देता है आउटपुट  newfile ।   
 
  
Comments
Post a Comment