क्या करें जब डेटा स्ट्रिंग एनए/एनडी को पांडा में गुम मान के रूप में पहचाना नहीं जाता है
पांडा में लापता मूल्य
प्रायोगिक डेटासेट आदि में, रिक्त स्थान को NA, NA (विश्लेषण नहीं किया गया) या ND, ND (पता नहीं लगाया गया) से भरा जा सकता है। पांडा में, एनए और एनडी को केवल स्ट्रिंग्स (ऑब्जेक्ट्स) के रूप में पहचाना जाता है, इसलिए ड्रापना (), फिलना (), और इस्नुल () फ़ंक्शन का उपयोग करके अनुपलब्ध मानों को संसाधित करना संभव नहीं है। ।
निम्नलिखित को पांडा में लापता मान के रूप में पहचाना जाता है:
- NaN
- कोई नहीं
- एनपी.नेन
- गणित.नेन
तार NA और ND को उपरोक्त में से किसी एक में परिवर्तित किया जाना चाहिए।
एनए और एनडी के लिए प्रसंस्करण
NA, ND और NaN युक्त नमूना डेटा बनाएँ।
[1] में: np आयात के रूप में numpy pd df = pd.DataFrame के रूप में पांडा आयात करें ({'A': [ 1, 'एनडी', 2, 3], 'बी': [4, 'एनए', 5, 6 ], 'सी': [7, 'एनडी', कोई नहीं, एनपी.नान]}) आउट[1] एबीसी 0 1 4 7 1 एनडी एनए एनडी 2 2 5 नैन 3 3 5 नैन
नहींne और np.nan को पहचाना जाता है और लापता मानों के रूप में गिना जाता है, लेकिन ND और NA गलत हैं।
isnull (): मान गुम होने पर सही लौटाता है
isnull.sum (): कुल लापता मान
[2] में: df.isnull () आउट [2]: ए बी सी 0 झूठा झूठा झूठा 1 झूठा झूठा 2 झूठा झूठा सच्चा 3 झूठा झूठा सच [3]: df.isnull ()। योग () बाहर [3] : ए 0 बी 0 सी 2 डी प्रकार: int64
स्ट्रिंग ND को रिप्लेस फंक्शन से बदलें
[4] में: df = df.replace ('ND', np.nan) आउट [4]: A B C 0 1 4 7 1 NaN NA NaN 2 2 5 NaN 3 3 5 NaN
isnull() और fillna() अब लागू किया जा सकता है।
[5] में: df.isnull () आउट [5]: ए बी सी 0 फाल्स फाल्स फाल्स 1 ट्रू फाल्स ट्रू 2 फाल्स फाल्स ट्रू 3 फेल्ड फाल्स ट्रू इन [6]: df.isnull().sum() आउट [6] : A 2 B 0 C 2 dtype: int64 In [7]: df.fillna(10) Out[7]: A B C 0 1 4 7 1 10 NA 10 2 2 5 10 3 3 5 10
विचार-विमर्श
टिप्पणियों की सूची
अभी तक कोई टिप्पणी नहीं है