क्या करें जब डेटा स्ट्रिंग एनए/एनडी को पांडा में गुम मान के रूप में पहचाना नहीं जाता है

2018 12 年 月 日 5

पांडा में लापता मूल्य

प्रायोगिक डेटासेट आदि में, रिक्त स्थान को NA, NA (विश्लेषण नहीं किया गया) या ND, ND (पता नहीं लगाया गया) से भरा जा सकता है। पांडा में, एनए और एनडी को केवल स्ट्रिंग्स (ऑब्जेक्ट्स) के रूप में पहचाना जाता है, इसलिए ड्रापना (), फिलना (), और इस्नुल () फ़ंक्शन का उपयोग करके अनुपलब्ध मानों को संसाधित करना संभव नहीं है। ।

निम्नलिखित को पांडा में लापता मान के रूप में पहचाना जाता है:

  • NaN
  • कोई नहीं
  • एनपी.नेन
  • गणित.नेन

तार NA और ND को उपरोक्त में से किसी एक में परिवर्तित किया जाना चाहिए।

एनए और एनडी के लिए प्रसंस्करण

NA, ND और NaN युक्त नमूना डेटा बनाएँ।

[1] में: np आयात के रूप में numpy pd df = pd.DataFrame के रूप में पांडा आयात करें ({'A': [ 1, 'एनडी', 2, 3], 'बी': [4, 'एनए', 5, 6 ], 'सी': [7, 'एनडी', कोई नहीं, एनपी.नान]}) आउट[1] एबीसी 0 1 4 7 1 एनडी एनए एनडी 2 2 5 नैन 3 3 5 नैन

नहींne और np.nan को पहचाना जाता है और लापता मानों के रूप में गिना जाता है, लेकिन ND और NA गलत हैं।
isnull (): मान गुम होने पर सही लौटाता है
isnull.sum (): कुल लापता मान

[2] में: df.isnull () आउट [2]: ए बी सी 0 झूठा झूठा झूठा 1 झूठा झूठा 2 झूठा झूठा सच्चा 3 झूठा झूठा सच [3]: df.isnull ()। योग () बाहर [3] : ए 0 बी 0 सी 2 डी प्रकार: int64

स्ट्रिंग ND को रिप्लेस फंक्शन से बदलें

[4] में: df = df.replace ('ND', np.nan) आउट [4]: ​​A B C 0 1 4 7 1 NaN NA NaN 2 2 5 NaN 3 3 5 NaN

isnull() और fillna() अब लागू किया जा सकता है।

[5] में: df.isnull () आउट [5]: ए बी सी 0 फाल्स फाल्स फाल्स 1 ट्रू फाल्स ट्रू 2 फाल्स फाल्स ट्रू 3 फेल्ड फाल्स ट्रू इन [6]: df.isnull().sum() आउट [6] : A 2 B 0 C 2 dtype: int64 In [7]: df.fillna(10) Out[7]: A B C 0 1 4 7 1 10 NA 10 2 2 5 10 3 3 5 10