Python pandalar modülünde çok yeniyim.
Aşağıdaki gibi bir veri çerçevem veya tablomun olduğunu varsayalım:
df = pd.DataFrame({
'Column A': [12,12,12, 15, 16, 141, 141, 141, 141],
'Column B':['Apple' ,'Apple' ,'Apple' , 'Red', 'Blue', 'Yellow', 'Yellow', 'Yellow', 'Yellow'],
'Column C':[100, 50, np.nan , 23 , np.nan , 199 , np.nan , 1,np.nan]
})
veya aşağıdaki gibi bir veri tablom var:
| Column A | Column B |Column C
----| -------- | ---------|--------
0 | 12 | Apple |100
1 | 12 | Apple |50
2 | 12 | Apple |NaN
3 | 15 | Red |23
4 | 16 | Blue |NaN
5 | 141 | Yellow |199
6 | 141 | Yellow |NaN
7 | 141 | Yellow |1
8 | 141 | Yellow |NaN
A sütunundaki değerler tekrarlanırsa, C Sütununa karşılık gelen değerleri ekleyin ve toplamı yeni D sütununa yapıştırın (Örneğin, 12 için 3 satır vardır, bu nedenle karşılık gelen değerleri 100 + 50 + NaN eklemeliyiz ve toplam sonuç 150 yeni D sütununda saklanmalıdır).
A sütunundaki değerler yeni D sütununa (3.satır gibi) doğrudan C Sütun değerlerini yapıştırmayı yinelemiyorsa, ancak NaN için 0 (4. satır gibi) olmalıdır.
Python jupyter not defterinde böyle bir çıktı almama yardım eder misiniz:
| Column A | Column B |Column C |Column D
----- | -------- | ---------|---------|---------
0 | 12 | Apple |100 |150
1 | 15 | Red |23 |23
2 | 16 | Blue |NaN |0
3 | 141 | Yellow |199 |200