df.groupby(['target']).count()
Hedef | veri |
---|---|
Olumsuz | 103210 |
Olumlu | 211082 |
Şu anda olumlu verilerim çok büyük. Değeri olan satırların %50'sini silmek istiyorum Target
sütun şu şekildedir Positive
. Bunu nasıl yapabilirim?
df.groupby(['target']).count()
Hedef | veri |
---|---|
Olumsuz | 103210 |
Olumlu | 211082 |
Şu anda olumlu verilerim çok büyük. Değeri olan satırların %50'sini silmek istiyorum Target
sütun şu şekildedir Positive
. Bunu nasıl yapabilirim?
Yarısını tutmak için Positive
satırlar, sample
Bu %50 Positive
kullanarak satırlar frac=0.5
vedrop
bu dizinler:
indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)
Tam olarak 100K tutmak için Positive
satırlar, sample
100K Positive
kullanarak satırlar n=100_000
veconcat
onlarla birlikte Negative
satırlar:
df = pd.concat([
df[df.target == 'Negative'],
df[df.target == 'Positive'].sample(n=100_000)
])