Ben R ile yeni başlayanım ve görevle ilgili yardıma ihtiyacım var. Dput ile kukla veri kümesinin çıktısı (gerçek küme gerçekten büyük):
structure(list(CODE = c(453, 463, 476,
798, 885, 582, 626, 663, 457, 408
), CATEGORY = c("CIG", "BET", "CIG", "CIG", "ARI", "CRR", "ARI", "CIG",
"CIG", "BET"), AMOUNT = c(22, 5, 6, 52, 16, 11, 6, 70, 208, 5),
PRICE = c(5.56, 8.29, 3.89, 3.8, 4.05, 3.99, 3.55, 7.69, 6.75,
5.2), BRAND = c("ROTHMANS", "ALLINO", "MARLBORO", "ROTHMANS", "AURIELO",
"SOLINOS", "CHLEBLO", "MARLBORO", "LD", "SOLINOS"
)), row.names = c(NA, -10L), class = c("tbl_df",
"tbl", "data.frame"))
Yapılması gerekenler: Her markanın payını yüzde olarak gösterecek bir sütun eklenmelidir. İlk önce yaptığım şey bu şekilde yeni bir "DEĞER" sütunu oluşturmak:
df$VALUE <- with(df, AMOUNT*PRICE)
Şimdi sütun payı şu şekilde oluşturulmalıdır: belirli bir kategorideki belirli bir markanın değerlerinin toplamı (sütun DEĞERİNDEN), tüm kategorinin değerlerinin toplamına bölünür. Örneğin," ROTHMANS " CIG kategorisindedir, bunun için değerlerin toplamı 319.92'dir, tüm CIG kategorisinin toplamı 2285,56'dır, dolayısıyla PAY=%14'tür. Ve her durumda hesaplanmalıdır. Dplyr kütüphanesinin uygun olabileceğini düşünüyorum, ancak bir çözüm bulamıyorum.