tag:blogger.com,1999:blog-7373419682782483177.post4899963552322415095..comments2011-09-04T05:02:37.748-07:00Comments on 49swe - Aspelunds utvecklarblogg: Testning av en klusteralgoritmUnknownnoreply@blogger.comBlogger1125tag:blogger.com,1999:blog-7373419682782483177.post-26457571146316065232011-09-04T05:02:37.748-07:002011-09-04T05:02:37.748-07:00Tack för detta Mattias! Kruxet för mig är att jag ...Tack för detta Mattias! Kruxet för mig är att jag gjort som James W Pennebaker (www.liwc.net) vid utvecklandet av metodiken, dvs jag har ingen förutbestämd sak att förutspå som gör det lätt att kolla om det blivit "rätt". Ta tex om du har data på kön och ålder från bloggare (som de själva skrivit in) och sedan använder texter från dem för att träna upp en klassificerare, då kan du ju testa på andra texter där du ka ta reda på åldern.<br /><br />Jag tänker mig att utmaningen är att hitta tex omnämnanden av X är BETYDLIGT vanligare i kategori Y, etc - dvs det handlar i så fall om att förutspå attention/intresse snarare än att beskriva kvaliteter hos individen.<br /><br />Har du några tankar kring hur detta kan göras?Mattias Östmarhttps://www.blogger.com/profile/16144744584311351869noreply@blogger.com