Sentimentanalys i Excel! Det finns ett gratis tillägg från Microsoft Labs som låter dig göra sentimentanalys i Excel. Vad händer om du måste gå igenom hundratals undersökningskommentarer för att se vad folk tycker om ditt företag? Excel kan tilldela en sannolikhet som visar hur positiv eller negativ varje kommentar är.
Kolla på video
- Det är enkelt att kvantifiera undersökningsdata när det är flervalsfrågor
- Du kan använda en pivottabell för att ta reda på vilken procentandel varje svar har
- Men hur är det med svar i fritt format? Dessa är svåra att bearbeta om du har hundratals eller tusentals sådana.
- Sentimentanalys är en maskinbaserad metod för att förutsäga om ett svar är positivt eller negativt.
- Microsoft erbjuder ett verktyg som gör sentimentanalys i Excel - Azure Machine Learning.
- Traditionell sentimentanalys kräver att en människa analyserar och kategoriserar 5% av uttalandena.
- Traditionell sentimentanalys är inte flexibel - du kommer att bygga om ordboken för varje bransch.
- Excel använder MPQA subjektivitetslexikon (läs om det på http: // bit. Ly / 1SRNevt)
- Denna generiska ordbok innehåller 5097 negativa och 2533 positiva ord
- Varje ord tilldelas en stark eller svag polaritet
- Detta fungerar utmärkt för korta meningar, till exempel tweets eller Facebook-inlägg
- Det kan luras av dubbelnegativa
- För att installera, gå till Infoga, Excel Store, sök efter Azure Machine Learning
- Ange ett inmatningsområde och två tomma kolumner för utdataområdet.
- Rubriken för inmatningsområdet måste matcha schemat: tweet_text
- Ledsagarartikel på: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Videoutskrift
Lär dig Excel från Podcast, avsnitt 2062: Sentimentanalys i Excel
Åh hej, det var en tacksägelsekväll och vi satt runt pumpakakan och Jes, vår vän, började prata om att göra sentimentanalys på Twitter-data. Och jag sa, "Hej, du vet att Excel har ett sätt att göra sentimentanalys." Och jag insåg att jag inte hade en bra video på den här eller någon video på den här, så den här videon handlar om att göra sentimentanalys i Excel.
Nu är den första frågan, vad är det för sentimentanalys? Och om du gör en undersökning av dina kunder och de har ett val med flera val där de kan välja från 1 till 5, ja, det är verkligen, väldigt enkelt att analysera. Du kan bara skapa en liten pivottabell: Infoga pivottabell, befintligt kalkylblad här, klicka på OK. Vi vill veta frågan där eller svaret på frågan, och sedan hur många svar det fanns för var och en, och det ger oss det absoluta antalet. Du kan till och med komma in här och ändra detta från fältinställningar till Visa värden som% av kolumnens totala antal, så.
Okej, så att du kan se för varje svar hur stor andel av folket som får svar. Okej, men sentimentanalys är för när du har ett riktigt långt svar där du säger, "Hej, okej, du vet, berätta varför du gav oss det svaret?" Och de, du vet, använder meningar eller stycken. Om du har hundratals eller tusentals av dessa är det väldigt svårt för någon att gå igenom det och läsa dem alla och ta reda på vad som händer, okej?
Så det finns två olika typer av sentimentanalyser. Tidigare skulle du vanligtvis använda en algoritm för mänsklig övervakning. Så om du hade 5000 svar, gå igenom, du vet, 200 av dessa och välj de positiva och negativa orden och fraserna. Du bygger i huvudsak en ordlista med positiva och negativa ord; men du vet, det här var mycket begränsande. Om du gjorde detta för en plats som gjorde bilreparationer och sedan hade en annan kund, vet du, som gjorde mattrengöring, de två ordböckerna är helt olika. Du måste göra maskininlärning eller den mänskliga övervakningen lär sig om och om och om igen. Så, Excel använder den här saken som kallas MPQA subjektivitetslexikon och du kan gå på Google här. Den har informationen om det - 5097 negativa ord, 2533 positiva ord. Och så,det fungerar bra för korta meningar eller tweets eller Facebook-inlägg. Men en sak som jag har märkt är att om någon skriver i dubbla negativ, kan jag inte säga att jag inte hatar den här funktionen, ja, maskininlärningen kommer att misslyckas där. Och jävla, jag misslyckas. Jag kan inte säga om de är glada eller inte.
Okej, så här är vad vi gör. I Excel 2013 eller Excel 2016 går du till fliken Infoga, går till Store när sökrutan kommer upp sök efter Azure Machine och du får Azure Machine Learning direkt där. Vi klickar på Lägg till. Okej, och två olika verktyg här ute: Titanic Survivor Predictor, vilket är kul; och, Text Sentiment-analys Excel-tillägg. Låt oss använda den. Okej, här är ett par saker som kommer att snubbla upp dig. Din rubrik: Ta ett stycke för att förklara ditt svar. Det måste matcha schemat och schemat säger att rubriken måste säga tweet_text. Så här uppe: tweet_text, naturligtvis, skiftlägeskänsliga frågor, okej. Och stäng sedan schemat och sedan förutsäga, Input: A1 till 100, Min data har rubriker, Output: DataB1, Inkludera rubrikerna. De kommer att ge oss två kolumner.Se till att du har två tomma kolumner där; annars kommer det att åsidosätta data. Du har två val: Några rader i taget eller som en sats. Det här är bara hundra, så det spelar ingen roll. Jag väljer Predict och BAM! Bara så snabbt.
Okej nu, vi får två kolumner: vi får en känsla och en poäng, okej. Så, låt oss representera poängen här som procenttal med en massa decimaler. Okej, så 47,496, detta går från 0 till 100%. Nära 100 är extremt positivt, nära 0 är extremt negativt, okej? Så här har vi en där det finns ett mindre problem, gör mig galen. Hittar inte lösningen, så du kan se varför det rankas som extremt negativt. Låt oss titta på en som kommer upp extremt positiv. Okej, så du vet, så vi har några glada ord här: tack och tack, utropstecken och så vidare. Det kan bidra till den höga poängen. Okej, så är det perfekt? Nej, men det ger dig ett snabbt, snabbt sätt att berätta för dig, du vet, hur många människor som är extremt glada eller extremt negativa med dessa svar.
Och naturligtvis, här, här kan vi göra det med en pivottabell: Infoga, pivottabell, gå till ett befintligt arbetsblad här, klicka på OK, och vi är intresserade av sentimentet, och kanske med den genomsnittliga poängen är för var och en av dessa. Så vi ändrar detta under fältinställningar för att vara ett genomsnitt, klicka på OK. Och så, eller kanske till och med en greve. Jag antar att vi skulle vilja veta greven, hur många människor. Så vi tar ett annat fält, och så vet vi hur många människor som var negativa. Ooh, hur många människor var neutrala, hur många människor var positiva och vad var genomsnittet för var och en av dem.
Okej, så om du har enkätdata och det är ett flerval är det enkelt att använda en pivottabell för att ta reda på hur stor procentandel varje svar har. Men för svar i fritt format är det svårt att bearbeta. Om du har hundratals eller tusentals av dem är sentimentanalys en maskinbaserad metod för att förutsäga om ett svar är positivt eller negativt. Microsoft erbjuder ett gratis verktyg för detta. Fungerar i Excel 2013 eller Excel 2016, kallad Azure Machine Learning. Vanligtvis måste man gå igenom och kategorisera 5% av uttalandena manuellt för hand. Det är inte flexibelt, du måste kategorisera om för varje ny datamängd, men Excel använder detta MPQA-subjektivitetslexikon. Det är en generisk ordbok. Det kommer att fungera för korta meningar, tweets, Facebook-inlägg. Jag kan bli lurad av dubbelnegativa. Så gå bara till Excel Store,sök efter Azure Machine Learning. Ange en ingång och två kolumner för ett utdataområde. Glöm inte att ändra rubriken så att den matchar schemat, tweet_text, i det här fallet.
Okej, så där går du. Nästa gång du har en stor mängd data att analysera, kolla in med Azure Machine Learning, det kostnadsfria tillägget för Excel 2013. Tack för att du stannade förbi, vi ses nästa gång för en ny netcast från.
Nedladdning fil
Ladda ner exempelfilen här: Podcast2062.xlsm