MusikJakten – B. Analys
I del A skapade ni en stor mängd musik – ni sparade ca 5400 ljud! Dessa är nu analyserade av oss
forskare med avseende på ett antal akustiska och musikaliska egenskaper som är inlagda i
MusikJaktens databas, tillsammans med svaren från frågeformulären. Nu är det er uppgift att undersöka
om det finns några samband mellan dessa egenskaper (eller variabler) och svaren från frågeformulären.
Har de som hållit på mycket med musik gjort annan musik än de som inte gjort det? Skapar trummisar
snabbare musik än icke-trummisar? Ni har möjlighet att titta på alla tänkbara samband i data vi har
samlat in, med hjälp av ett enkelt visualiseringsverktyg. Ni skapar diagram, som visar om det finns
några samband mellan de skapade ljuden och bakgrundsinformationen om ljudskaparna. Ni kan
undersöka hela datamängden eller så väljer ni att titta bara på delar av data genom att filtrera fram de
som svarat på ett visst sätt på frågorna.
Vår ljudanalys har gått till på följande vis:
1. Alla 5400 ljud som ni har skapat har automatiskt sparats ned som tio sekunder långa ljudfiler.
2. Varje ljudfil har analyserats av ett välkänt och ofta använt programpaket för ljudanalys.
Resultatet är en massa olika mätvärden, unika för just det ljudet. Hur stark volymen är, hur
ljudenergin fördelas sig över olika frekvenser i varje ögonblick, hur dissonant det låter, hur
många toner som spelas, var taktslagen ligger, och mycket mer.
3. Vi har tittat på vilka av dessa ljudegenskaper som kan sammanfatta någonting om ljudet i ett
enda mätvärde, och som dessutom är någorlunda lätt att förstå och höra skillnad på. Dessutom
ville vi att de utvalda ljudegenskaperna skulle komplettera varandra så bra som möjligt. Vi
bestämde oss för att använda åtta uppmätta egenskaper för varje ljud. De förklaras lite längre
ner.
4. Dessa mätvärden från varje ljud har sedan laddats in i databasen som innehåller alla ljuden och
era svar från frågeformuläret.
Så varje ljud är alltså redan analyserat, men vi behöver hjälp med att utforska denna datamängd i jakt
på intressanta samband, så kallade korrelationer. Mer om det i nästa avsnitt.
För den som vill veta mer om hur själva ljudanalysen gick till, så kan man läsa mer på hemsidan för det
programpaket vi använt. Det heter Essentia och är utvecklat av ett stort antal forskare över lång tid,
framförallt vid Universitat Pompeu Fabra i Barcelona. De har sammanställt forskning från många olika
håll till ett verktyg som alla kan använda gratis. Här är deras hemsida: http://essentia.upf.edu/
Analyserade ljudegenskaper
Vi har analyserat ljuden med avseende på hundratals egenskaper, men många av dem lämpar sig mer
för att beskriva hur ljudet låter i ett visst ögonblick snarare än över längre tid, och många av
egenskaperna kräver en del tekniska kunskaper för att förstå. Så efter att ha tittat noga på vilka
variabler som varierar, och vilka som har en tydlig koppling till hur det faktiskt låter, har vi valt ut åtta
ljud-egenskaper som ni kan använda i analysen. Nedan förklaras de en och en, med ljudexempel. Alla
exemplen är tagna från musiken ni har skapat!
Dynamisk komplexitet – Hur mycket ljudet varierar i volym över tid. Om det t ex består av starka
trumslag med tystnad emellan så varierar volymen väldigt mycket, och den dynamiska komplexiteten
blir då hög. Här är ett par exempel:
https://clyp.it/iw30auya
https://clyp.it/v5r5euru
Om det i stället består av jämnstark ljud hela tiden så är den dynamiska komplexiteten väldigt låg:
https://clyp.it/nkw0tfaj
Klangligt centrum – Var nånstans i det hörbara frekvensområdet som ljudets tyngdpunkt ligger. Om
det till exempel är väldigt mycket höga frekvenser (diskant) i ljudet så är detta värde högt:
https://clyp.it/aulfk4sg
https://clyp.it/f2w43ysh
Om musiken i stället mest innehåller basfrekvenser så kommer värdet att vara väldigt lågt:
https://clyp.it/vokocobi
Om ljudet består av både höga och låga frekvenser hamnar detta värde någonstans i mitten:
https://clyp.it/qb1ul4bo
Klanglig komplexitet – Hur komplexa de ingående klangerna är, t ex om musiken består av spretiga,
vassa eller brusiga ljud. Förklaras kanske bäst med ett exempel:
https://clyp.it/dionlupv
Värdet blir istället lågt om ljudet är klangligt väldigt simpelt, med renare toner, eller om musiken har
mycket tystnad i sig:
https://clyp.it/z0bcmxpm
https://clyp.it/ktugeqgm
Klanglig variation – Hur mycket klangen varierar över tid. Om det är snabba förändringar i klangfärg
hela tiden blir detta värde högt:
https://clyp.it/3pw1u4hl
https://clyp.it/eqv1a3p2
Om klangfärgen är ungefär likadan hela tiden blir detta värde lågt.
https://clyp.it/lsccqtap
Dissonans – betyder ungefär "missljudande" och är motsats till konsonans, välljudande. Dissonanta
ljud låter alltså inte harmoniska, och skär i örat. Ibland vill man ha dissonanser ändå, så det har inget
med om ljudet är bra eller dåligt att göra. Växling mellan dissonans och konsonans är till exempel en
av de viktigaste estetiska principerna i den klassiska musiken. Uträkning av dissonans-värdet är baserat
ungefär på hur vår hörsel fungerar, och blir alltså ett slags allmänt mått på missljud. Ett exempel på ett
mycket dissonant ljud:
https://clyp.it/04pirxqf
Om värdet är lågt, så låter det snällare och mer harmoniskt för örat:
https://clyp.it/1xalokkv
Tempo – Detta berättar är helt enkelt hur snabbt musiken går, alltså hur fort man stampar takten till
musiken, mätt i taktslag per minut. Två exempel på snabb musik:
https://clyp.it/nfdnxhxi
https://clyp.it/b10luu2m
Exempel på långsam musik:
https://clyp.it/p2e4v340
https://clyp.it/mtnd4lto
Dansbarhet – Hur lätt det är att dansa till musiken, dvs ett slags mått på hur bra rytmerna passar att
röra sig till. Det ligger ganska komplicerade uträkningar bakom, men i princip handlar det om hur
tydliga rytmerna i olika lager i musiken är, och hur väl de stämmer överens med varandra. Man kanske
kan uttrycka det som hur mycket "gung" musiken har. Några exempel på hög dansbarhet:
https://clyp.it/zgc35i2v
https://clyp.it/gluqbpox
https://clyp.it/tnmqicim
Annan musik är svårare att följa med kroppen pga oregelbunden eller oklar rytm, eller långsamt tempo,
och har då alltså en väldigt låg dansbarhet:
https://clyp.it/aedmomls
https://clyp.it/ur0vbkye
Toner per sekund – Helt enkelt hur många toner eller trumslag per sekund som musiken innehåller.
Det blir ett slags mått på intensitet, men är inte samma sak som tempo. Följande exempel har väldigt
många toner, men inte alls särskilt högt tempo - prova att stampa takten så får du se:
https://clyp.it/uy5fclol
Här ett ljud med väldigt få toner eller trumslag per sekund:
https://clyp.it/dmeiykki
Analysdelen
Vi har alltså räknat ut en massa saker för varje ljud, men vi vet lika lite som ni om hur olika
ljudegenskaper varierar i förhållande till er musikaliska bakgrund. Och hur såna samband kan se ut i
olika delmängder av databasen. Det är det ni ska undersöka. Detta gör ni med hjälp av ett
visualiseringsverktyg där ni väljer vilka data ni vill titta på (filtrering) och vilka variabler ni vill
undersöka. Det ser ut så här.
•
Logga in på http://musikjakten.se och klicka på Diagram för att öppna analysverktyget.
Punkt-diagram och korrelationer
Ett ord vi avänder ofta när vi talar om data är variabler – ett mätvärde eller frågesvar som helt enkelt
kan variera, ha olika värde. I vår undersökning är en variabel alla svaren på en viss fråga från
frågeformuläret, eller alla resultaten för en egenskap från ljudanalysen.
Varje variabel har många olika svar eller mätvärden. Ni spelar inte samma instrument allihop. Ni har
spelat olika många år. Ni tycker olika mycket om att lyssna på musik. Och alla era sparade ljud är
väldigt olika och har olika egenskaper, som avspeglas i de mätvärden från ljudanalysen som vi har lagt
in i databasen.
Variabler kan variera enligt vissa mönster i förhållande till varandra. Ibland finns det inget samband,
men ibland så sammanfaller ett högt värde på en variabel med ett högt värde på en annan. De varierar
på ett tydligt sätt i förhållande till varandra. Man talar då om en så kallad korrelation.
Till exempel så har äldre personer ofta fler års utbildning än yngre personer. Det kan tyckas vara
ganska naturligt - det har ju hunnit studera mer. Men alla studerar inte så länge, så det gäller inte alla.
Men i genomsnitt så har gissningsvis äldre människor mer utbildning. Alltså finns alltså en korrelation
mellan ålder och utbildning.
När det är varmare ute säljs det mer glass. Det finns alltså antagligen en korrelation mellan temperatur
och glassförsäljning.
För att hitta korrelationer använder vi ett enda enkelt verktyg - ett punktdiagram (på engelska: scatter
plot):
Det fungerar så här:
•
Du väljer vilken variabel som skall användas som X-koordinat (horisontellt), och vilken som
ska användas som Y-koordinat (vertikalt).
•
För varje ljud i mängden du analyserar (se "filtrering" ovan) så ritas en punkt, baserat på de
variabler du har valt.
•
Du kan välja nästan vilka variabler som helst för X och Y.
•
Om mängden av alla punkter lutar åt vänster eller höger, så finns det en korrelation mellan de
variabler du har valt. Om det bara är ett moln av punkter utan struktur, så finns det antagligen
ingen korrelation.
Här är en tydlig illustration på punktdiagram med mer eller mindre tydliga korrelationer:
Illustrationen är lånad från https://www.mathsisfun.com/data/correlation.html
I "riktig" statistik kan man inte bara se att det finns en korrelation (genom att titta på om punktmängden
lutar åt något håll). Man kan också räkna ut hur stark korrelationen är. Det är det som visas under
diagrammen ovan. Vi har dock valt att inte gå in på det i MusikJakten, för matematiken bakom är
ganska komplicerad. Vi kan nöja oss med att konstatera att man talar om en positiv korrelation om låga
värden på den ena variabeln sammanfaller med låga värden på den andra, och höga med höga. Man
talar om negativ korrelation om det är tvärtom, alltså om den ena variabeln sjunker när den andra stiger.
Det finns också andra typer av korrelationer där sambandet inte är så enkelt, men vi överlåter detta åt
era matematiklärare. Det är ingenting ni behöver för MusikJakten.
Det är viktigt att skilja mellan korrelation (att två variabler varierar tillsammans) och kausalitet (att
något orsakar något annat). En korrelation säger ingenting om att det skulle finnas ett orsakssamband
mellan variablerna. Säg att det finns en positiv korrelation mellan att vara rik och att vara lycklig.
Rikare människor är i så fall också lyckligare. Men det är inte säkert att rikedomen orsakar lyckan. Det
kan lika gärna vara tvärtom – att man blivit rik för att man är lycklig, eller att någonting annat har
orsakat båda två. Till exempel kan det vara så att ens sociala bakgrund orsakar både rikedom och lycka,
eller brist på båda två.
Kategori-variabler
Vissa data som vi samlat in är ju inte kontinuerligt varierande värden, utan kanske består av "ja" eller
"nej", vilket instrument man spelat eller ett av tre eller fem svarsalternativ på en fråga. Här handlar det
mer om kategorier, men man kan ändå leta efter samband mellan dessa kategori-svar och mätvärden
från ljudanalysen. Dessa variabler går också att välja för diagrammen, och kategorierna omvandlas då
till koordinater så att man kan se variationer mellan de som svarat si eller de som svarat så. Kanske
finns det en koppling mellan hur komplexa ljuden är och om den som gjort det ofta använder dator för
att skapa musik, och därmed är ganska van vid komplexa syntetiska klanger? Då ser man en skillnad i
var punktmängderna ritas för varje kategori.
Eftersom punkter kan ligga på varandra om de har samma värden, vilket är svårt eller omöjligt att se, så
sprider vi ut punkterna lite i sidled, så att det i stället visas som ett punkt-moln. Ju fler punkter, desto
tätare moln. Detta gör att du lättare kan se hur punkterna fördelar sig.
Ett par exempel:
Om båda axlarna har kategori-variabler blir det rektangulära punktmoln:
Här följer några exempel på tänkbara korrelationer att undersöka:
•
Antal år av musikalisk träning - Komplexiteten i musiken
•
Lyssna på musik är mitt största intresse - Hur mycket lyssnar du på musik?
•
Det kan också vara intressant att titta på korrelationer mellan akustiska egenskaper och försöka
säga något om hur de förhåller sig till varandra. Prova till exemepel att lägga dissonans på Xaxeln och klanglig komplexitet på Y-axeln. Varför ser det ut som det gör, tror ni? Eller
Dynamisk komplexitet mot toner per sekund. Fundera över varför inte båda kan ha ett högt
värde samtidigt?
•
Lyssningstid - musikintresse
• Lyssningstid - musikletningsgrad
De två sista exemplen har variabler från frågeformuläret på båda axlar. Kom då ihåg att varje prick
motsvarar ett ljud som sparas av en elev som har svarat just så, inte en prick per elev. Så om en elev
har sparat många ljud blir det många prickar. Detta kan göra att diagrammen är lite mer svårtolkade.
Filtrering
Ett sätt att analysera data är att titta på mindre delmängder, genom att till exempel filtrera fram alla ljud
skapade av de som spelat något instrument, eller de som aldrig gjort det. Då begränsas analysen
(diagrammet) till att bara visa resultet från ett mindre antal ljud. Eftersom hela databasen består av ca
5000 ljud skapade av mer än 500 elever, så kan det vara bra att titta på mindre delar. Det kan vara
lättare att hitta samband då.
Exempel på filtreringar:
• Alla som har spelat ett instrument någon gång i sitt liv.
•
•
•
Alla som spelar tuba.
Alla ljud som har ett tempo över 120 slag per minut
Alla som aldrig har spelat ett instrument, men som ändå tycker mycket om att lyssna på musik
Gör så här för att filtrera datamängden:
1. Till vänster, klicka på den variabel du vill filtrera baserat på.
2. Då visas en regel med två spakar, en för det minimum och en för maximum. De bestämmer
tillsammans vilka värden på just den variabeln som ska tas med i diagrammet. Alla ljud som har
ett värde mellan dessa två värden kommer alltså att tas med.
3. För frågor som inte har numeriska svar, som t ex kön eller ja/nej-frågor så klickar du bara på det
svar du vill ska tas med i analysen. Alla ljud gjorda av elever som svarat just så tas då med i
diagrammet.
4. För frågor om instrument så kan du klicka på flera instrument i listan. De ljus skapade av någon
som svarat något av de instrumenten på den frågan tas med i diagrammet.
5. Klicka på Tillämpa filter för att filtret ska aktiveras.
Dessutom:
•
Du kan ha flera filter samtidigt. Då måste ljudet uppfylla alla filtreringskraven. Ju fler filter,
desto färre punkter blir det i diagrammet.
•
Ta bort ett filter genom att klicka på krysset bredvid det.
Ett exempel på filtrering:
I denna filtrering inkluderas alla som ofta går på konserter,
spelar piano/elpiano och håller på med datormusik.
Spara diagram
Om du klickar på Ladda ned diagram så sparas det som en bildfil i standardformatet PNG (Portable
Network Graphics), som går att använda i de flesta ordbehandlings- och layoutprogram.
Det finns två kända buggar relaterade till detta just nu:
OBS! Ladda ned-funktionen verkar vara buggig i Firefox just nu. Vi fixar det så snart vi kan! Hittar
ni något intressant, skriv upp hur ni gjorde diagrammet (variabelval och filtrering) så kan ni
återskapa det när vi fixat buggen. Eller ta en skärmdump och klipp ut diagrammet från den.
OBS! När du laddar ner ett diagram så återställts alla filter och variabelval för diagrammet. Det ska
inte vara så, och vi fixar det så fort vi kan.
Finns det något samband?
Undersök datan och försöka hitta korrelationer mellan olika variabler. Vi vet lika lite som ni om sådana
finns, och var de i så fall finns. Pröva olika variabler mot varandra tills du hittar något. Detta kan du
göra systematiskt, dvs du prövar varje variabel mot varje annan variabel, vilket tar väldigt lång tid.
Eller så baserar du ditt letande på något antagande – alltså en kvalificerad gissning om var det skulle
kunna finnas korrelationer, baserat på hur du själv tänker kring musik. Flera sådana tänkbara
korrelationer är nämnda i texten ovan, men du kan säkert komma på fler. Glöm inte att du kan filtrera
data så att du tittar på bara en liten grupp av alla ljud. Det kan göra det lättare att hitta korrelationer.
Men om du filtrerar så hårt att bara några få datapunkter återstår så kan du inte dra några starkare
slutsatser. Så det är en avvägning.
Skriv ner dina resultat, så att du minns vad du gjort:
•
Skriv ned vad du gjort som inte ledde till att du fann några samband (det är på sätt och vis också
ett resultat).
•
När du finner något intressant, skriv ned exakt hur du gjorde diagrammet och vad du fann, så att
du kan skriva om det på postern, och spara diagrammet så att du kan ha med det också på
postern.
•
Uppskatta om det är en stark eller svag korrelation, och åt vilket håll den går. Jämför med
exempeldiagrammen i avsnittet om korrelation ovan.
De resultat ni hittar och tar med i era postrar kommer vi att titta på och undersöka närmare, så ni
hjälper verkligen oss genom att undersöka data på alla möjlig sätt.