I förra veckan genomfördes Get Loud på Nalen. Daniel Johansson satt med i en streamingpanel, där en till synes enkel teknikalitet diskuterades, och som Johansson hävdar att vi måste ändra på om vi vill ha en mer rättvis streamingekonomi.
Get Loud på Nalen i Stockholm arrangerades av SAMI i onsdags. Dagen var fylld med olika paneler och presentationer, och jag satt med i en panel betitlad: Streaming Platforms and Responsibility.
Med i panelen var också Bryan Johnson från Spotify, Naomi Pohl från Musicians Union i Storbritannien, och Nick Yule från AEPO-ARTIS som moderator. Intelligenta personer, bra snack, vi hann med rätt mycket, men när man sitter i en sån här panel är det lite svårt att utveckla sina tankar längre och djupare.
Jag tänkte därför ta tillfället i akt att elaborera kring en specifik sak vi diskuterade, hur 30-sekunderströskeln på streamingplattformar skapar oönskade sidoeffekter, och varför det är dags att uppdatera modellen.
Det kan tyckas vara en liten teknisk detalj, men den får stor betydelse för hur royaltypotterna fördelas. Jag tycker inte den har fått tillräckligt mycket uppmärksamhet, framför allt inte i debatten kring rättvis fördelning från streaming.
Den främsta oönskade sidoeffekten är att att genrer med spår som vanligtvis är längre än genomsnittet på DSP-erna, som klassisk musik, jazz, elektronisk experimentell musik, progressiv rock/metal, konstmusik, och andra genrer, missgynnas.
Medan genrer som innehåller spår som vanligtvis är kortare än genomsnittet, pop, hip-hop, latin, afrobeats, EDM, epadunk (för att prata Sverige), har en fördel.
Det är helt enkelt möjligt att spela upp kortare stycken många fler gånger under samma tidsperiod, men eftersom tidsgränsen för vad som räknas som en ersättningsgrundande ström är densamma för alla spår, missgynnas musik som är längre än genomsnittet.
Först, lite bakgrund.
Alla streamingplattformar använder sig alltså av en tröskel där ett spår måste strömmas över 30 sekunder för att få en ekonomisk tick.
Det räcker oftast med en millisekund över 30 sekunder, så länge det är över 30 sekunder blir den specifika uppspelningen en del av uträkningen av fördelningen för den månadens royaltypott, om spåret uppfyller alla andra villkor hos den specifika DSP-n.
Historiskt var det här också gränsen som användes under download-eran, att man kunde lyssna gratis 30 sekunder på en låt, som en provlyssning. Ville man lyssna på hela låten fick man betala styckvis och ladda ned.
När streamingen introducerades i slutet av 00-talet behövde man en tidsgräns som skulle vara praktiskt användbar. Att inkludera varje uppspelning oavsett längd skulle ha genererat massiva datamängder, och hade inneburit att även uppspelningar som startats av misstag, eller som bara var ytterst tillfälliga, hade ingått i royaltyutbetalningarna.
För att undvika att korta provlyssningar och oavsiktliga klick räknades, diskuterade man olika varianter från början: 15 sekunder, 20 sekunder, 40 sekunder, och 30 sekunder blev en slags kompromiss mellan precision och databelastning.
Om en användare lyssnar på en låt under en längre tid än 30 sekunder gjordes bedömningen att det var ”meningen” att användaren faktiskt ville lyssna på låten, jämfört med om man bara sätter igång en låt och stänger av den.
Som IFPI skriver i sin Digital Music Report från 2011, syftet med tröskeln var för att ”distinguish deliberate consumption from sampling or browsing.”
Utifrån ett rättviseperspektiv finns det dock inget som helst forskningsstöd för att 30 sekunder är den bästa tröskeln.
Det finns inga studier som visar att 30 sekunder skulle skapa en mer rättvis streamingekonomi än 29 sekunder, eller 31 sekunder, eller för den delen 27,6 sekunder.
Det här är en godtycklig tröskel som sattes för 17-18 år sedan för att underlätta för DSP-erna, samtidigt som gränsen bedömdes indikera intention från lyssnaren. Det här blev sedan den standard som gjöts i betong av DDEX, och som idag är närmast ett axiom i streamingekonomin.
Sedan dess har det dock genomförts en hel del forskning kring användares lyssningsbeteenden på streamingtjänster. Med resultat som gör att man starkt kan ifrågasätta om det här verkligen är den mest rättvisa metoden.
Den mest intressanta forskningen kommer från forskare som är eller har varit knutna till Spotify.
Montecchio, Roy & Pachet (2019) analyserade vid vilken tidpunkt användare vanligtvis skippade en låt. Artikeln The Skipping Behavior of Users of Music Streaming Services and its Relation to Musical Structure hade egentligen inte målet att diskutera 30-sekunderströskeln, utan ville visa hur skippning kan relateras till låtens strukturella händelser (t ex förändringar i melodi, refräng osv).
Den här forskningen är så klart intressant för alla som skapar musik som man vill ska fungera på streamingplattformar, det finns tydliga bevis för vilken slags händelser i låten som gör att folk skippar, men ur mitt perspektiv är det mycket mer intressant att analysera data utifrån ett strikt tidsperspektiv.
Här två diagram från ovanstående paper, som visar hur det kan se ut för: 1) En individuell låt, och 2) Aggregerade procentsatser för alla låtar som undersöktes på Spotify.
Vi ser en kraftigt fallande kurva, och en rätt kraftig ökning i slutet. Att skip rate ökar i slutet beror naturligtvis på att det ofta kan finnas fadeouts, och att slutet av låtar ibland inte är särskilt superintressanta.
Men, data visar att skips relaterade till misstag, ”browsing”, eller ”sampling”, sker långt, långt tidigare än 30 sekunder. Den branta fasen, 5-12 sekunder, fångar i stort sett alla oavsiktliga starter eller provlyssningar.
Det här känner ni säkert igen, ni väntar inte till 30 sekunder innan ni hoppar över en låt som ni startat av misstag eller bara vill kolla om det är rätt låt, eller något annat.
Det intressanta är att en annan forskare knuten till Spotify, Jonathan Donier, följde upp den här studien 2020, och visade att det här skip-beteendet är stabilt över tid, genre, marknad och enhet.
I artikeln The universality of skipping behaviours on music streaming platforms visar hans analys av Spotifys data att det finns generella psykologiska eller estetiska “trigger points” i låtar.
Han skriver: ”Strikingly, the responses triggered by individual events appears to follow a temporal profile that is consistent across songs, genres, devices and listening contexts, suggesting that people react to musical surprises in a universal way.”
Även här var forskningen inte fokuserad på streamingekonomin per se, och 30-sekunderströskeln, utan handlade mer om att introducera en modell för hur användare skippar låtar generellt.
Meggetto, Revie, Levine & Moshfeghi (2021) försökte dela in användares skip-beteenden i olika kategorier i artikeln On Skipping Behaviour Types in Music Streaming Sessions, och följde sedan upp med artikeln Why People Skip Music? On Predicting Music Skips using DRL (2023), där man utvecklat en modell som kan användas för att förutsäga användares skip-beteende.
Det här är rätt tekniska papers, så jag ska inte störa er mer med det, men sammantaget visar data att det ursprungliga argumentet att 30 sekunder var en bra tröskel för att få bort ”unintended plays” inte stämmer.
Den tröskeln ligger långt, långt tidigare, och är universell för alla genrer.
Ändå har vi byggt upp en hel streamingekonomi på en tröskel som från början var en binär ”bedömning”, lite mellan tummen och pekfingret, och mer kanske en rest från download-ekonomin.
Will Page, tidigare chefsekonom på Spotify bland annat, har de senaste åren vid många tillfällen föreslagit att streamingtjänster borde införa ”completion” som ytterligare en parameter för hur royaltypotterna ska fördelas.
I artikeln A Case for Completion argumenterar han för att när en användare lyssnar klart på hela låten borde det innebära att lyssningen är värd mer, än om man bara skippar efter till exempel 31 sekunder.
Som ni kan se i tidigare diagram sker dock en ganska stor ökning av skips i slutet av låtarna, vilket gör att full ”completion” inte är optimal. Page identifierar också fler nackdelar med den här modellen, som till exempel att bakgrundsmusik i spellistor för folk som ska sova eller göra andra saker kan få en onödigt stor positiv kickback.
Men hans analyser visar ändå att man med relativt enkla medel skulle kunna introducera en modell som är mer rättvis än den nuvarande.
Det finns dock ett annat förslag, som jag är övertygad om skulle skapa en mer rättvis streamingekonomi. Om det nu är det vi vill ha.
En kombination av en mer vetenskapligt grundad binär tröskel för ”unintended plays”, där någonstans kring 10-12 sekunder är en bättre gräns (även om det behövs mer forskning), och att värdet av den specifika uppspelningen sedan styrs av hur stor andel av låten användaren i övrigt strömmar, men framför allt, en användarcentrerad fördelning baserad på hur många sekunder spåret de facto strömmas av användaren.
Varianter på det här har föreslagits av några forskare tidigare, François Moreau, Frederik Juul Jensen, min kollega Ola Haampland på Universitetet i Innlandet, och även av branschorganisationer som ECSA, CISAC och PRS for Music.
I praktiken:
Den nuvarande tröskeln sänks till en vetenskapligt grundad nivå för att hantera misstag, ”browsing”, ”sampling” osv, där det finns tydliga bevis för att det ligger någonstans kring 10-12 sekunder, oberoende av genre, enhet etc. Inte 30 sekunder.
Ovanför den tröskeln är värdet på den specifika uppspelningen avhängig av hur mycket av låten som de facto spelas upp (förutom de sista 3-5 procenten), samt hur många sekunder en specifik ström faktiskt sker.
Men det räcker inte.
Vi kommer inte ifrån att även om vi får en mer empiriskt underbyggd tröskel för ”brusströmmar”, med en modell som gör det mer rättvist för längre låtar, kommer den nuvarande pro rata-modellen fortfarande leda till oönskade effekter. Streamingbedrägerierna kommer till exempel troligen öka ännu mer med en lägre ”bruströskel”.
För att det här ska fungera överhuvudtaget, måste en användarcentrerad fördelningsmodell införas, där varje användares prenumerationspeng fördelas enbart på den musik den lyssnar på. Det är än så länge den enda riktigt bra modellen för att förhindra fulaktörer att stjäla pengar ur de månatliga royaltypotterna.
User-centric var också något som kom upp vid paneldiskussionen på Get Loud. Och Spotify var tydliga, om branschen vill gå över till user-centric kommer de göra det.
Eller som de skriver på Loud & Clear i år:
”We are willing to make the switch to a user-centric model if that’s what artists, songwriters, and rights holders want to do. However, Spotify cannot make this decision on its own; it requires broad industry alignment to implement this change.”
Spotify säger samtidigt att de inte tror att det skulle göra så stor skillnad, men där håller jag inte med. Man hänvisar till en av ett tjugotal studier som har gjorts, och just den studien visar inte på så stora skillnader.
Men många andra studier, och data från de streamingtjänster som faktiskt infört user-centric, Deezer och SoundCloud, visar något helt annat.
30-sekunderströskeln är i min värld förlegad, liksom den nuvarande pro rata-modellen. Visst, det är det enklaste, för alla mellanhänder. Varenda system som ska hantera streamingroyalties bygger på den här modellen, som snart är 20 år gammal.
Men när en modell uppenbarligen har brister, borde vi väl åtminstone anstränga oss lite för att undersöka vad data och forskning faktiskt säger, och se över alternativen?
Jag väljer att sluta där, fokuset för den här krönikan var ju 30-sekunderströskeln, inte user-centric. Det är en minst lika långa krönika det.
Daniel Johansson
daniel@musikindustrin.se