Com es construeix el top de TopQuaranta

Els rànquings són decisions disfressades de números. Aquest és el nostre compromís de no esconder-les.

1 · D'on surt la música que comptem

Cada nit, a les sis del matí, el sistema consulta Last.fm — una plataforma on milions de persones del món senyalen què escolten — i demana quants cops s'ha reproduït cada cançó del nostre catàleg durant l'últim dia. Això ens dona dues xifres per cançó: el total acumulat (playcount) i el nombre de persones úniques que l'han escoltada (listeners).

El catàleg no és qualsevol música. Una cançó hi entra només si es compleixen tres condicions:

  • L'artista és aprovat per l'equip de TopQuaranta — hi ha una revisió humana perquè els algorismes automàtics s'equivoquen amb coses com el K-pop o el metal anglosaxó.
  • La cançó és verificada: algú del nostre equip ha confirmat que és en català i correspon realment a l'artista.
  • Té menys de dotze mesos. TopQuaranta no és un museu; mira què sona ara.
Detall tècnic: com detectem que Last.fm ens ha corregit

Last.fm fa auto-correcció: si li demanes una cançó amb un nom lleugerament equivocat, ell "endevina" la que creu que volies. Això ha provocat durant temps que acumulàssim playcounts d'artistes diferents del que crèiem. Des del 2026-04, cada resposta inclou comprovacions de similitud (normalitzant accents, apòstrofs i anotacions com "(Remaster 2015)") i marca les divergències perquè el nostre equip les revisi.

2 · Del playcount brut a l'score

Una cançó amb 10.000 reproduccions diàries no és "deu vegades millor" que una amb 1.000. Les distribucions són molt sesgades — unes poques cançons concentren la majoria dels listens — i comparar-les directament enterraria tota la diversitat del panorama.

Per això, cada dia, convertim els playcounts en una posició relativa: una xifra de 0 a 100 que respon a la pregunta "quina fracció del catàleg té menys reproduccions que aquesta cançó". Si avui la teva cançó ha tingut més reproduccions que el 75% de les cançons del catàleg, el seu score_entrada per aquell dia és 75.

Aquesta normalització és la clau perquè cançons de gèneres i públics molt diferents puguin coexistir a un mateix top. Una cançó minoritària amb el seu públic dedicat pot competir amb un hit generalista sense que els números enterrin la primera.

3 · De la cançó a la setmana

Tenir un score diari no és suficient per fer un rànquing setmanal decent. Cada dissabte al matí recollim els scores dels últims set dies i els combinem amb una fórmula que:

  • Prioritza la música viva sobre l'antiga: una cançó llançada fa dues setmanes competeix en millors condicions que una d'onze mesos.
  • Castiga les caigudes: si una cançó ha perdut molta tracció respecte de la setmana passada, la fórmula s'ho nota.
  • Limita els monopolis: si un mateix àlbum o artista acaparen massa posicions del top 40, cada cançó addicional seva rep una rebaixa proporcional. La idea és senzilla — un top 40 amb cinc cançons d'un sol disc no reflecteix què està sonant.
  • Té memòria: les cançons que portin molt de temps a les posicions més altes comencen a perdre gravetat. Els primers llocs són per a la música que empeny, no per als estàndards.
  • Protegeix les novetats: una cançó acabada de sortir no pot competir en dades amb una que ja porta sis mesos acumulant reproduccions. Els primers dies reben un petit ajust a favor.

Cada peça d'aquest conjunt té un nombre que la quantifica. Aquests nombres els pots veure — i canviar — tots just aquí:

4 · Els coeficients actuals

Aquests són els 14 paràmetres que governen la fórmula setmanal, tal com estan configurats en aquest mateix moment. Canvien quan l'equip decideix afinar alguna cosa — i cada canvi queda registrat aquí al costat.

NomValorDescripció
Penalització per caiguda
penalitzacio_descens
0,025 Quan una cançó perd posicions respecte de la setmana passada, aquest valor decideix com de dur és el cop. Més alt = més càstig quan una cançó s'enfonsa a la llista.
Exponent d'antiguitat
exponent_penalitzacio_antiguitat
2,50 Controla com de ràpidament perden força les cançons antigues. Els singles de fa 11 mesos desapareixen del top molt més amunt d'aquest exponent que amb un valor baix — el top és per a música viva, no per a canons.
Factor A màxim (fase de posicionament)
max_factor_a
1,00 El primer multiplicador que s'aplica al signal brut. Posa un sostre a la primera ronda del càlcul perquè les cançons amb xifres extremes no arrosseguin tot el top.
Factor B màxim (fase de monopolis)
max_factor_b
1,00 Sostre del segon multiplicador. Intervé quan s'aplica la penalització per monopoli — si un àlbum o un artista es cruspeixen massa cançons del top.
Factor C màxim (fase de novetats)
max_factor_c
1,00 Sostre del tercer multiplicador. Protegeix les cançons noves que encara no han acumulat història perquè no quedin infravalorades pel càlcul.
Factor final màxim
max_factor_final
1,50 El sostre global de la fórmula. Evita que cap cançó pugui dominar els rànquings amb un score desmesurat.
Penalització per àlbum
penalitzacio_album_per_canco
0,250 Si un mateix àlbum té tres, quatre o més cançons al top, aquest valor redueix el score de cada una addicional. La idea: un top 40 on només sonen dos àlbums no és un top.
Penalització per artista
penalitzacio_artista_per_canco
0,200 Mateixa lògica que l'anterior, però aplicada a l'artista en comptes de l'àlbum. Si un artista acumula massa cançons al top, cada una de més pateix una petita rebaixa.
Penalització per alta posició
coeficient_penalitzacio_top
0,075 Les cançons que portin moltes setmanes al top 3 o top 5 reben una penalització creixent perquè no es perpetuïn indefinidament al capdamunt. Els hits no són eterns.
Penalització setmana 0 (acabada de sortir)
penalitzacio_setmana_0
0,100 Una cançó que ha sortit aquesta mateixa setmana encara no té un signal representatiu de Last.fm. Aquest valor corre el benefici del dubte: alt = costa molt entrar al top la setmana de l'estrena.
Penalització setmana 1
penalitzacio_setmana_1
0,050 Igual que l'anterior però per cançons de la segona setmana. Normalment més baix que setmana 0.
Penalització setmana 2
penalitzacio_setmana_2
0,000 A partir de la tercera setmana habitualment ja no cal ajustar res; aquest valor pot ser zero si l'entrada ja té prou dades.
Factor de suavitat
suavitat
5,00 Quan més alt, els canvis de posició entre setmana i setmana són més lents — un top més estable. Més baix = el top es mou setmana a setmana amb més agressivitat.
Llindar per a ranquing propi
min_cancons_ranking_propi
20 Un territori (diguem-ne l'Alguer o la Franja) només rep un top 40 propi si hi ha almenys aquesta quantitat de cançons elegibles. Per sota, els artistes d'aquell territori s'integren al top 'Altres territoris'.
Dia de la setmana del tancament
dia_setmana_ranking
6 Quin dia de la setmana es congela el top oficial. Codi intern: 0 = dilluns, 6 = diumenge.

5 · Per què els tops d'abans no canvien mai

Cada top setmanal que TopQuaranta publica queda congelat amb els coeficients que el van generar. Si demà aquest equip decideix, per exemple, castigar més durament les caigudes, el top d'aquesta setmana reflectirà la nova decisió — però els tops de les setmanes anteriors romandran com estaven, amb els coeficients d'aleshores.

Així evitem una temptació que ronda qualsevol sistema de rànquings: reescriure retroactivament la història. Un top publicat és un document; no es pot retocar amb un canvi de paràmetres.

Ho garanteix el camp config_snapshot que cada registre de RankingSetmanal carrega individualment, i l'etiqueta algorithm_version que identifica la fórmula vigent en el moment del càlcul. El codi és obert al repositori del projecte.

Hi ha preguntes que aquesta pàgina no respon? Busques detalls que no hi hauria de ser? Trobes que un paràmetre no hauria de valer el que val?

Escriu-nos. TopQuaranta no es fa sol.

Torna al top Historial de canvis de l'algorisme