Que valent les estimations de puissance sur Strava?

Accès directs

Intro
Puissance moyenne sur une sortie
Puissance en bosse ‘longues’
Puissance en bosse courte
Coup de cul
Plat et faux plats
Résumé et Conclusion

Intro

Depuis que j’utilise Strava (cela fait environ 2 ans), je me suis pas mal servi des estimations de puissance que fourni le site pour estimer ma progression, notamment hivernale. J’ai également utilisé les estimations de puissance pour obtenir un ordre de grandeur de ma PMA et de ses différents temps de soutient, afin d’avoir une idée de mon niveau en termes de chiffres bruts.

Pourtant, on voit souvent fleurir sur les blogs ou les forums des affirmations du genre ‘les puissances de strava c’est n’importe quoi!’. Une des premières choses que j’ai souhaité faire dès l’acquisition de mon Powertap est donc un comparatif des estimations strava par rapport à la réalité, histoire d’en avoir le cœur net.

Avant test, mon intuition (basée notamment sur les calculateurs de puissance en ligne comme awsoft),  est que les valeurs fournies par Strava sont assez proches de la réalité, avec peut être un delta d’environ +/- 15 watts.

Je parle bien sûr de puissance en bosse, celles sur le plat étant dépendantes de trop de paramètres pour être estimées avec justesse. Il faut également des durées de segment d’au moins 2 à 3 minutes  pour que ce soit significatif. En dessous il y a trop d’imprécisions liées à la nature du GPS. Par exemple Strava ne donne les longueurs de segments ou de sélection qu’à 100 mètres près.

Pour faire ce comparatif, je me suis basé sur la méthode de cet article : http://freetrispeed.com/2013/08/08/how-accurate-is-strava-is-strava-as-accurate-as-a-power-meter/ .

A l’aide de Gloden Cheetah, j’ai ainsi supprimé le champ puissance de mes sorties (et ce pendant 3 semaines pour avoir plus de recul), puis j’ai exporté le tout en GPX sur un compte Strava de test.

Je me suis enfin pesé avec mon vélo tout équipé pour avoir des chiffres les plus précis possible à donner à Strava. Total 70 kg, réparti approximativement en 59 sur le bonhomme (vêtements, casque, chaussures, pompe, portable) et 11 sur le vélo (avec sacoche de selle et 1 bidon de 750 ml). On relativisera toutefois le poids des bidons /accessoires sachant que 1 kg n’influe qu’a 3 watts près dans une bosse.

En voici les résultats…

Puissances moyennes

La puissance moyenne d’une sortie n’a peut être pas grande signification, mais ce chiffre m’a longtemps servi à 2 choses:

  • comparer les performances sur deux types de circuits différents. C’est un indicateur plus intéressant que la vitesse moyenne. Par exemple, pour mes 57kg un 27 km/h de moyenne à 180 watts de moyenne sur du vallonnée (ratio dénivelée / distance >1.5) vaudra un 32 ou 33 de moyenne sur du plat (ratio <0.5).
  • mesurer la progression autrement que via la moyenne. Je sais par exemple qu’en hiver j’avais des moyennes de circuit à 120 watts voire moins, contre 150 à 160 pour le même rythme cardiaque en pleine saison. Le ratio puissance / fréquence cardiaque donne une idée de son adaptation à l’effort ( en hiver je tournais à 0.8 contre 1.2 en pleine saison). C’est un indicateur que je m’étais inventé, mais qui existe bel et bien (appelé Efficiency Factor, mais que l’on calcule en utilisant la puissance normalisée)

Voila ce que donne ce premier comparatif, avec des sorties de tout type (fortement vallonnées, vallonnée, plat, travail par intervalles courts et longs, récup….) afin d ‘avoir un large panel:

 

On peut constater que les estimations de puissance moyennes données par Strava sur une sortie sont excellentes (+/- 5%, et un peu plus de 3% de marge d’erreur moyenne, dont deux sorties à 1 watts près!) , ce qui confirme l’article de freetrispeed. Ce résultat est vraiment étonnant, vu l’influence du vent (même très léger), du plat et des descentes (pour lesquelles Strava est souvent à côté de la plaque) sur une moyenne. J’imagine que sur une boucle, les estimations optimistes et pessimistes doivent s’annuler.

J’ai rajouté deux colonnes à ce tableau: la puissance moyennée de Strava (weighted . avg power, donnée affichée quand on roule avec capteur de puissance), et la puissance normalisée (NP, normalized power) donnée par le Garmin (ou Golden Cheetah) . C’est en théorie à peu près la même chose: une puissance moyenne pour laquelle on a gommé les portions à zéro watt et amplifié les pics de puissance, reflétant mieux l’effort fourni au cours de la sortie. La formule permettant de calculer la NP étant protégée par un copyright, j’imagine que c’est pour cette raison que Strava utilise sa propre formule.

La NP est un indice excellent pour jauger sa performance sur une sortie vallonnée (et à fortiori montagneuse). C’est un peu le truc qui me gênait avec la puissance brute affichée par Strava, car il me sortait toujours des puissances pourries sur des belles sorties rythmées en bosse. Exemple avec la sortie en bosse du 10 juillet à seulement 150 watts Strava, contre près de 200 en normalisé.

Il serait intéressant que Strava fournisse une estimation de la NP pour ceux roulant sans capteurs.

Puissance sur segments

Vue la quantité de données que j’ai extrait de mes sorties, et pour plus de cohérence, j’ai regroupé le tout en plusieurs catégories que voici. En plus des comparatifs PT / Strava, j’ai rajouté une colonne pour Awsoft (http://www.awsoft.net/cyclo/calculs/montee.htm), calculateur de puissance en ligne notamment utilisé par Alban pour calibrer ses tests de matériel.

Bosses ‘longues’

Vivant dans une région simplement vallonnée, je considère une bosse comme longue dès 3km. Je n’ai pas plus long que 5 ou 6 km à ma disposition (ou alors avec des pourcentages trop faibles et/ou trop de replats).

Voici mes résultats:

Encore une fois, Strava s’en tire plus que bien, en restant environ à -5% d’erreur (3.7% en moyenne). On notera bien le ‘moins’, car pour ce premier jet, Strava est toujours pessimiste sur le calcul des puissances. Cela peut s’expliquer par différents éléments (état de la route, frottements…) qui sont toujours un peu plus défavorables dans le monde réel que sur une équation de base. Le pourcentage d’erreur est constant hormis sur les deux dernières bosses (la même, grimpée deux fois au cours de la même sortie) : peut être une histoire de vent?

On notera également le bon comportement du calculateur Awsoft, qui tombe juste sur les deux premières bosses (!), mais qui ne fait globalement pas mieux que Strava sur le reste.

Bosse courtes

Il s’agit de la grande majorité des bosses de mon coin, de longueurs de 1 à 2 km présentant des pourcentages moyens de 4 à 6%.

 Les résultats restent aussi bon sur de tels segments: mis à part 2 anomalies (-8.6% et -6.2%) et deux résultats positifs (:o), on est comme précédemment dans un pourcentage d’erreur de -5 % (et 3.3% d’erreur moyenne). Sachant qu’un bidon vide ou plein va influer à +/- 3 watts, soit de 1 à 1.5% pour les puissances données ci dessus.

Concernant Awsoft, il s’en sort pas mal également, sachant que l’on ne peut obtenir de précision inférieure à 100 mètres sur Strava. Il est donc impossible de donner à un calculateur externe des données suffisamment précises pour ce type de longueur de segment (soit 5 à 10% d’erreur pour les longueurs de ce tableau).

Une piste à creuser serait de passer via Veloviewer, qui semble afficher des longueurs au mètre près (!), en allant dans l’onglet segments de sa sortie, puis en cliquant sur la ligne du segment (sans avoir à cliquer sur le lien du segment). A voir si cette précision est envoyée par l’API de Strava ou bien est ‘inventée’ par Veloviewer :)

Coups de cul

Rentrent dans cette catégorie les mini bosses de moins d’un kilomètre qui se passent en puissance. Pour les raisons évoquées plus haut, je n’ai pas fait apparaître les calculs de Awsoft.

Voila, cette fois on touche aux limites des estimations de puissances en bosse! Les marges d’erreurs sont inconstantes, avec une bonne moitié des mesures toujours sous les 5%, mais le restant se situant entre 8 et 13% autant en positif qu’en négatif, ce qui est nouveau. Alors certes, on peut considérer que ce sont des marges inacceptables, mais sur de telles longueurs et vue les précisions des GPS je trouve que ça reste ‘potable’.

Globalement on est à moins de 7% d’erreur, soit environ le double que pour les 2 types de segments précédents.

Avec une vingtaine de watts d’écart en valeur absolue l’ordre de grandeur est respecté: je n’ai pas des puissances doublées par rapport à la réalité!

Plat et faux plat

On entre ici dans la dernière catégorie de segments, ceux pour lesquels l’influence du vent et de l’aérodynamisme jouent un rôle prépondérant, rendant en principe erronées les estimations de puissance, sauf à avoir un coup de bol. Mais pour le fun, voyons comment s’en sort Strava.

faux plats montants, descendants et plats

Cette fois on a un peu de tout, et effectivement pas mal de n’importe quoi avec un record à 28% d’erreur! Mais la moitié des segments restent encore dans la marge des +/- 5% d’erreur.

La marge globale d’erreur de ces segments est à un peu moins de 9% en valeur absolue, mais avec de telles fluctuations il est n’est guère possible d’exploiter ces valeurs.

Résumé et conclusions

On peut dire que Strava estime sans problème la puissance moyenne (non normalisée) d’une sortie, avec une marge d’erreur de +/- 5% au maximum. On parle de sorties en boucle, car il est évident que dans le cas contraire le vent aura un rôle non négligeable. Sur mes sorties, j’obtiens une erreur moyenne de 3.7%.

Il est est de même pour les segments montants d’une longueur supérieure à 1 km. Mis à part deux anomalies (8.6% pour la plus importante, sur 1 km, donc à la limite de la classification ‘coup de cul’), on reste à -5% d’erreur, et une moyenne globale pour mes segments testés de -3.3%.

Concernant les coups de cul (segment montant de moins d’un kilomètre),  si l’on reste sous une moyenne globale de 7% d’erreur et avec la moitié des segments toujours sous les 5%, on commence à noter quelques erreurs relativement grossières (entre 8 et 13%).

Pas de miracle pour les segments plats ou en faux plats: de grosses disparités dans les mesures, avec un record à 28% d’erreur. Le pourcentage d’erreur moyen reste assez flatteur (9%), mais cache de grosses aberrations.

Alors oui, Strava peut tout à faire servir à estimer la puissance développé à vélo, dans des conditions ‘normales’. Comme le dit le gars de freetrispeed, cela donne au moins une bonne idée de ce qu’est un effort à 200 watts par rapport à un effort à 300 watts.

Il faut rappeler que pour des puissances de l’ordre de 200 à 300 watts, un bidon plein ou vide (ou un repas plus ou moins léger, ou une pause pipi ;) ) va influer de 1 à 1.5%. Il faut rappeler aussi que la précision d’un Powertap est annoncée de +/- 1.5 à 2%).

Après il est évident que tenter un segment avec vent plein dos (ou plein face) ou dans la roue d’un coureur donnera des résultats faussés. Je vois encore trop souvent des gars descendre Strava pour avoir vu des puissances hors normes sur un segment fait en course au chaud dans un peloton, ou s’étonner de faire une bosse à la même vitesse qu’un autre gars avec 100 watts d’écart sans connaître le poids du gars en question…

2 Comments

Répondre à Pascal Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *