Bonjour,
je suis chercheur en chronobiologie et je voudrais voire si la performance en golf dépend du jetlag
mon objectif est de recuperer les statistiques présentent dans le tableau
TOURNAMENT STATISTICS
sur l’exemple de lien ci dessous
https://www.pgatour.com/players/player.47504.sam-burns.html/scorecards/r475/2022
mais aussi le nom du joueur, le nom du tournois, et la date.
et ainsi de suite pour tous les tournois de toutes les années possibles via les deux menus déroulant (et aussi éventuellement tous les joueurs mais au pire je pourrais faire le changement de joueur à la main)
bon j’ai essayé en java, python mais j’y connais rien j’ai tenté VBA et j’ai bien avancé
mais IE n’ouvre plus correctement les page (enfin dimanche oui depuis lundi non ??) et je n’ai plus accès au menu tournois et année.
j’ai éssayé rstudio pas génial, des logiciels de scrapping et pour finir
webscrapper qui fonctionnait pour une année mais qui plante lorsque on ajoute le selecteur d’année (peut être car pour certaine année il manque des datas ?)
je galère ca fait 5 jours que je suis à temps plein la dessus, j’ai même appeler PGA mais impossible d’avoir une personne direct au tel et pas de mail.
ci dessous l’export de webscrapper:
{« _id »:« golf »,« startUrl »:[« https://www.pgatour.com/players/player.47504.sam-burns.html/scorecards/r475/2022"],« selectors »:[{« id »:« tabstat »,« parentSelectors »:[« roll »],« type »:« SelectorTable »,« delay »:0,« multiple »:true,« selector »:".holder table »,« tableDataRowSelector »:« tbody tr »,« tableHeaderRowSelector »:« thead tr »,« columns »:[{« extract »:true,« header »:« ROUND 1 »,« name »:« ROUND 1 »},{« extract »:true,« header »:« ROUND 2 »,« name »:« ROUND 2 »},{« extract »:true,« header »:« ROUND 3 »,« name »:« ROUND 3 »},{« extract »:true,« header »:« ROUND 4 »,« name »:« ROUND 4 »},{« extract »:true,« header »:« TOTAL »,« name »:« TOTAL »},{« extract »:true,« header »:« RANK »,« name »:« RANK »}]},{« id »:« name »,« parentSelectors »:[« roll »],« type »:« SelectorText »,« selector »:« span.player-name »,« multiple »:false,« delay »:0,« regex »:« »},{« id »:« tour »,« parentSelectors »:[« roll »],« type »:« SelectorText »,« selector »:« h2 »,« multiple »:false,« delay »:0,« regex »:« »},{« id »:« date »,« parentSelectors »:[« roll »],« type »:« SelectorText »,« selector »:« span.date »,« multiple »:false,« delay »:0,« regex »:« »},{« id »:« roll »,« parentSelectors »:[« years »],« type »:« SelectorElementClick »,« clickElementSelector »:« div.tournament-select select option »,« clickElementUniquenessType »:« uniqueCSSSelector »,« clickType »:« clickOnce »,« delay »:500,« discardInitialElements »:« discard-when-click-element-exists »,« multiple »:true,« selector »:« body »},{« id »:« years »,« parentSelectors »:[« _root »],« type »:« SelectorElementClick »,« clickElementSelector »:« div.year-select select option »,« clickElementUniquenessType »:« uniqueCSSSelector »,« clickType »:« clickOnce »,« delay »:1000,« discardInitialElements »:« do-not-discard »,« multiple »:true,« selector »:« body »}]}

