J’ai essayé plein de logiciels de scrapping pour récupérer l’ensemble des résultats de biathlon sur le site https://biathlonresults.com/. J’aimerais me faire une base de données pour voir les évolutions des différents athlètes et pays,etc…
Je n’arrive qu’à récupérer quelques petits trucs comme la date le lieu et le type d’épreuve mais pas le tableau des scores associé voir le fichier pdf. L’ensemble des données est sur Azure, j’ai essayé de voir si on pouvait y accéder mais a priori non ?
Quelqu’un a une idée ? Merci beaucoup d’avance pour votre aide.
J’ai essayé les différentes options mais cela ne fonctionne pas j’ai l’erreur " Error Imported Xml content can not be parsed." lorsque j’utilise les formules dans le spreadsheet.
Et en javascript @cebri cela ne fonctionne pas non plus, j’ai essayé ceci :
function getbiathlondata(RT,RaceId) {
var url = « https://biathlonresults.com/modules/sportapi/api/Results?" + RT + »&" + RaceId;
var response = UrlFetchApp.fetch(url);
var json = response.getContentText();
var data = JSON.parse(json);
return data.getbiathlondata;
}
je penses que je ne suis pas très loin de la solution, mais je n’ai pas encore trouvé
Merci pour vos pistes en tout cas !!!
Pour info j’ai réussi à récupérer les RaceId grâce à Scrapy.
Il ne me reste plus qu’a coder en Python pour récupérer tout le reste.
Merci pour tous vos conseils, quand j’aurais terminé je vous mettrais le résultat
Non, juste en reconversion professionnelle et je souhaite développer des outils de machine learning et autres…
Vu que je débute en programmation avec Python, je préfère crée un outil qui me motive bien car je suis fan de Biathlon, mais oui j’ai pensé aux paris, mais je ne suis pas joueur, donc c’est juste pour le fun
Beaucoup plus simple c’est clair, je vais récupérer une partie du code pour extraire exactement ce que je veux et me faire ma petite base de données bien propre.
Merci pour ce message !!! Au moins j’aurais appris à utiliser Scrapy, ça peut toujours servir
De toute façon, si tu développes du machine learning pour essayer d’estimer les meilleurs paris à faire tu vas tomber … sur les mêmes côtes que les sites de paris sportif C’est justement leur business d’estimer les probabilités de victoire et de proposer des côtes légèrement sous-évaluées
De toute façon, si tu développes du machine learning pour essayer d’estimer les meilleurs paris à faire tu vas tomber … sur les mêmes côtes que les sites de paris sportif C’est justement leur business d’estimer les probabilités de victoire et de proposer des côtes légèrement sous-évaluées
Oui après c’est surtout pour montrer en cas d’entretien d’embauche que j’ai des skills et que je suis motivé et que je sais bricoler + ou - de la data, avec un peu d’aide d’internet certe
Sinon j’ai réussi à récupérer la data en format json (je supposes car python me dit que c’est un dictionnaire) mais maintenant il faut que je mette ça en forme base de données propre, j’ai pas besoin de toutes ces infos…
Sur le même site, on peut voir d’autres info intéressantes mais cette fois ci pas d’api donc obliger de passer par Scrapy ou il y a plus simple ?
En gros j’aimerais récupérer les données météo le jours de la compétition, le vent et la température de l’air et de la neige ainsi que l’humidité pour toutes les courses.
Merci d’avance ci dessous l’explication avec des imprim écrans.
On choisit une course ici en le sprint d’Hochfilzen femme. Dans l’onglet ANALYSIS il faut cliquer sur le bouton vert pour que l’ensemble des données se chargent.
Ensuite on clique sur WHEATHER et un nouvel onglet s’affiche avec l’ensemble des valeurs