Scrapper site de résultats de biathlon

Pour info j’ai réussi à récupérer les RaceId grâce à Scrapy.
Il ne me reste plus qu’a coder en Python pour récupérer tout le reste.
Merci pour tous vos conseils, quand j’aurais terminé je vous mettrais le résultat :wink:

Plus simple :slight_smile:

–> https://github.com/prtkv/biathlonresults

Enjoy !

2 J'aimes

Parieur sportif ?

Non, juste en reconversion professionnelle et je souhaite développer des outils de machine learning et autres…
Vu que je débute en programmation avec Python, je préfère crée un outil qui me motive bien car je suis fan de Biathlon, mais oui j’ai pensé aux paris, mais je ne suis pas joueur, donc c’est juste pour le fun :wink:

Beaucoup plus simple c’est clair, je vais récupérer une partie du code pour extraire exactement ce que je veux et me faire ma petite base de données bien propre.

Merci pour ce message !!! Au moins j’aurais appris à utiliser Scrapy, ça peut toujours servir :wink:

De toute façon, si tu développes du machine learning pour essayer d’estimer les meilleurs paris à faire tu vas tomber … sur les mêmes côtes que les sites de paris sportif :sweat_smile: C’est justement leur business d’estimer les probabilités de victoire et de proposer des côtes légèrement sous-évaluées :slight_smile:

PS Aurélien: tu es un bigoudi Vosgien? j’adore le pseudo :slight_smile:

Oui c’est ça un Bigoudi Vosgien :wink:

ClmAubry

19h

Bigoudi88:

mais oui j’ai pensé aux paris

De toute façon, si tu développes du machine learning pour essayer d’estimer les meilleurs paris à faire tu vas tomber … sur les mêmes côtes que les sites de paris sportif :sweat_smile: C’est justement leur business d’estimer les probabilités de victoire et de proposer des côtes légèrement sous-évaluées

Oui après c’est surtout pour montrer en cas d’entretien d’embauche que j’ai des skills et que je suis motivé et que je sais bricoler + ou - de la data, avec un peu d’aide d’internet certe :wink:

1 J'aime

Sinon j’ai réussi à récupérer la data en format json (je supposes car python me dit que c’est un dictionnaire) mais maintenant il faut que je mette ça en forme base de données propre, j’ai pas besoin de toutes ces infos…

Salut,

Sur le même site, on peut voir d’autres info intéressantes mais cette fois ci pas d’api donc obliger de passer par Scrapy ou il y a plus simple ?

En gros j’aimerais récupérer les données météo le jours de la compétition, le vent et la température de l’air et de la neige ainsi que l’humidité pour toutes les courses.

Merci d’avance :wink: ci dessous l’explication avec des imprim écrans.


On choisit une course ici en le sprint d’Hochfilzen femme. Dans l’onglet ANALYSIS il faut cliquer sur le bouton vert pour que l’ensemble des données se chargent.

Ensuite on clique sur WHEATHER et un nouvel onglet s’affiche avec l’ensemble des valeurs

Hello,

Je penses que tu me conseilles de passer via une API et python qui me donne la météo en fonction du lieu et de la date ?

j’y ai pensé aussi mais cela ne semblait pas gratuit, ou c’est moi ?

Merci

L’idée est de savoir si une API propose des informations plus complètes le jour J.
En cherchant bien tu pourras trouver un service gratuit.

Ex: https://openweathermap.org/price

Je penses que ça va le faire comme ça je n’ai pas besoin que cela soit trop précis car je vais devoir faire des codes simples pour la qualité de la neige (froide - chaude - fraîche) ou le vent sur le pas de tir.

Merci pour ton retour en tout cas c’est cool :wink:

@Bigoudi88
J’ai monté un simple template pour montrer comment extraire l’info de BiathlonResults en 2 secondes

https://docs.google.com/spreadsheets/d/1kKgGMSH89UF5ImOie9xXsEVfDBXfEqqrAkD7PP3ZNYg/copy

1 J'aime

Merci @Mapi, mais j’ai déjà tout récupéré de façon simple via python et le module request.
La j’ai codé un petit programme de visualisation des données avec le module pandastable et ça fonctionne pas trop mal ça permet de faire plein de choses assez sympa. Après je ne suis pas 100% satisfait de la visualisation des données mais je cherche en ce moment à faire mieux. Car par exemple je n’arrive pas à positionner la légende où je le souhaite et la fonction pour réaliser différents graphique en même temps ne semble pas fonctionner.

En fait j’ai trouvé comment bien tout paramétrer pour visualiser les graphiques et faire tout ce que je souhaite.

C’est ici dans la documentation: https://pandastable.readthedocs.io/en/latest/dataexplore.html#pivoting-tables

Bah dis donc, tu kiffes vraiment le biathlon :smiley:

1 J'aime

Oui c’est pas faux @camillebesse, après c’est aussi pour présenter mes compétences en terme de programmation lors d’un entretien. Même si j’aurais pu choisir un sujet plus en phase avec un employeur mais je trouvais ça plus fun :wink:

1 J'aime