Google Colab : Le guide Ultime

camille · Mars 21, 2020, 1:40

cebri · Mars 21, 2020, 10:11

c’est vraiment génial colab…si vous avez le temps (en ce moment, vous devriez ) jetez un oeil à https://www.streamlit.io/. Je trouve ca encore plus fort

smougel · Avril 10, 2020, 1:35

Oui Google Colab c’est vraiment top !

Il est possible d’entraîner des réseaux de neurones avec des libs python déjà pré-installées comme : TensorFlow, Keras, Pytorch.
On peut faire de l’entraînement de modèles via CPU, GPU, TPU (Hardware spécialisé développé par Google)
Voici un petit colab que je vous partage qui vous permet de vous mettre en jambe quand à l’utilisation des réseaux de neurones :

Sébastien

ArnaudH · Avril 11, 2020, 8:39

Quel est l’intérêt de Colab vis à vis des notebooks de Kaggle ? J’ai l’impression que Kaagle est bien plus rapide.

smougel · Avril 11, 2020, 9:22

Pas beaucoup de différence en effet. Dans les 2 cas on peut utiliser le même hardware (Des GPUs, TPUs).

ArnaudH · Avril 12, 2020, 1:01

En tout cas je confirme qu’on peut faire tourner des codes avec des énormes réseaux de neurones et des tas de données très rapidement. Le faire sur un pc portable en local c’est juste impossible x)

antoineb · Avril 12, 2020, 7:17

Perso je fais tous mes réseaux avec Keras, en 4 lignes de code c’est réglé : ANN, CNN, RNN etc

Est ce qu’il y a vraiment un intérêt de coder un réseau directement avec scikit learn plutôt qu’avec Keras ?

La prochaine étape ça sera l’implémentation de réseaux directement sans code vu comme c’est parti

antoineb · Avril 13, 2020, 2:35

Salut Arnaud

C’est à dire des énormes réseaux ?
J’ai besoin de faire tourner un CNN avec 10000 images 512x512 et 32 featured map et ça me prend des heures sur mon PC🤣, je peux descendre à combien sur Colab ?

ArnaudH · Avril 13, 2020, 4:06

Aucun souci, dans des TPs j’avais fait bien pire ahah

Là tu pourrais faire 100 epochs assez rapidement je pense (1-2 min ?)

ArnaudH · Avril 13, 2020, 4:11

scikit learn c’est pas pour faire des réseaux de neurones, c’est pour faire toutes les applications classiques de machine learning (arbre de décision, régression log, k-means, SVM, XGBoost etc)

Ces méthodes marchent mieux que les NN quand tu as peu de données ou quand tu veux un algo White Box (https://www.quora.com/What-is-a-black-box-in-machine-learning)

antoineb · Avril 13, 2020, 6:00

Tu peux tout à fait faire un réseau de neurones avec scikit learn.

D’ailleurs Il me semble que @smougel n’utilise que scikit learn dans son exemple c’est pour ça que je disais ça

100 epochs en 2 minutes

Je vais tester ça !

Isakamays · Avril 21, 2020, 10:18

Serait-ce un outil à rajouter à la Toolbox ?

En tout cas je l’ai découvert au début du confinement et je trouve c’est une super alternative a Jupyter, bien que ça soit un peu lourd avec certaines librairie (notamment Selenium pour scraper les pages en JavaScript).

ScrapingExpert · Avril 22, 2020, 7:18

Pour la partie scraping, plutôt que s’embêter à avoir une stack avec deux/trois technos (Python / Selenium/ headless browser), tu peux passer sur Nodejs + Puppeteer ou Nodejs + Playwright

Isakamays · Avril 22, 2020, 9:59

Effectivement, je pense que c’est la meilleure approche, mais n’étant pas développeur de formation, je ne maîtrise pas Nodejs (et j’ai la flemme de sortir de ma zone de confort ). Mais après de nombreuses heures de recherches, j’ai bien peur de ne plus avoir le choix

EDIT: J’ai l’impression qu’on peut faire tourner du nodejs dans colab, mais cela ne diminuera pas mon nombre de techno… Pas sur que cela soit la bonne approche.

ScrapingExpert · Avril 22, 2020, 11:41

Après il faut voir comment tu structures ta démarche, et comment chaque outil est utilisé.

Par exemple, est-ce que Google Colab a pour vocation à faire du web scraping, ou plutôt à faire du data science et analyse de données?

En parlant « bête », sans trop creuser le sujet, je dirais qu’à première vue ce n’est pas le rôle de Google Colab de faire la partie scraping.

Du coup il est assez naturel d’avoir plusieurs couches, une par fonction, ça semble pas incohérent d’avoir du Python pour le Data Science et du Node pour l’extract, ou bien utiliser Python pour l’extract aussi, question de préférence personnelle je pense

system · Mars 13, 2023, 8:09

Ce sujet a été automatiquement fermé après 365 jours. Aucune réponse n’est permise dorénavant.